主要是要求图片的质量高(分辨率高,不倾斜)可以是jpg、tif、bmp等格式但图片中的公式、徽标中的文字、流程图之类是不能正确识别的,在识别时OCR要进行版面分析,用户需要自己将不能识别的部分修改成图形对象