什么是印刷文字识别
印刷文字识别(OCR,Optical Character Recognition)是一种技术,能够检测图片中的打印字符,并将其转换为可编辑的文本格式,最后以JSON格式返回识别结果。
OCR服务以开放API的方式提供给用户,用户可以使用编程语言如Python和Java调用OCR服务API,将图片转换为文字,进而实现自动化关键数据的采集,提升业务效率。API详情请参考《API参考》。
使用前必读
在使用OCR服务前,用户需具备编程和语言熟练程度,如Java、Python。
OCR服务通过API接口,将图片中的文字识别成可编辑文本,并以JSON格式返回识别结果。用户需编码将识别结果与业务系统进行对接,或将结果保存为TXT、Excel等格式。
OCR服务面向企业用户,提供以下能力
- 通用型的OCR
通用型OCR支持网络图片上文字的自动化识别,以实现图片文字的提取。
- 证件类的OCR
证件类OCR支持身份证、营业执照等证件图片上有效信息的自动识别和关键字段结构化提取。
- 行业类的OCR
行业类OCR支持多种行业特定图片的结构化信息提取和识别,如车牌等,进一步帮助企业实现自动化效率提升。