开源且强大的文档 OCR 工具

admin

开源且强大的文档 OCR 工具
#github# #互联网# #软件#

专注于文档图像的处理和分析，能够准确的逐行文本检测和识别，并且支持任何语言。

GitHub - VikParuchuri/surya: OCR, layout analysis,...

支持 90+ 种多语言，包括中文、英文、日语、阿拉伯语等；
支持任何语言的行级文本检测，准确识别文档中的每一行文字；
支持文档布局分析，包括表格、图像、标题等；
支持复杂排版阅读顺序检测，如左右两列，它能知道先读哪里，再读哪里；
支持精确识别表格中的行与列内容。