开源且强大的文档 OCR 工具
#github# #互联网# #软件#
专注于文档图像的处理和分析,能够准确的逐行文本检测和识别,并且支持任何语言。
GitHub - VikParuchuri/surya: OCR, layout analysis,...
- 支持 90+ 种多语言,包括中文、英文、日语、阿拉伯语等;
- 支持任何语言的行级文本检测,准确识别文档中的每一行文字;
- 支持文档布局分析,包括表格、图像、标题等;
- 支持复杂排版阅读顺序检测,如左右两列,它能知道先读哪里,再读哪里;
- 支持精确识别表格中的行与列内容。
