一款超强 OCR 神器!它叫做 Surya,一款开源的 OCR 工具,性能炸裂,更新了 表格识别功能,它不仅能识别表格的行、列、单元格,还能识别旋转的表格和复杂的布局,而且支持 90 多种语言,简直无敌。Surya 它通过先进的架构,尤其是在表格识别方面,性能优于当前的 SoTA 开源模型 Table Transformer。目前 GitHub 上收藏人数超过 1 万(10K),不仅免费开源,还能应用于商业场景。
核心功能
1、表格识别 Surya 的新版本特别强化了 表格识别,能清晰地识别出表格中的行、列和单元格,同时还能识别出具体的字符内容。这个功能对于需要处理大量表格数据的同学来说无疑是一大福音。
2、复杂布局识别它不仅限于表格,还可以识别文档中的复杂布局,比如标题、图片,甚至是旋转的表格。这意味着无论你的文档是多复杂,Surya 都能准确提取出你需要的信息。
3、支持 90 多种语言支持全球超过 90 种语言的 OCR 识别,包括中文、日文、韩文、阿拉伯文等。这个多语言支持,使它能够轻松应对各种不同语言的文档,无论是国际业务的文件处理,还是本地化项目的内容转换,Surya 都能游刃有余。
4、高效的文本识别与阅读顺序确定除了表格,Surya 还擅长文本的行级检测,并能正确识别文本的阅读顺序,避免文档信息混乱,确保文本内容能够按正确的顺序输出。
5、本地运行和 API 支持 Surya 还有一个亮点是它能够在本地运行,方便开发者离线处理敏感信息,或者大规模处理文档。同时,Surya 还提供了 API 接口,开发者可以很轻松地将其集成到自己的应用中,进行批量自动化处理。
GitHub 地址:https://github.com/VikParuchuri/surya