banner
andrewji8

Being towards death

Heed not to the tree-rustling and leaf-lashing rain, Why not stroll along, whistle and sing under its rein. Lighter and better suited than horses are straw sandals and a bamboo staff, Who's afraid? A palm-leaf plaited cape provides enough to misty weather in life sustain. A thorny spring breeze sobers up the spirit, I feel a slight chill, The setting sun over the mountain offers greetings still. Looking back over the bleak passage survived, The return in time Shall not be affected by windswept rain or shine.
telegram
twitter
github

10K Star 强烈种草!超强开源OCR工具:Surya!表识别功能太强了!支持90+语言识别!

一款超强 OCR 神器!它叫做 Surya,一款开源的 OCR 工具,性能炸裂,更新了 表格识别功能,它不仅能识别表格的行、列、单元格,还能识别旋转的表格和复杂的布局,而且支持 90 多种语言,简直无敌。Surya 它通过先进的架构,尤其是在表格识别方面,性能优于当前的 SoTA 开源模型 Table Transformer。目前 GitHub 上收藏人数超过 1 万(10K),不仅免费开源,还能应用于商业场景。

image
核心功能
1、表格识别 Surya 的新版本特别强化了 表格识别,能清晰地识别出表格中的行、列和单元格,同时还能识别出具体的字符内容。这个功能对于需要处理大量表格数据的同学来说无疑是一大福音。

2、复杂布局识别它不仅限于表格,还可以识别文档中的复杂布局,比如标题、图片,甚至是旋转的表格。这意味着无论你的文档是多复杂,Surya 都能准确提取出你需要的信息。

3、支持 90 多种语言支持全球超过 90 种语言的 OCR 识别,包括中文、日文、韩文、阿拉伯文等。这个多语言支持,使它能够轻松应对各种不同语言的文档,无论是国际业务的文件处理,还是本地化项目的内容转换,Surya 都能游刃有余。

4、高效的文本识别与阅读顺序确定除了表格,Surya 还擅长文本的行级检测,并能正确识别文本的阅读顺序,避免文档信息混乱,确保文本内容能够按正确的顺序输出。

5、本地运行和 API 支持 Surya 还有一个亮点是它能够在本地运行,方便开发者离线处理敏感信息,或者大规模处理文档。同时,Surya 还提供了 API 接口,开发者可以很轻松地将其集成到自己的应用中,进行批量自动化处理。

GitHub 地址:https://github.com/VikParuchuri/surya

加载中...
此文章数据所有权由区块链加密技术和智能合约保障仅归创作者所有。