banner
andrewji8

Being towards death

Heed not to the tree-rustling and leaf-lashing rain, Why not stroll along, whistle and sing under its rein. Lighter and better suited than horses are straw sandals and a bamboo staff, Who's afraid? A palm-leaf plaited cape provides enough to misty weather in life sustain. A thorny spring breeze sobers up the spirit, I feel a slight chill, The setting sun over the mountain offers greetings still. Looking back over the bleak passage survived, The return in time Shall not be affected by windswept rain or shine.
telegram
twitter
github

10K Star 強烈種草!超強開源OCR工具:Surya!表識別功能太強了!支持90+語言識別!

一款超強 OCR 神器!它叫做 Surya,一款開源的 OCR 工具,性能炸裂,更新了 表格識別功能,它不僅能識別表格的行、列、單元格,還能識別旋轉的表格和複雜的佈局,而且支持 90 多種語言,簡直無敵。Surya 它通過先進的架構,尤其是在表格識別方面,性能優於當前的 SoTA 開源模型 Table Transformer。目前 GitHub 上收藏人數超過 1 萬(10K),不僅免費開源,還能應用於商業場景。

image
核心功能
1、表格識別 Surya 的新版本特別強化了 表格識別,能清晰地識別出表格中的行、列和單元格,同時還能識別出具體的字符內容。這個功能對於需要處理大量表格數據的同學來說無疑是一大福音。

2、複雜佈局識別它不僅限於表格,還可以識別文檔中的複雜佈局,比如標題、圖片,甚至是旋轉的表格。這意味著無論你的文檔是多複雜,Surya 都能準確提取出你需要的信息。

3、支持 90 多種語言支持全球超過 90 種語言的 OCR 識別,包括中文、日文、韓文、阿拉伯文等。這個多語言支持,使它能夠輕鬆應對各種不同語言的文檔,無論是國際業務的文件處理,還是本地化項目的內容轉換,Surya 都能游刃有餘。

4、高效的文本識別與閱讀順序確定除了表格,Surya 還擅長文本的行級檢測,並能正確識別文本的閱讀順序,避免文檔信息混亂,確保文本內容能夠按正確的順序輸出。

5、本地運行和 API 支持 Surya 還有一個亮點是它能夠在本地運行,方便開發者離線處理敏感信息,或者大規模處理文檔。同時,Surya 還提供了 API 接口,開發者可以很輕鬆地將其集成到自己的應用中,進行批量自動化處理。

GitHub 地址:https://github.com/VikParuchuri/surya

載入中......
此文章數據所有權由區塊鏈加密技術和智能合約保障僅歸創作者所有。