一款超強 OCR 神器!它叫做 Surya,一款開源的 OCR 工具,性能炸裂,更新了 表格識別功能,它不僅能識別表格的行、列、單元格,還能識別旋轉的表格和複雜的佈局,而且支持 90 多種語言,簡直無敵。Surya 它通過先進的架構,尤其是在表格識別方面,性能優於當前的 SoTA 開源模型 Table Transformer。目前 GitHub 上收藏人數超過 1 萬(10K),不僅免費開源,還能應用於商業場景。
核心功能
1、表格識別 Surya 的新版本特別強化了 表格識別,能清晰地識別出表格中的行、列和單元格,同時還能識別出具體的字符內容。這個功能對於需要處理大量表格數據的同學來說無疑是一大福音。
2、複雜佈局識別它不僅限於表格,還可以識別文檔中的複雜佈局,比如標題、圖片,甚至是旋轉的表格。這意味著無論你的文檔是多複雜,Surya 都能準確提取出你需要的信息。
3、支持 90 多種語言支持全球超過 90 種語言的 OCR 識別,包括中文、日文、韓文、阿拉伯文等。這個多語言支持,使它能夠輕鬆應對各種不同語言的文檔,無論是國際業務的文件處理,還是本地化項目的內容轉換,Surya 都能游刃有餘。
4、高效的文本識別與閱讀順序確定除了表格,Surya 還擅長文本的行級檢測,並能正確識別文本的閱讀順序,避免文檔信息混亂,確保文本內容能夠按正確的順序輸出。
5、本地運行和 API 支持 Surya 還有一個亮點是它能夠在本地運行,方便開發者離線處理敏感信息,或者大規模處理文檔。同時,Surya 還提供了 API 接口,開發者可以很輕鬆地將其集成到自己的應用中,進行批量自動化處理。
GitHub 地址:https://github.com/VikParuchuri/surya