一款超強 OCR 神器!它叫做 Surya,一款オープンソースの OCR ツール、性能炸裂、更新された 表格識別機能、これは行、列、セルを認識するだけでなく、回転した表や複雑なレイアウトも認識でき、90 以上の言語をサポートしており、まさに無敵です。Surya は先進的なアーキテクチャを通じて、特に表格識別において、現在の SoTA オープンソースモデル Table Transformer よりも性能が優れています。現在、GitHub でのコレクション数は 1 万人(10K)を超え、無料でオープンソースであり、商業シーンにも応用できます。
核心機能
1、表格識別 Surya の新バージョンは特に表格識別を強化し、表の行、列、セルを明確に識別できるだけでなく、具体的な文字内容も認識できます。この機能は大量の表データを処理する必要がある方にとって、間違いなく大きな福音です。
2、複雑なレイアウト識別これは表に限らず、文書内の複雑なレイアウト、例えばタイトル、画像、さらには回転した表も認識できます。これは、あなたの文書がどれほど複雑であっても、Surya が必要な情報を正確に抽出できることを意味します。
3、90 以上の言語をサポート世界中の 90 以上の言語の OCR 識別をサポートしており、中国語、日本語、韓国語、アラビア語などが含まれています。この多言語サポートにより、国際ビジネスの文書処理やローカライズプロジェクトのコンテンツ変換など、さまざまな異なる言語の文書に簡単に対応できます。
4、高効率のテキスト識別と読み取り順序の確定表に加えて、Surya はテキストの行レベルの検出にも優れており、テキストの読み取り順序を正しく識別でき、文書情報の混乱を避け、テキスト内容を正しい順序で出力できるようにします。
5、ローカル実行と API サポート Surya のもう一つの特徴は、ローカルで実行できることで、開発者がオフラインで敏感な情報を処理したり、大規模に文書を処理したりするのに便利です。また、Surya は API インターフェースも提供しており、開発者は簡単に自分のアプリに統合してバッチ自動化処理を行うことができます。
GitHub アドレス:https://github.com/VikParuchuri/surya