SmolDocling:輕量級全能型文檔 OCR 模型#
當前主流 OCR 系統通常都需要 1B + 參數的大模型計算,近期剛好在抱抱臉上發現一款僅 256M 參數的輕量級全能型文檔 OCR 模型工具。
SmolDocling OCR 模型特點#
-
輕量級與高速
- 256M 小型參數,可在 CPU / 低配 GPU 上運行,無需高端計算資源。
- OCR 速度快,每頁僅需 0.35 秒,適用於批量處理。
-
核心能力
- 全文檔 OCR 解析
- 智能識別標題、正文、列表、表格、圖表、代碼、公式等內容。
- 適用於學術論文、商業文檔、專利、報告、手寫文檔等多種文檔類型。
- 多樣化元素識別
- 佈局識別、代碼識別、公式識別、圖表與表格、圖形分類等。
- 靈活的輸出格式
- 支持導出為 Markdown、HTML、JSON 等多種格式。
- 批量處理支持
- 可一次性處理多個文檔,適合大規模數據轉換。
- 全文檔 OCR 解析
快速使用#
要想使用這個最新的 SmolDocling,有兩種方法:
- 在線 Demo:官方在 HuggingFace 上部署了 SmolDocling-256M-preview 的 Demo,可直接體驗其強大的功能。
SmolDocling 是一款輕量級、超快、可全文檔解析的多模態 OCR 模型,比傳統 OCR 更精準、更高效,適用於論文解析、合同分析、數據提取、知識庫構建等任務。不僅支持完整文檔 OCR,包括表格、代碼、公式、圖表,處理速度也超快,每頁僅需 0.35 秒,還可導出多種格式,適合許多不同需求的人群。
如果你正在尋找一款快速、高效的 OCR 工具,SmolDocling 絕對值得一試!