揭秘！256M參數多模態OCR神器助你瞬間獲取文檔信息

SmolDocling：輕量級全能型文檔 OCR 模型#

當前主流 OCR 系統通常都需要 1B + 參數的大模型計算，近期剛好在抱抱臉上發現一款僅 256M 參數的輕量級全能型文檔 OCR 模型工具。

SmolDocling OCR 模型特點#

輕量級與高速
- 256M 小型參數，可在 CPU / 低配 GPU 上運行，無需高端計算資源。
- OCR 速度快，每頁僅需 0.35 秒，適用於批量處理。
核心能力
1. 全文檔 OCR 解析
  - 智能識別標題、正文、列表、表格、圖表、代碼、公式等內容。
  - 適用於學術論文、商業文檔、專利、報告、手寫文檔等多種文檔類型。
2. 多樣化元素識別
  - 佈局識別、代碼識別、公式識別、圖表與表格、圖形分類等。
3. 靈活的輸出格式
  - 支持導出為 Markdown、HTML、JSON 等多種格式。
4. 批量處理支持
  - 可一次性處理多個文檔，適合大規模數據轉換。

快速使用#

要想使用這個最新的 SmolDocling，有兩種方法：

在線 Demo：官方在 HuggingFace 上部署了 SmolDocling-256M-preview 的 Demo，可直接體驗其強大的功能。
- Demo 地址

SmolDocling 是一款輕量級、超快、可全文檔解析的多模態 OCR 模型，比傳統 OCR 更精準、更高效，適用於論文解析、合同分析、數據提取、知識庫構建等任務。不僅支持完整文檔 OCR，包括表格、代碼、公式、圖表，處理速度也超快，每頁僅需 0.35 秒，還可導出多種格式，適合許多不同需求的人群。

如果你正在尋找一款快速、高效的 OCR 工具，SmolDocling 絕對值得一試！

模型地址：SmolDocling-256M-preview