banner
andrewji8

Being towards death

Heed not to the tree-rustling and leaf-lashing rain, Why not stroll along, whistle and sing under its rein. Lighter and better suited than horses are straw sandals and a bamboo staff, Who's afraid? A palm-leaf plaited cape provides enough to misty weather in life sustain. A thorny spring breeze sobers up the spirit, I feel a slight chill, The setting sun over the mountain offers greetings still. Looking back over the bleak passage survived, The return in time Shall not be affected by windswept rain or shine.
telegram
twitter
github

揭秘!256M參數多模態OCR神器助你瞬間獲取文檔信息

SmolDocling:輕量級全能型文檔 OCR 模型#

當前主流 OCR 系統通常都需要 1B + 參數的大模型計算,近期剛好在抱抱臉上發現一款僅 256M 參數的輕量級全能型文檔 OCR 模型工具。

image

SmolDocling OCR 模型特點#

  • 輕量級與高速

    • 256M 小型參數,可在 CPU / 低配 GPU 上運行,無需高端計算資源。
    • OCR 速度快,每頁僅需 0.35 秒,適用於批量處理。
  • 核心能力

    1. 全文檔 OCR 解析
      • 智能識別標題、正文、列表、表格、圖表、代碼、公式等內容。
      • 適用於學術論文、商業文檔、專利、報告、手寫文檔等多種文檔類型。
    2. 多樣化元素識別
      • 佈局識別、代碼識別、公式識別、圖表與表格、圖形分類等。
    3. 靈活的輸出格式
      • 支持導出為 Markdown、HTML、JSON 等多種格式。
    4. 批量處理支持
      • 可一次性處理多個文檔,適合大規模數據轉換。

快速使用#

要想使用這個最新的 SmolDocling,有兩種方法:

  • 在線 Demo:官方在 HuggingFace 上部署了 SmolDocling-256M-preview 的 Demo,可直接體驗其強大的功能。

SmolDocling 是一款輕量級、超快、可全文檔解析的多模態 OCR 模型,比傳統 OCR 更精準、更高效,適用於論文解析、合同分析、數據提取、知識庫構建等任務。不僅支持完整文檔 OCR,包括表格、代碼、公式、圖表,處理速度也超快,每頁僅需 0.35 秒,還可導出多種格式,適合許多不同需求的人群。

如果你正在尋找一款快速、高效的 OCR 工具,SmolDocling 絕對值得一試!

載入中......
此文章數據所有權由區塊鏈加密技術和智能合約保障僅歸創作者所有。