TODAY · 今日 AI

DeepSeek 推出獨立視覺模型,OCR、HTML 重建都行

DeepSeek 上線新的「識圖模式」,看起來不是把視覺模組塞進 V4,而是另一套獨立多模態模型。能力涵蓋 OCR 加 Markdown 排版、從網頁截圖反推 HTML、空間推理、找碴與圖樣辨識。非思考模式回應極快但細節容易出錯;開思考模式準確度上來但要等 4 分鐘以上。比 V4 技術報告所提的「未來目標」早很多就上線。對讀者意義:DeepSeek 推進速度比外界預期快,中文圈閉源、開源、端側多模態都有更多選擇。

發佈日期: 2026-05-03

登入以收藏

來源

量子位:DeepSeek 识图模式一手实测zh-CN

標籤

deepseekmultimodalocrvisionopen-source