TODAY · 今日 AI

DeepSeek 推出独立视觉模型,OCR、HTML 重建都行

DeepSeek 上线新的「识图模式」,看起来不是把视觉模组塞进 V4,而是另一套独立多模态模型。能力涵盖 OCR 加 Markdown 排版、从网页截图反推 HTML、空间推理、找茬与图样识别。非思考模式响应极快但细节容易出错;开思考模式准确度上来但要等 4 分钟以上。比 V4 技术报告所提的「未来目标」早很多就上线。对读者意义:DeepSeek 推进速度比外界预期快,中文圈闭源、开源、端侧多模态都有更多选择。

发布日期: 2026-05-03

登入以收藏

来源

量子位:DeepSeek 识图模式一手实测zh-CN

标签

deepseekmultimodalocrvisionopen-source