开云app官方 “鲸鱼开眼”？DeepSeek灰度上线“识图步地”

发布日期：2026-05-02 23:02 点击次数：162

文丨晓静

剪辑｜徐青阳

" Soon， we see you. "

DeepSeek 多模态团队负责东谈主陈小康在 X 平台发出这么一句话。配图中，DeepSeek 记号性的蓝色鲸鱼，一只眼睛被玄色眼罩蒙住，另一只摘下了眼罩。

4 月 29 日，DeepSeek 正在网页端和 App 端灰度测试"识图步地"，与"快速步地""大家步地"并排，用户插足后可上传图片，并让 DeepSeek 对图片本体进行统一、形容和分析。部分用户曾经不错往常使用，另一些用户示意固然能看到进口，但会收到"识图步地暂不成用，请稍后再试"的提醒。

但更准确地说，此次灰度上线的是多模态统一才能，而不是齐全真义上的多模态生成才能。所谓"多模态"，并不一定意味着同期具备识图、生图、语音、视频等一皆才能。惟有模子无意处理不啻一种输入模态，举例文本与图片，就不错被称为多模态才能。

但从腾讯科技体验来看，DeepSeek 此次绽开的主如果图片统一，也等于"看图、读图、分析图"，尚未看到图像生成、视频统一或跨模态生成才能上线。

Deepseek 识图才能测试

实测 Deepseek 还不具备图片生成才能

从居品界面看，"识图步地"并不是简短附加在输入框中的图片上传功能，而是被放在与"快速步地""大家步地"统一级的居品进口中。用户插足后，页面会露馅"使用识图步地初始对话"，输入框旁也出现图片上传按钮。这评释 DeepSeek 正在将视觉统一四肢一个孤独步地进行灰度，开云app官方在线并不是仅四肢文本模子的缓助功能。

但现阶段，"识图步地"的居品定位更接近视觉问答、图片统一和截图分析，而非肖似文生图、图生图的视频或图像生成器具。

事实上，DeepSeek 并不是第一次作念多模态。

早在 2024 年，DeepSeek 就发布过 DeepSeek-VL 系列模子，主打着实宇宙视觉话语统一，隐匿图表、网页、公式、科学文件、当然图片等场景。而后，DeepSeek 又推出过 Janus 系列，尝试将多模态统一和视觉生成放在统一框架下；Janus-Pro 曾经被视为 DeepSeek 在图像生成场所的一次困难尝试。此外，DeepSeek 还发布过 DeepSeek-OCR，强调从谎言语模子角度重新统一视觉编码器的作用，面向文档、截图和结构化信息识别。

从时代旅途看，"识图"每每不是简短 OCR。OCR 主要管制的是图片中笔墨的识别，比如截图、单据、文档和表格；视觉话语模子则要进一步统一图片本体，包括物体关系、图表含义、页面结构、场景形容和用户意图。

关于 DeepSeek 此次灰度的"识图步地"而言，底层看起来可能更像是联结 OCR 与文本推理模子完成图片分析。

但现在，DeepSeek 官方尚未败露"识图步地"的底层模子称呼、参数界限、历练神志和绽开策画。DeepSeek API 文档现在仍主要露馅 V4 Preview、V4-Pro、V4-Flash、1M 高下文和器具调用等才能，并未出现 Vision、Image Input 或识图联系接口。这意味着，至少在 API 层面，DeepSeek 多模态才能尚未认真绽开。

但这一步对 DeepSeek 仍然困难。以前一年开云app官方，DeepSeek 的中枢标签主要筹商在推理才能、开源、低老本和长高下文。不管是 R1 如故 V4 Preview，DeepSeek 更高出的都是文本推理和 Agent 场景才能。"识图步地"的出现，意味着 DeepSeek 可能行将在多模态才能上发力。

幸运彩app官方网站下载

上一篇：开云app “五一”小长假，安全别休假！带娃出游健康领导请收好

下一篇：开云app官方在线入口新录取作风写照

热点资讯

推荐资讯

让建站和SEO变得简单