好客搜企业信息咨询网。企业实用的知识常识!

最新更新文章排行

好客搜资讯网站

当前位置: 首页 > 科技

DeepSeek推OCR新模型 实现类人化场景语义理解突破

时间:2026-01-28人气: 作者: 小鱼
1月28日,AI企业DeepSeek正式发布新一代OCR大模型——DeepSeek-OCR 2,该模型突破传统文字识别技术的机械局限,迈入语义理解新阶段,标志着OCR技术从“识别文字”向“理解内容”实现跨越式升级。
传统OCR技术依赖固定扫描顺序(如从左到右、从上到下),面对含表格、插图、多栏文本及手写批注的复杂文档时,常出现识别混乱、逻辑断裂等问题。而DeepSeek-OCR 2搭载自主研发的DeepEncoder V2架构,赋予模型对图像整体结构与语义关系的深层感知能力,可像人类一样先识别关键区域、判断图文逻辑,再动态规划阅读路径。
实测数据显示,该模型在真实场景下的布局解析精度、跨区域语义对齐能力及长程推理表现,全面超越主流视觉-语言融合模型。在包含多元素的复杂文档处理中,其识别准确率较前代模型提升30%以上,能自主判断信息优先级与空间关联性,有效解决传统OCR在复杂场景下的应用痛点。
DeepSeek技术负责人表示,DeepSeek-OCR 2的推出,将为金融、法律、政务、教育等行业提供更高效的文档处理解决方案,尤其适用于合同审核、古籍数字化、多语种复杂文档处理等场景。未来,团队将持续优化模型性能,拓展在移动端、边缘设备的轻量化部署能力,推动OCR技术深度融入千行百业的数字化转型进程。