DeepSeek鬼才创举,OCR是啥?腾讯是怎么做的?
Source :
mp.weixin.qq.com
DeepSeek最新发布了一个参数 3B规模的视觉压缩OCR模型,论文《DeepSeek-OCR: Contexts Optical Compression》,提出利用视觉模态压缩长文本上下文的新方法。
该模型由DeepEncoder与DeepSeek3B-MoE组成,可将文本信息映射为二维图像并高效解码,实现10倍压缩下97%识别精度,20倍压缩仍保持约60%。
但很多同学其实并不了解,OCR技术到底是什么。本文将从这个 3B模型的发布入手,为你一步步揭开OCR的神秘面纱。
View
17
Technology
lddgo
Shared on
2025-10-23