DeepSeek鬼才创举，OCR是啥？腾讯是怎么做的？

Source : mp.weixin.qq.com

DeepSeek最新发布了一个参数 3B规模的视觉压缩OCR模型，论文《DeepSeek-OCR: Contexts Optical Compression》，提出利用视觉模态压缩长文本上下文的新方法。该模型由DeepEncoder与DeepSeek3B-MoE组成，可将文本信息映射为二维图像并高效解码，实现10倍压缩下97%识别精度，20倍压缩仍保持约60%。但很多同学其实并不了解，OCR技术到底是什么。本文将从这个 3B模型的发布入手，为你一步步揭开OCR的神秘面纱。