@deepseek_ai 的新 "OCR" 模型代表了一种基于视觉的压缩策略,这可能会改变我们对文档处理的看法。在我们最新的文章中,@tuanacelik 和 @LoganMarkewich 深入探讨了这个新模型是什么,以及它对未来解析技术和 LlamaParse 的意义👇 🔬 DeepSeek-OCR 将 1,000 个文本标记压缩到仅 100 个视觉标记,准确率达到 97% - 这意味着在保持质量的同时实现了 10 倍的压缩 ❗ 1,000 个压缩的文本标记与现代 LLM 上下文窗口相比仍然相当小 🤖 未来可能将今天的现代 LLM 解析与像 DeepSeek-OCR 这样的上下文压缩结合起来 阅读我们的完整观点: