Нова модель «OCR» від @deepseek_ai представляє стратегію стиснення, засновану на баченні, яка може змінити наше уявлення про обробку документів. У нашій останній статті @tuanacelik і @LoganMarkewich глибоко занурюємося в те, що являє собою ця нова модель, і що вона означає для майбутніх методів парсингу та LlamaParse👇 🔬 DeepSeek-OCR стискає 1 000 текстових токенів до лише 100 токенів зору з точністю 97% - це 10-кратне стиснення, зберігаючи якість ❗ 1 000 токенів стисненого тексту – це все ще досить мало в порівнянні з сучасними контекстними вікнами LLM 🤖 Майбутнє, ймовірно, поєднує сучасний парсинг LLM зі стисненням контексту, як DeepSeek-OCR Читайте наш повний текст: