Le nouveau modèle "OCR" de @deepseek_ai représente une stratégie de compression basée sur la vision qui pourrait changer notre façon de penser le traitement des documents. Dans notre dernier article, @tuanacelik et @LoganMarkewich plongent en profondeur dans ce qu'est ce nouveau modèle et ce que cela signifie pour les techniques de parsing futures et LlamaParse👇 🔬 DeepSeek-OCR compresse 1 000 tokens de texte en seulement 100 tokens de vision avec 97 % de précision - c'est une compression de 10x tout en maintenant la qualité ❗ 1 000 tokens de texte compressés restent assez petits par rapport aux fenêtres de contexte des LLM modernes 🤖 L'avenir combine probablement le parsing des LLM modernes d'aujourd'hui avec une compression de contexte comme DeepSeek-OCR Lisez notre analyse complète :