Den nye «OCR»-modellen fra @deepseek_ai representerer en visjonsbasert komprimeringsstrategi som kan endre hvordan vi tenker på dokumentbehandling. I vår siste artikkel gjør @tuanacelik og @LoganMarkewich et dypdykk i hva denne nye modellen er, og hva den betyr for fremtidige analyseteknikker og LlamaParse👇 🔬 DeepSeek-OCR komprimerer 1,000 teksttokens ned til bare 100 vision-tokens med 97 % nøyaktighet - det er 10x komprimering samtidig som kvaliteten opprettholdes ❗ 1 000 komprimerte teksttokens er fortsatt ganske lite sammenlignet med moderne LLM-kontekstvinduer 🤖 Fremtiden kombinerer sannsynligvis dagens moderne LLM-parsing med kontekstkomprimering som DeepSeek-OCR Les hele vår oppfatning: