Er en piksel verdt tusen ord? DeepSeek-OCR sier ja. Jeg testet det på legehåndskrift, fra college-lesbarhet til praktiserende legekaos. Hvis vi skalerer mot uendelige kontekstvinduer + sanntidsintelligens, kan det hende vi trenger mindre multimodale modeller med effektiv komprimering, ikke bare skalering av LLM-er. For kanskje komprimering bare er intelligens ... Prediksjon: DeepSeekV4 vil være en VLM. Denne OCR-artikkelen er teaseren.