Jeg fikk Codex CLI for å hjelpe meg med å endre Transformers.js Llama 3.2 chat-demoen for å gjøre det mulig å laste den 1,2 GB-modellen fra en lokal mappe i stedet for å hente den fra en URL
Jeg skrev om hvor sjokkerende effektiv GPT-5 Thinking er til å bruke det Bing-støttede søkeverktøyet, illustrert med 8 eksempler fra de siste 48 timene
Jeg har begynt å kalle det min Research Goblin
Jeg er nok en gang sjokkert over hvor mye bedre bildegjenfinningsytelse du kan få hvis du legger inn svært meningsfulle sammendrag av et bilde, et sammendrag som kom ut av en visuell språkmodell, enn å bruke CLIP-innbygginger selv. Hvis du forteller LLM at sammendraget skal bygges inn og brukes til å søke nedstrøms. Jeg fikk ett system til å gå fra 28 % tilbakekalling ved 5 ved bruk av CLIP til 75 % tilbakekalling ved 5 ved hjelp av et LLM-sammendrag. Og det tok meg bare omtrent 40 minutter å forbedre oppsummeringsspørsmålet.