Il 95% dell'ingegneria AI è solo ingegneria del contesto. Tutti sono ossessionati dai modelli migliori mentre il contesto rimane il vero collo di bottiglia. Anche il miglior modello al mondo ti darà spazzatura se gli fornisci le informazioni sbagliate. Ecco cosa la maggior parte delle persone non capisce: L'ingegneria del contesto non riguarda solo RAG o memoria o agenti. È l'arte e la scienza di fornire le informazioni giuste, nel formato giusto, al momento giusto, al tuo LLM. Pensa a ciò di cui hai realmente bisogno: ↳ Recupero per estrarre documenti pertinenti ↳ Memoria a breve termine per tenere traccia delle conversazioni ↳ Memoria a lungo termine per ricordare le preferenze degli utenti ↳ Agenti per orchestrare tutto ↳ Strumenti per estendere le capacità Sono 5 sistemi diversi che devi costruire, connettere e mantenere. Recentemente ho lavorato con Pixeltable, ed è un approccio interessante a questo problema. È open-source e tratta l'ingegneria del contesto come un problema di dati unificato: L'idea è semplice: invece di assemblare un database vettoriale, un database SQL, un servizio di embedding e un framework di agenti, tutto vive in un unico sistema. I tuoi documenti, embedding, cronologia delle conversazioni e output degli agenti sono tutti semplicemente tabelle. Gli embedding sono colonne calcolate che si aggiornano automaticamente. La ricerca vettoriale funziona insieme alle tue operazioni di dati regolari. Cosa trovo utile: ↳ Pipeline RAG senza gestire database separati ↳ Memoria a lungo termine attraverso la ricerca vettoriale su conversazioni storiche...