“Dovreste usare di più Bash.” Nelle ultime settimane, Thariq di Anthropic ha partecipato a una teleconferenza con decine di aziende che lavorano su agenti intelligenti generali. Assistenti per email, chatbot per il servizio clienti, gestione degli appuntamenti: ci sono vari formati di prodotto. Dopo aver parlato con tutti, si è reso conto di ripetere sempre la stessa frase. Bash? Non è uno strumento da riga di comando usato dai programmatori? Che c'entra con questi prodotti? Iniziamo con uno scenario concreto. Immagina di avere un agente per le email e di chiedergli: “Quanto ho speso in taxi questa settimana?” Il metodo tradizionale è il seguente: l'agente chiama un'API per recuperare le email, potrebbe prendere 100 email in una volta, e poi il modello deve cercare le ricevute di Uber e Lyft e sommare gli importi. Il problema è che 100 email nel contesto richiedono al modello di ricordare tutto ciò, filtrare e calcolare. Non è facile per i grandi modelli di linguaggio. È facile che manchi qualcosa, che ci siano errori, e non puoi verificare quali email ha effettivamente esaminato. Questo è un tipico problema della zona di comfort del modello: la quantità di dati non è così grande da richiedere la scrittura di un programma specifico, ma supera la capacità del modello di calcolare tutto in una volta. Essere bloccati a metà è imbarazzante. La soluzione di Thariq è: dare all'agente uno strumento Bash, permettendogli di salvare i risultati intermedi in un file. Sembra semplice, ma la logica dietro è molto interessante. Il processo tradizionale di chiamata degli strumenti è il seguente: Strumento → Elaborazione del modello → Risultato finale Tutti gli stati intermedi sono nella "testa" del modello, non puoi vederli e non puoi controllarli. Passando a Bash, il processo cambia: Strumento → Salva file → Cerca/Filtro → Elaborazione del modello → Risultato finale ...