I modelli stanno diventando davvero bravi in Patio11-As-A-Service. (Ricevo email abbastanza frequentemente che richiedono un intervento simile a quello di un ombudsman o consigli riguardo all'interazione con l'industria finanziaria come consumatore. A volte, per controllare lo stato dell'arte, fornisco fatti a loro per i modelli.)
Esempio rappresentativo: Utente: È probabile che (cinque paragrafi di spiegazione) chiuda il mio account? Io, a me stesso: Molto improbabile, quattro motivi principali per cui. Io, al modello: Cosa risponderei a questo utente e (separatamente) commentare sulla verità effettiva.
Modello: Ecco il 75% di allineamento su come lo hai effettivamente descritto in un'email che non ho ancora visto e il 95% di allineamento sulla visione della verità oggettiva.
Alcuni dei modelli sono probabilmente migliori per me specificamente nell'eseguire questa query rispetto a come sarebbero pronti all'uso, perché oltre al mio corpus di Internet e ad altri dati di addestramento, hanno anche la memoria privata di, ad esempio, molte email simili e sessioni di redazione BAM.
Ma sono incoraggiato dal fatto che lo stato dell'arte, anche senza memoria, nei miei esperimenti informali e come riportato da dozzine di persone a questo punto, è che "Sono abbastanza efficaci così come sono."
(Questa non è una sollecitazione a inviarmi questioni simili a quelle di un ombudsman, ma dato che il mondo continua a farlo indipendentemente dal mio impiego o dalle mie opinioni in merito e io continuo a voler che le persone abbiano risultati giusti nei loro incontri con l'industria finanziaria, continuerò a preoccuparmi.)
(Ho trascorso una grande parte dei miei vent'anni a scrivere lettere alle banche per conto di persone gratuitamente e, mentre nei miei quarant'anni la vita e gli obblighi professionali significano che questo non è per lo più praticabile, sono molto felice che ora ci sia una tecnologia quasi infinitamente scalabile che può farlo.)
Commento inattivo: ci sono persone che hanno un lavoro a tempo quasi pieno presso vari regolatori, svolgendo un lavoro simile a questo, probabilmente con email più frustranti nelle loro caselle di posta collettive (a causa dei diversi livelli di abilità, ecc. nel pubblico in generale).
Gran parte di quel lavoro consiste nel percorrere l'albero telefonico (o l'equivalente cartaceo) presso l'istituzione finanziaria regolamentata per far sì che prestino maggiore attenzione alle preoccupazioni dei clienti che si sono verificate fino ad oggi. Si potrebbe *immaginare* un regolatore che decide, sai, forse questo dovrebbe essere potenziato con LLM.
Ci sono tutti i tipi di motivi per cui nessuno attiverà immediatamente quella funzione nel 2025, ma non penso che questi motivi prevalgano necessariamente indefinitamente.
@michael_nielsen La versione artigianale era "Un nome può essere, diciamo evocativamente come illustrazione, un indicatore nello spazio delle idee." La versione LLM è "No, davvero, è super utile, guarda i pesi."
@michael_nielsen Oltre alle persone, penso che le opere siano anche potenzialmente incantesimi per questo. "Seeing Like a State" significa qualcosa per molte persone nel settore tecnologico, anche se non hanno mai realmente letto della gestione forestale tedesca, e un LLM può seguire quel riferimento altrettanto bene.
@michael_nielsen Che momento meraviglioso per essere vivi, dove la ricompensa per una giornata di duro lavoro è pronunciare un nuovo incantesimo nell'universo. Sempre meno nel senso evocativo e illustrativo, ma "No, l'umanità in generale e potenzialmente per sempre può semplicemente clonare quell'incantesimo."
13,29K