Cosa si intende per modello economico e ampio? Tattica di retrocessione. È arrivata la buona notizia per il dispiegamento locale di grandi modelli! Vi presento l'analisi tecnica del Kimi-Linear-48B-A3B, appena rilasciato da Moon's Dark Side! In una frase: questo è il vero modello fast food economico e ampio. Il livello 48B-A3B ha raggiunto 1M di contesto, ed è ancora attenzione lineare, molto economico in termini di memoria. Il consumo di memoria causato dall'aumento della lunghezza del contesto nell'attenzione tradizionale è esponenziale, mentre qui è lineare, quindi questo modello può funzionare anche su CPU. Sto già scaricando, pronto a integrarlo nei modelli locali di uso comune. Attualmente, la maggiore incertezza è non sapere quale sia il livello di richiamo. Ho intenzione di scaricarlo e di fargli leggere alcuni romanzi per vedere come risponde ai dettagli dei romanzi e valutare l'efficacia del richiamo. Coloro che vogliono vedere i risultati, per favore mettete un like, se superiamo i 100, rilascerò la valutazione nel weekend.