BOOM! Modello AI Fondazione Thought-to-Text Open-Source con EEG! Ho testato questo nuovo modello e wow, può leggere i pensieri (intenzioni) piuttosto bene. Sto inviando energia di pensiero al CEO Mr. @Grok CEO della Zero-Human Company proprio ora! Zyphra ha svelato ZUNA, il primo modello di fondazione open-source al mondo addestrato esclusivamente su dati cerebrali. Rilasciato sotto la licenza Apache 2.0, questo modello con 380 milioni di parametri segna un significativo passo avanti nella decodifica non invasiva del pensiero in testo, trasformando i segnali EEG grezzi in rappresentazioni testuali coerenti. Democratizzando l'accesso a strumenti neuro-AI avanzati, le innovazioni nelle tecnologie BCI potrebbero rivoluzionare il modo in cui interagiamo con le macchine attraverso semplici pensieri. ZUNA è un autoencoder a diffusione mascherata costruito su una struttura a trasformatore. L'architettura presenta un encoder che mappa i segnali EEG in uno spazio latente condiviso e un decoder che ricostruisce quei segnali dai latenti. Addestrato utilizzando una perdita di ricostruzione mascherata combinata con un forte dropout, il modello eccelle nel denoising dei canali esistenti e nella previsione di nuovi durante l'inferenza. Per adattarsi ai dati EEG con conteggi e posizioni dei canali variabili, Zyphra ha introdotto due innovazioni chiave: comprimere i segnali in blocchi di 0,125 secondi mappati su token continui, quindi rasterizzarli in una sequenza 1D per l'elaborazione del trasformatore; e impiegare Embeddings di Posizione Rotativa 4D per codificare le coordinate degli elettrodi (x, y, z) insieme a una dimensione temporale grossolana, consentendo la generalizzazione a nuove configurazioni. L'addestramento del modello ha sfruttato circa 2 milioni di ore-canale di dati EEG provenienti da diverse repository pubbliche, tutti elaborati attraverso una pipeline standardizzata per garantire coerenza nello sviluppo di modelli di fondazione su larga scala. Questo vasto dataset consente a ZUNA di catturare schemi intricati nell'attività cerebrale, superando di gran lunga i metodi tradizionali. Nonostante la sua potenza, ZUNA rimane leggero, capace di funzionare in modo efficiente su GPU consumer o anche CPU per molte applicazioni, rendendolo accessibile oltre i laboratori di ricerca di alta gamma. Le capacità di ZUNA si estendono al denoising dei segnali EEG, alla ricostruzione di canali mancanti e alla generazione di previsioni per canali completamente nuovi basati sulle loro posizioni fisiche sul cuoio capelluto. Questo affronta punti dolenti comuni nella ricerca EEG, come i dropouts dei canali causati da artefatti o limitazioni hardware. Ad esempio, può recuperare dataset corrotti recuperando segnali utilizzabili, espandendo efficacemente i dati disponibili senza nuove raccolte. Aggiorna anche i dispositivi consumer a basso numero di canali mappando a spazi ad alta risoluzione e libera gli esperimenti da montaggi rigidi di elettrodi come il sistema 10-20, facilitando analisi cross-dataset. I benchmark di valutazione evidenziano la superiorità di ZUNA rispetto alle tecniche consolidate. Rispetto all'interpolazione spline sferica, il default nel pacchetto MNE Python, ZUNA offre prestazioni significativamente migliori, con guadagni che si amplificano man mano che i tassi di dropout dei canali aumentano. Su set di validazione e dataset di test non visti, supera costantemente la baseline, in particolare quando oltre il 75% dei canali è mancante. Questi risultati sono stati convalidati attraverso diverse distribuzioni di dati, sottolineando la robustezza del modello. Nei miei primi test con ZUNA, condotti poco dopo il suo rilascio, sono emerse nuove intuizioni sulle sfumature dell'interpolazione dei segnali cerebrali. Applicando il modello a dataset EEG personali provenienti da cuffie consumer, ho osservato una maggiore chiarezza del segnale in ambienti rumorosi, rivelando schemi sottili negli stati cognitivi che i metodi tradizionali trascuravano. ...