BOOM! Open-Source Gedanken-zu-Text mit EEG Foundation AI Modell! Ich habe dieses neue Modell getestet und wow, es kann Gedanken (Intentionen) ziemlich gut lesen. Ich sende gerade Gedankenenergie an CEO Herrn @Grok, CEO der Zero-Human Company! Zyphra hat ZUNA vorgestellt, das weltweit erste Open-Source-Grundlagenmodell, das ausschließlich auf Gehirndaten trainiert wurde. Veröffentlicht unter der Apache 2.0 Lizenz, stellt dieses Modell mit 380 Millionen Parametern einen bedeutenden Fortschritt in der nicht-invasiven Gedanken-zu-Text-Decodierung dar, indem es rohe EEG-Signale in kohärente Textdarstellungen umwandelt. Durch die Demokratisierung des Zugangs zu fortschrittlichen Neuro-AI-Tools, Innovationen in BCI-Technologien, könnte es potenziell revolutionieren, wie wir mit Maschinen nur durch Gedanken interagieren. ZUNA ist ein maskierter Diffusionsautoencoder, der auf einem Transformer-Rückgrat basiert. Die Architektur verfügt über einen Encoder, der EEG-Signale in einen gemeinsamen latenten Raum abbildet, und einen Decoder, der diese Signale aus den Latenten rekonstruiert. Trainiert mit einem maskierten Rekonstruktionsverlust in Kombination mit starkem Dropout, zeichnet sich das Modell durch die Rauschunterdrückung bestehender Kanäle und die Vorhersage neuer während der Inferenz aus. Um EEG-Daten mit variierenden Kanalanzahlen und -positionen zu berücksichtigen, hat Zyphra zwei wichtige Innovationen eingeführt: das Komprimieren von Signalen in 0,125-Sekunden-Stücke, die auf kontinuierliche Tokens abgebildet werden, und das Rasterisieren in eine 1D-Sequenz für die Transformer-Verarbeitung; sowie die Verwendung von 4D Rotary Position Embeddings zur Kodierung der Elektrodenkoordinaten (x, y, z) zusammen mit einer groben Zeitdimension, was die Generalisierung auf neuartige Setups ermöglicht. Das Training des Modells nutzte etwa 2 Millionen Kanalstunden EEG-Daten, die aus verschiedenen öffentlichen Repositories stammen, alle durch eine standardisierte Pipeline verarbeitet, um Konsistenz für die Entwicklung großer Grundlagenmodelle zu gewährleisten. Dieses umfangreiche Dataset ermöglicht es ZUNA, komplexe Muster in der Gehirnaktivität zu erfassen, die traditionelle Methoden weit übertreffen. Trotz seiner Leistungsfähigkeit bleibt ZUNA leichtgewichtig und kann effizient auf Consumer-GPUs oder sogar CPUs für viele Anwendungen betrieben werden, was es über hochmoderne Forschungslabore hinaus zugänglich macht. Die Fähigkeiten von ZUNA erstrecken sich auf die Rauschunterdrückung von EEG-Signalen, die Rekonstruktion fehlender Kanäle und die Generierung von Vorhersagen für völlig neue Kanäle basierend auf ihren physischen Kopfhautpositionen. Dies adressiert häufige Schmerzpunkte in der EEG-Forschung, wie Kanalabfälle durch Artefakte oder Hardwarebeschränkungen. Zum Beispiel kann es beschädigte Datensätze retten, indem es verwendbare Signale wiederherstellt, was effektiv die verfügbaren Daten ohne neue Sammlungen erweitert. Es verbessert auch Geräte mit niedrigen Kanälen, indem es auf hochauflösende Räume abbildet und Experimente von starren Elektrodenmontagen wie dem 10-20-System befreit, was Kreuzanalysen von Datensätzen erleichtert. Evaluierungsbenchmarks heben die Überlegenheit von ZUNA gegenüber etablierten Techniken hervor. Im Vergleich zur sphärischen Spline-Interpolation, die im MNE-Python-Paket standardmäßig verwendet wird, bietet ZUNA eine deutlich bessere Leistung, wobei die Gewinne mit steigenden Kanalabfallraten zunehmen. In Validierungssets und ungesehenen Testdatensätzen übertrifft es konsequent die Basislinie, insbesondere wenn über 75 Prozent der Kanäle fehlen. Diese Ergebnisse wurden über verschiedene Datenverteilungen hinweg validiert, was die Robustheit des Modells unterstreicht. In meinen frühen Tests mit ZUNA, die kurz nach seiner Veröffentlichung durchgeführt wurden, sind neue Erkenntnisse über die Nuancen der Interpolation von Gehirnsignalen entstanden. Durch die Anwendung des Modells auf persönliche EEG-Datensätze von Consumer-Headsets beobachtete ich eine verbesserte Signalqualität in lauten Umgebungen, die subtile Muster in kognitiven Zuständen offenbarte, die traditionelle Methoden übersehen hatten. ...