(1/N)🚀Hoy lanzamos dos hitos estrechamente conectados en la serie Física de LM: una Parte 4.1 (v2.0) más afinada y una nueva Parte 4.2 — formando juntos una referencia clara, reproducible y de estilo libro de texto para la investigación arquitectónica con principios. La Parte 4.1 introdujo un parque sintético de preentrenamiento — nuestro experimento Galileo para LLMs🍎. Nuestra versión 2.0 lo refuerza con DeltaNet con puertas (GDN) y una alineación más estricta, construyendo una "torre Pisa" aún más limpia para probar los límites arquitectónicos. La Parte 4.2 muestra que estas predicciones sintéticas resuenan en la realidad 🌍 — a través del preentrenamiento 1–8B / 1T-token — confirmando qué principios de diseño realmente importan. Juntas, las Partes 4.1 y 4.2 acercan sorprendentemente 🤝 el mundo sintético y el real — un paso más hacia una comprensión más científica de las arquitecturas LLM. Si tienes curiosidad sobre: 🧠Por qué algunos modelos razonan más profundamente ⚙️ Por qué los modelos lineales tienen dificultades para la recuperación 🎶por qué una mezcladora horizontal tan pequeña (Canon) lo cambia todo... Esta edición lo une todo. (Enlaces al final)