Temas en tendencia
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
La mayoría piensa que el cómputo descentralizado falla porque "no hay suficientes GPUs".
Están mirando la oferta.
El verdadero bloqueador es la coordinación, y quien lo resuelva puede establecer las reglas de la infraestructura de IA. 🧵

/2 Seguimos aprendiendo la lección equivocada con el cálculo voluntario como Folding@Home.
Esos trabajos toleran nodos lentos y abandonos.
El entrenamiento moderno de IA y la inferencia castigan la inconsistencia, una GPU inestable puede estancar toda la partida.
/3 Una pregunta sigue surgiendo para nosotros:
¿Pueden las GPUs dispersas globalmente y desajustadas comportarse como una sola máquina predecible?
Si la respuesta es no, la fiabilidad y la experiencia de desarrollador nunca importan, porque nada se entrega.
/4 Internet hace que las GPUs se comporten como instrumentos con diferentes afinaciones.
Las pilas de centros de datos asumen un momento perfecto.
Una malla global te da jitter, ancho de banda desigual, inactividad aleatoria y variación de hardware. La coordinación tiene que absorber ese desastre.
/5 @YottaLabs toma la ruta del sistema operativo, no la del mercado.
Programación, comunicación, descarga de memoria, manejo de fallos, verificación.
La cuestión es sencilla: convertir máquinas poco fiables en un clúster que se comporte lo suficientemente predecible para los SLAs.
/6 La visión más concreta, divide la inferencia en dos trabajos.
Prefill necesita las mejores GPUs.
El decodificamiento puede funcionar en GPUs más débiles.
Ese diseño evita que las cartas caras esperen por las baratas, y hace que las "flotas mixtas" sean útiles en lugar de dolorosas.
/7 Luego el cuello de botella oculto, moviendo la memoria de trabajo del modelo (caché KV).
Si lo envías en una sola transferencia grande, te retrasas.
Yotta transmite pequeños fragmentos mientras el cómputo se ejecuta y comprime la caché, por lo que la latencia WAN deja de dominar.
109
Populares
Ranking
Favoritas
