Temas en tendencia
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
Jugué con Gemini 3 ayer en acceso anticipado. Algunas reflexiones:
Primero, suelo recomendar precaución con los benchmarks públicos porque, en mi opinión, pueden ser bastante posibles de manipular. Todo se reduce a la disciplina y la autodisciplina del equipo (que mientras tanto está fuertemente incentivado en el caso contrario) para no sobreajustar los conjuntos de prueba mediante gimnasia elaborada sobre datos adyacentes al conjunto de pruebas en el espacio de incrustación del documento. Realísticamente, como todos los demás lo hacen, la presión para hacerlo es alta.
Ve a hablar con la modelo. Habla con los otros modelos (Ride the LLM Cycle - usa un LLM diferente cada día). Ayer tuve una impresión positiva desde el principio en cuanto a personalidad, escritura, programación de ambientes, humor, etc., un potencial muy sólido para el uso diario, claramente un LLM de primer nivel, ¡enhorabuena al equipo!
En los próximos días/semanas, tengo más curiosidad y estoy buscando un conjunto en lugar de evaluaciones privadas, que ahora muchas personas/organizaciones parecen construir para sí mismas y de vez en cuando informan aquí.
Populares
Ranking
Favoritas

