Temas en tendencia
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.

swyx
Logre la ambición con intencionalidad, intensidad e integridad
- @smol_ai
- @dxtipshq
- @sveltesociety
- @aidotengineer
- @coding_career
- @latentspacepod
felicitaciones a Bee por haber sido elegido por Amazon; similar a Blink, Ring, Eero y, por supuesto, el nuevo Claude + Nova + Alexa, creo que @panos_panay está armando un segundo acto bastante sólido de la estrategia de hardware de IA de Amazon
supo que Bee estaba ganando cuando @dharmesh se presentó a su @latentspacepod meciendo uno

12.32K
la razón por la que el análisis de LLM (y la regulación, y el PMing) es difícil*
es que las DIMENSIONES relevantes sigan moviéndose con cada generación de modelo de frontera; No es suficiente simplemente poner su eje X o Y en las leyes de escala logarítmica y escala de seguimiento, debe hacer el trabajo para pensar en cómo los modelos son estructuralmente diferentes en 2025 vs 2024 vs 2023 y así sucesivamente
Eg
Todos se centraron en Elo durante 2 años, ELO se engaña y pierde credibilidad
Todos se centraron en el precio por tokens durante 3 años, los modelos de razonamiento tienen una variación de 10-40x en los tokens de salida por tarea, el precio por token pierde significado
recopile datos todo lo que desee, pero si solo está recopilando series temporales prístinas, puede perder de vista el panorama general
* (y por qué afirmaciones como "ingeniero de IA no es una cosa porque todos los ingenieros de software son ingenieros de IA" son capaces y nunca serán correctas excepto en el sentido más trivial)

Scott Huston22 jul, 08:30
¿Existe una hoja de cálculo pública de todos los principales modelos de LLM de diferentes compañías que muestre sus precios, puntajes de referencia, puntajes de elo de arena, etc.?
9.72K
swyx reposteó
🆕 ¡Lanzando toda nuestra pista RL + Reasoning!
Con:
• @willccbb, intelecto supremo
• @GregKamradt, Premio Arc
• @natolambert, AI2 / Interconexiones
• @corbtt, OpenPipe
• @achowdhery, Reflexión
• @ryanmart3n, a medida
• @ChrSzegedy, Morph
Con taller especial de 3 horas de:
@danielhanchen de Unsloth!
Empieza aquí:
¡Feliz fin de semana viendo! ¡Y gracias a @OpenPipeAI por apoyar y presentar esta canción!

106.66K
swyx reposteó
Si, como propone @sgrove, las especificaciones son el código del futuro, ¿qué es la depuración?
1) La compilación de especificaciones es el proceso de un agente de codificación que convierte las especificaciones en código
2) cada vez más "compilación" estará desatendida, menos viendo al agente trabajar diff por diff, más especificaciones de entrada, código de salida
3) errores de tipo -> errores de verdad: la mayor parte de la depuración consistirá en buscar en los planes de investigación e implementación en markdown para encontrar la única línea de contexto incorrecto que hace que el agente de codificación no tenga éxito al implementar. Los conjuntos de pruebas, entre otras cosas, verificarán la veracidad y la consistencia lógica.
4) hay un nuevo tipo de orden superior de "adjuntar un depurador de pasos" que está observando al agente implementar un plan paso a paso para identificar el error lógico en la especificación. Cuando encuentra un error al recorrer un programa línea por línea, cambia el código, reinicia el proceso y repite hasta que funcione. Cuando encuentra un error en una *spec* mientras recorre una implementación, va hacia arriba, corrige la especificación y reinicia la *implementación*
10.27K
Estamos lanzando una pista al día de la @aidotengineer conf ahora*. La pista de RecSys de ayer fue un gran éxito, pero la pista más popular fue nuestra cobertura del estado de MCP, organizada por @Calclavia
La diapositiva favorita personal es aquí donde me di cuenta de @AnthropicAI los alimentos para perros MCP -mucho- más difícil de lo que pensé inicialmente en nuestro podcast con @dsp_ y @jspahrsummers
¡Eche un vistazo a estas charlas y salude a sus oradores favoritos!
* la mayoría ya está disponible como "no listado" a través de la "Lista de reproducción completa" si busca

21.68K
"Tres cosas: un modelo de investigación profunda con un navegador de búsqueda mejorado; un revolucionario operador de uso de computadoras; y un terminal aislado para ejecutar matemáticas y código. Un navegador, un ordenador, un terminal... ¿Lo estás consiguiendo?
No se trata de tres dispositivos separados.
Este es un dispositivo, y lo llamamos Agente".

400
Populares
Ranking
Favoritas
Onchain en tendencia
Tendencia en X
Principales fondos recientes
Más destacadas