Tienda de dapps | Hub de Web3 para eventos y juegos

Temas en tendencia

Robert Scoble

Lo mejor de la comunidad de IA | Ex-Microsoft, Rackspace, Fast Company | Escribió ocho libros sobre el futuro | Robots de Silicon Valley, holodecks, BCI y startups.

He visto varios análisis del algo, que era de código abierto. Esto es lo mejor que he visto hasta ahora.

Análisis del algoritmo de recomendación de X ===================================== Usé Grok Code Fast para obtener un desglose rápido del sistema de recomendación de X. Qué hace que una publicación se vuelva viral =========================== tldr: La predicción de compromiso triunfa sobre todo. Publica contenido que genere interacciones. Según el código del algoritmo real, las publicaciones que ocupan el lugar más alto suelen tener: + Altas puntuaciones de participación previstas (los modelos de ML predicen me gusta/reenvíos/respuestas) + Fuerte coincidencia de personalización (similitud de SimClusters con los intereses del usuario) + Relevancia del gráfico social (conexiones RealGraph a la red del usuario) + Contenido multimedia (las imágenes/videos obtienen multiplicadores de participación) + Credibilidad del autor (número de seguidores, verificación, puntuación de tweepcred) + Señales de calidad del contenido (pasa los filtros de spam/NSFW/calidad) + Relevancia oportuna (factor de frescura, trending topics) + Potencial de conversación (altas puntuaciones de predicción de respuesta) El algoritmo utiliza modelos de aprendizaje automático para predecir el compromiso, no simples fórmulas ponderadas. El éxito se mide por las interacciones reales de los usuarios, creando un ciclo de retroalimentación que mejora continuamente las predicciones de clasificación. Cómo funciona realmente el algoritmo =============================== 1. Generación de candidatos (9 fuentes): - Earlybird (publicaciones dentro de la red) ~50% - UTEG (recomendaciones fuera de la red) - postMixer, Listas, Comunidades, Exploración de contenido - Fuentes estáticas, en caché, de reposición 2. Hidratación de características (~ 6000 características por publicación): - Características del usuario (intereses, comportamiento, datos demográficos) - Funciones de publicación (texto, medios, metadatos, participación) - Funciones de gráficos (SimClusters, RealGraph, conexiones sociales) - Señales en tiempo real (compromiso actual, estado de tendencia) 3. Scoring Pipeline (4 modelos): - Puntuación del modelo (clasificador pesado NAVI) - Canalización de reclasificación - Puntuación heurística - Puntuación de señal baja 4. Filtrado (24 filtros en total): - 10 filtros globales (edad < 48h, deduplicación, ubicación, etc.) - 14 filtros posteriores a la puntuación (seguridad de Grok, idioma, duración del video, etc.) 5. Selección final y mezcla: - Ordenar por puntajes finales - Aplicar reglas de diversidad - Mezcla con anuncios, a quién seguir, indicaciones - Generar cronograma Modelos de predicción clave ==================== El algoritmo predice estos tipos de participación: • Puntuación favorita predicha (me gusta) • PredictedRetweetScore (reenvíos) • PredictedReplyScore (respuestas) • PredictedGoodClickScore (clics significativos) • PredictedVideoQualityViewScore (participación de video) • PredictedBookmarkScore (guardado) • PredictedShareScore (recursos compartidos externos) • PredictedDwellScore (tiempo dedicado a la visualización) • PredictedNegativeFeedbackScore (oculta/bloquea) Realidad del sistema de peso ==================== IMPORTANTE: El algoritmo NO utiliza ponderaciones porcentuales fijas como: ❌ Me gusta Predicción (35%), Repost (28%), etc. SISTEMA ACTUAL: ✅ Los pesos son parámetros aprendidos del entrenamiento de ML ✅ Los valores predeterminados en el código son 0.0 (invalidado por marcas de características) ✅ Los pesos se personalizan por usuario y se prueban constantemente A / B ✅ Los diferentes tipos de contenido (video vs texto) reciben un tratamiento diferente ✅ Los pesos cambian según el contexto en tiempo real y el estado del usuario Ejemplo de proceso de puntuación: 1. Los modelos de ML predicen las probabilidades de participación 2. Las marcas de características proporcionan multiplicadores de peso actuales 3. La personalización ajusta los pesos para el usuario individual 4. El contexto en tiempo real modifica los puntajes finales 5. Las reglas de negocio aplican puertas de calidad y diversidad Lo que realmente impulsa el contenido viral ================================== Según el análisis de código, las publicaciones virales típicamente: 1. Genere predicciones de alto compromiso: - Los modelos predicen una alta probabilidad de me gusta / reenvío / respuesta - El contenido resuena con múltiples comunidades de usuarios - Fuertes señales de compromiso temprano 2. Pase todas las puertas de calidad: - Sobrevive a 24 etapas de filtrado diferentes - Cumplir con los estándares de seguridad (no spam/NSFW/violento) - El autor tiene buenas señales de credibilidad 3. Logre la personalización a escala: - Hacer coincidir los intereses de diversos segmentos de usuarios - Activar la similitud de SimClusters para muchos usuarios - Conéctese a través de las relaciones sociales de RealGraph 4. Optimizar para la mecánica de la plataforma: - Incluir medios (las imágenes/videos funcionan mejor) - Publicar durante períodos de alta actividad - Utilizar formatos que fomenten las respuestas/reenvíos Conclusiones clave ============= ✅ La predicción del compromiso lo es todo: el algoritmo se optimiza para las interacciones del usuario ✅ La personalización es sofisticada: utiliza incrustaciones de ML, no una simple coincidencia de palabras clave ✅ El filtrado de calidad es extenso: 24 etapas evitan contenido de baja calidad ✅ Los pesos son dinámicos: se optimizan constantemente a través de pruebas ML y A/B ✅ La escala importa: el sistema procesa miles de millones de publicaciones diariamente con una latencia de <50 ms Existe transparencia: este análisis es posible porque X abrió el algoritmo El sistema está diseñado para mostrar contenido con el que los usuarios participarán, creando un ciclo de retroalimentación que recompensa a los creadores que entienden a su audiencia y producen contenido atractivo. En pocas palabras: cree contenido que genere un compromiso genuino de su público objetivo. El algoritmo aprenderá y amplificará lo que funciona.

Populares

Ranking

Favoritas