Twitter ha publicado el código que elige qué tuits aparecen en su línea de tiempo en GitHub y tiene publicar una entrada en el blog explicando la decisión. Desglosa lo que mira el algoritmo a la hora de determinar qué tuits incluyen en la línea de tiempo For You y cómo los clasifica y filtra.
Según la publicación del blog de Twitter, «el pipeline de recomendaciones se compone de tres etapas principales». Primero, reúne a «los mejores tuits de diferentes fuentes de recomendación», después los clasifica con «un modelo de aprendizaje automático». Finalmente, filtra los tuits de personas que ha bloqueado, los que ya ha visto o los que no son seguros para el trabajo, antes de ponerlos en su línea de tiempo.
La publicación explica también cada paso del proceso. Por ejemplo, señala que el primer paso tiene en cuenta unos 1.500 tuits y que el objetivo es hacer que la línea de tiempo de For You alrededor del 50 por ciento de tuits de las personas que sigue (que se llaman «dentro de la red») y el 50% de los tuits de «cuentas fuera de la red” que no siga. También dice que la clasificación está destinada a «optimizar el compromiso positivo (p. ej., Me gusta, retuits y respuestas)» y que el paso final intentará asegurarse de que no ve demasiados tuits de la misma persona.
Por supuesto, el más detalle estará disponible escogiendo el código, que los investigadores ya lo están haciendo.
El CEO Elon Musk ha estado prometiendo el movimiento durante un tiempo: el 24 de marzo de 2022, antes de ser propietario del sitio, encuestó a sus seguidores sobre si el algoritmo de Twitter debería ser de código abierto y alrededor del 83 por ciento de las respuestas dijeron «sí». En febrero, prometió que pasaría una semana antes retrasando el plazo hasta el 31 de marzo de ese mes.
Musk tuiteó el lanzamiento de este viernes era «la mayoría del algoritmo de recomendación» y dijo que el resto se publicaría en el futuro. También dijo que la esperanza es «que terceros independientes puedan determinar, con una precisión razonable, qué probablemente se mostrará a los usuarios». En un Espacio que habla del lanzamiento del algoritmo, dijo que el plan era convertirlo en «el sistema menos jugable de Internet» y hacerlo tan robusto como Linux, quizás el proyecto de código abierto más famoso y exitoso. «El objetivo general es maximizar los minutos de usuario no lamentados», añadió.
Musk ha sido preparando a su público para ser decepcionado al algoritmo cuando lo ven (lo cual, por supuesto, supone una gran suposición de que la gente realmente entenderá el código complejo). Lo ha dicho es «exceso de complejo y no se entiende del todo internamente» y que la gente «descubrirá muchas cosas tontas», pero se ha comprometido a solucionar los problemas a medida que se descubran. «Ofrecer transparencia del código será increíblemente vergonzoso al principio, pero debería conducir a una mejora rápida de la calidad de las recomendaciones», tuiteó.
Existe una diferencia entre la transparencia del código, donde los usuarios podrán ver los mecanismos que eligen los tuits para sus líneas de tiempo, y el código que es de código abierto, donde la comunidad puede enviar su propio código para la su consideración y utilizar el algoritmo en otros proyectos. Mientras que Musk lo tiene dicho será de código abierto, Twitter tendrá que hacer el trabajo si usted desea ganar esta etiqueta. Esto implica averiguar sistemas de gobierno que decidan qué solicitudes de extracción deben aprobarse, qué problemas planteados por los usuarios merecen atención y cómo evitar que los actores malos intenten sabotear el código para sus propios propósitos.
Twitter dice que la gente puede enviar solicitudes de extracción que eventualmente pueden terminar en su base de código
La empresa dice que está trabajando en esto. El readme de GitHub dice: «Invitamos a la comunidad a enviar problemas de GitHub y obtener solicitudes de sugerencias para mejorar el algoritmo de recomendación». Sin embargo, sigue diciendo que Twitter todavía está en proceso de crear «herramientas para gestionar estas sugerencias y sincronizar los cambios en nuestro repositorio interno». Pero el Twitter de Musk se ha comprometido a hacer muchas cosas (como encuestar a los usuarios antes de tomar decisiones importantes) con las que no se ha enganchado, por lo que la prueba será si realmente acepta algún código de comunidad.
La decisión de aumentar la transparencia en torno a sus recomendaciones no está ocurriendo en una burbuja. Musk ha criticado abiertamente cómo la anterior gestión de Twitter gestionó la moderación y la recomendación y orquestó una lluvia de historias que afirmó expondría la «supresión de la libertad de expresión» de la plataforma. (Sobre todo, sólo sirvió para mostrar cómo funciona la moderación de contenido normal.)
Pero ahora que está al frente, también se ha enfrentado a muchas reacciones: desde usuarios enfadados con sus páginas For You que les meten sus tuits en la cara hasta sus impulsores conservadores cada vez más preocupados por su poco compromiso . Se ha discutido que el contenido negativo y de odio se está «potenciando al máximo» a los nuevos algoritmos de recomendación del sitio, una afirmación analistas externos sin acceso al código han disputado.
Twitter también se enfrenta potencialmente a cierta competencia de la comunidad de código abierto. Mastodon, una red social descentralizada, ha ido ganando bastante en algunos círculos, y el cofundador de Twitter Jack Dorsey está apoyando a otro proyecto similar llamado Bluesky, que se basa en un protocolo de código abierto.