Estudio analiza características de los tweets creíbles sobre desastres

terremoto Chile 2010

Los tweets creíbles con información sobre una catástrofe tienden a ir acompañados de referencias a direcciones URL  incluídas en el top-10. 000 dominios más visitados en la Web. En general, llevan más direcciones URL, y son más largos que los que no son creíbles. Los tweets  creíbles también tienden a expresar sentimientos negativos, según las conclusiones del estudio  “Predecir la credibilidad de la Información en Tiempo adecuado en las Redes Sociales”, escrito por Carlos Castillo, Marcelo Mendoza, Barbara Poblete  y  analizado por Peter Meier en su blog iRevolution.

Los tweets menos creíbles, por el contrario, tienden a concentrarse más en los sentimientos positivos. Los signos de interrogación y exclamación tienden a asociarse con el concepto de no creíble, al igual que los tweets que utilizan  pronombres en primera y tercera persona, según el estudio que analiza el papel de las redes sociales en la gestión de las emergencias  y la respuesta humanitaria, y que  se publicará próximamente en Internet, señala Meier.

Los autores analizaron los tweets de desastre y encontraron que hay diferencias apreciables en la forma en que se propagan. Demuestran que “estas diferencias están relacionadas con las noticias, dignidad y credibilidad de la información transmitida”, un hallazgo que les permite  desarrollar un método automático de gran precisión para identificar la información creíble en Twitter.

El estudio, basado en el anterior La crisis de Twitter, ¿podemos fiarnos de lo que retuiteamos? analiza la veracidad de los tweets enviados durante un gran desastre y encuentra una correlación entre el modo en el que información se propaga en las redes sociales. “El reflejo de acontecimientos en tiempo real en las redes sociales revela patrones de propagación que sorprendentemente tiene menos variabilidad cuanto más valor tiene una noticia”.

Los gráficos, extraídos del blog de Meier, ilustran como se propaga la información durante el terremoto de Chile en 2010.

gráficos RTs terremoto Chile 2010

Los gráficos muestran los retweets durante las primeras horas después de terremoto. Los bordes grises representan retweets pasados. Algunos de los gráficos de re-tweets revelan patrones interesantes, incluso durante los 30 minutos del terremoto, señala Meier. “En algunos casos, la propagación en Twitter adopta la forma de un árbol, cuando se cita directamente la información original.  En otros casos, el gráfico presenta ciclos de propagación, lo que indica que la información está siendo comentada y respondida, tal como se ha trasmitido.

Cuando se estudia la propagación de falsos rumores, el análisis revela que” los falsos rumores tienden a ser cuestionado mucho más que verdades confirmadas “, según el estudio al que ha tenido acceso Patrick Meier.

Sobre esta base, los autores estudiaron a más de 200.000 mensajes de Twitter sobre desastres e identificaron las 16 características que mejor separan los tweets creíbles de aquellos que no lo son.  Las conclusiones del estudio señalan que los usuarios que difunden mensajes de twitter creíbles tienden a tener más seguidores.

Características de los tweets creíbles sobre desastres.

El número medio de tweets publicados por el autor de un tweet sobre el tema en el pasado y el número medio de seguidores antes de publicar estos tweets encabezan la lista, que incluye también la fracción de tweets que tienen un sentimiento positivo y los que añaden un sentimiento negativo, el porcentaje de tweets que contienen una dirección URL que coincide con la URL más frecuente.

La importancia de la URL

Las características que separan a los tweets creíbles de lo que no lo son analizan también qué parte de los tweets contienen una dirección URL, qué fracción de URLs apuntan a un dominio superior entre los 10. 000 más visitados, y qué parte de ellos  contienen  una mención de usuario.

Otras características a tener en cuenta es la duración media de los tweets, el número de ellos que contienen un signo de interrogación, de exclamación o una pregunta o una exclamación, así como cuáles incluyen emoticones sonrientes, un pronombre en primera o tercera persona y la máxima profundidad de los árboles de propagación.

Utilizando el procesamiento de lenguajes naturaels (NLP) y aprendizaje automático (ML), señala Meier, los autores utilizaron las ideas anteriores para desarrollar un clasificador automático para la búsqueda de credibilidad de los tweets escritos en inglés. Este clasificador tenía un AUC del 86%. Esta medida, que va de 0 a 1, refleja la calidad predictiva del clasificador. Cuando se aplica a los tweets en español, la AUC del clasificador era todavía relativamente alta, el 82%, lo que demuestra la solidez del enfoque.

VN:F [1.9.22_1171]
Rating: 0.0/5 (0 votes cast)
VN:F [1.9.22_1171]
Rating: +1 (from 1 vote)

Deja un comentario