Científicos desarrollaron algoritmos que permiten conocer si las publicaciones en Twitter son realizadas durante estado de ebriedad
Un equipo de ingenieros de la Universidad de Rochester en Nueva York crearon un algoritmo capaz de identificar las publicaciones en Twitter escritas por personas en estado de ebriedad. Además se puede determinar si el usuario estaba bebiendo al momento de escribir el texto.
Los investigadores reunieron alrededor de 11.000 tuits geolocalizados posteados en Nueva York, entre julio del 2013 y julio del 2014. Luego, filtraron todos los posts según las palabras que escribía la gente en ellos, como «borracho» y «cerveza», o sea términos relacionados al alcohol, separando a los ebrios de los no ebrios.
Ingresaron estos datos en la plataforma Mechanical Turk de Amazon y cada post fue revisado por tres personas del servicio, los cuales categorizaron los tuits respondiendo esta interrogante: «¿En el tuit existe alguna referencia a una bebida alcohólica?». Si respondieron sí, debían continuar respondiendo estas preguntas:
¿El tuit es sobre la misma persona tomando alguna bebida alcohólica?, ¿El tuit fue enviado en el lugar y en el momento en que el usuario estaba bebiendo alcohol?.
Nabil Hossain, el líder del grupo investigador, creó tres algoritmos para que funcionaran en tres máquinas de soporte vectorial (Support Vector Machines – SVMs). Fueron desarrollados en base al 80% de las respuestas que entregó Mechanical Turk y fueron probados en el 20% restante.
El porcentaje de éxito entre las respuestas de los algoritmos y del servicio de Amazon fue de un rango de 92% a un 82% desde la primera hasta la última pregunta.
En cuanto a si las personas que postearon bebieron al momento de escribir, el proceso para reconocerlo fue el mismo, pero esta vez filtraron los posts con palabras como «televisor», «dormir» y «casa», términos que estén relacionados al hogar. De esta manera podían identificar si estas personas se encontraban en su casa al momento de postear. Los resultados del experimento lanzaron un 80% de exactitud en este caso.
EN