Innovación contra el ciberacoso: estudiante crea sistema pionero en Colombia para detectar violencia digital

Angélica María Agudelo Ortiz, creadora Sistema Colombiano de Detección de Ciberacoso en Twitter para Idioma Español Basado en Procesamiento de Lenguaje Natural (PLN) y Machine Learning (ML)

En un país donde más del 16 % de las personas mayores de 15 años ha sido víctima de ciberacoso, una joven ha decido utilizar la tecnología para enfrentar el problema. Se trata de Angélica María Agudelo Ortiz, estudiante de Ingeniería de Sistemas de la Universidad del Valle, quien ha creado el primer sistema capaz de detectar mensajes de acoso y discriminación en redes sociales, como X (antes Twitter), en Colombia, incorporando el léxico y las particularidades del contexto nacional. Un prototipo que podría abrir el camino hacia entornos digitales más seguros e inclusivos para todas las personas.

¿Qué es el ciberacoso y a quiénes afecta?

De acuerdo con la Organización de Naciones Unidas (ONU), el ciberacoso es una forma de intimidación que se lleva a cabo a través de tecnologías y plataformas digitales, como redes sociales y videojuegos en línea, e implica comportamientos que tienen la intención de atemorizar, enojar o humillar a otras personas. Se trata de una manifestación del acoso que también ocurre en entornos no digitales y que afecta especialmente a niñas, jóvenes, mujeres y personas de la comunidad LGTBIQ+, como lo explica Laura Sofía Rodríguez Pulecio, experta en ciberseguridad y docente de la Universidad del Valle.

“La violencia siempre ha estado, pero el ciberespacio es algo que afecta desproporcionalmente a las mujeres y a los más jóvenes, especialmente si tienen una orientación sexual diversa”, explica la profesora, quien aborda este fenómeno desde el Grupo Mujeres STEM de la Universidad del Valle.

Profesora Laura Sofía Rodríguez Pulecio, ingeniera electrónica con maestría y doctorado en Telecomunicaciones. Confundadora del Grupo de Mujeres STEM de la Facultad de Ingeniería.

Así, el ciberacoso es una problemática real que genera afectaciones psicológicas y emocionales en las víctimas. Siendo un accionar que, a pesar de ser tipificado como delito en varios países, incluyendo Colombia, se ha visto en aumento en parte por la eliminación de los sistemas de verificación de datos independientes en redes sociales como Facebook, Instagram y X, lo cual facilita la difusión de noticias falsas, la desinformación y los discursos de odio y discriminación.

Una respuesta tecnológica ante un problema creciente

Funcionamiento del Sistema Colombiano de Detección de Ciberacoso en Twitter para Idioma Español Basado en Procesamiento de Lenguaje Natural (PLN) y Machine Learning (ML). Suministrado por Angélica María Agudelo Ortiz.

Ante este panorama, la estudiante Angélica María Agudelo Ortiz desarrolló, como parte de su trabajo de grado, el Sistema Colombiano de Detección de Ciberacoso en Twitter para Idioma Español Basado en Procesamiento de Lenguaje Natural (PLN) y Machine Learning (ML), un prototipo de aplicación web capaz de identificar mensajes textuales que buscan discriminar o acosar a las personas por su género, etnia u orientación sexual en dicha red social.

“Es un sistema que puede determinar si un tweet tiene contenido de acoso o no a partir del procesamiento del lenguaje natural y el aprendizaje automático (machine learning)”, explica Angélica María, de 28 años.

Este sistema es pionero en el país, ya que reconoce expresiones y jergas comúnmente utilizadas en Colombia con fines discriminatorios, las cuales fueron identificadas a partir de cuatro estudios previos realizados por otros autores.

“A partir de esos trabajos, identifiqué 239 palabras clave comúnmente usadas de manera peyorativa para discriminar en redes sociales en Colombia”, explica Angélica María, que, con esta información, determinó el diseño del dataset (conjunto de datos) del sistema, fundamental para una identificación óptima del acoso en el contexto digital colombiano.

Funcionamiento del sistema

Módulo de Predicción del Sistema Colombiano de Detección de Ciberacoso en Twitter para Idioma Español. Suministrado por Angélica María Agudelo Ortiz.


El Sistema Colombiano de Detección de Ciberacoso en Twitter para Idioma Español utiliza una inteligencia artificial (IA) basada en redes neuronales: un modelo computacional que imita el funcionamiento del cerebro humano mediante nodos interconectados organizados en capas, por donde fluye la información de manera secuencial, similar al proceso neuronal. 

Para entrenar la IA del sistema y lograr el aprendizaje automático (machine learning), se utilizó el algoritmo MLPClassifier de la biblioteca sklearn.neural_network para procesar vectores derivados de la transformación numérica de 4433 tweets (el 80 % del dataset) con y sin contenido de acoso y discriminación.

“Con este modelo de inteligencia artificial, logré una exactitud de detección del acoso del 82,13 % en mensajes textuales que presentaban esta característica; además de un área bajo la curva ROC (ROC-AUC) del 91,08%, que representa una altísima capacidad del sistema para distinguir entre mensajes que contienen acoso y los que no”, cuenta Angélica María, que implementó este sistema en un prototipo de aplicación web desarrollado con Vue, Vuetify, Flask y Python. Dicha app se caracteriza por tener un diseño simplificado e intuitivo, contando con dos módulos principales: el de Predicción y el de Métricas.

El Módulo de Predicción permite a los usuarios determinar rápidamente si un tweet contiene ciberacoso o no, esto a través de una interfaz que incluye una caja de texto para ingresar el contenido y un botón que activa el análisis, ofreciendo una respuesta inmediata.


Por otro lado, el Módulo de Métricas ofrece visualizaciones estadísticas sobre el ciberacoso en Colombia, esto a partir de datos previamente recopilados y analizados, brindando un panorama general de esta problemática en el país. 


Módulo de Métricas del Sistema Colombiano de Detección de Ciberacoso en Twitter para Idioma Español. Suministrado por Angélica María Agudelo Ortiz. 

El prototipo del Sistema Colombiano de Detección de Ciberacoso en Twitter para Idioma Español despierta gran interés, pues tiene el potencial de ser la base del desarrollo de algoritmos que propicien redes sociales más seguras en el contexto colombiano.


“Se puede crear una herramienta con una perspectiva interseccional, que considere las violencias en línea por raza, etnia, orientación sexual y género, y que permita mitigar o censurar este tipo de agresiones. Pero las empresas como Meta deben querer hacerlo, porque tecnológicamente es posible”, afirma la docente Laura Sofía Rodríguez Pulecio, quien, junto a Óscar Fernando Bedoya Leyva de la Escuela de Ingeniería de Sistemas y Computación, dirigió el proyecto de grado de Angélica María.


Un sistema con gran potencial


Angélica María espera seguir trabajando en el prototipo para lanzarlo de manera pública.


Por ahora, este sistema es un prototipo, pero ya le ha significado a Angélica María el reconcomiendo de su trabajo de grado como meritorio. Además, a pesar de aún no ser lanzado públicamente, se perfila como un sistema prometedor con importantes proyecciones de desarrollo.


“Ahora existen técnicas de inteligencia artificial más avanzadas, que utilizan algoritmos capaces de analizar el contexto semántico de los textos. Entonces se podría trabajar en eso para mejorar los resultados. También sería clave que el sistema reconozca emoticones y caracteres especiales, que muchas veces se usan para expresar emociones o reemplazar letras”, explica Angélica María, quien espera perfeccionar el prototipo y lanzarlo públicamente en el futuro.


De esta manera, el Sistema Colombiano de Detección de Ciberacoso en Twitter para Idioma Español Basado en Procesamiento de Lenguaje Natural (PLN) y Machine Learning (ML) es una prueba clara de que la tecnología, cuando se orienta con propósito, puede convertirse en una poderosa herramienta para enfrentar problemáticas sociales como el ciberacoso. Asimismo, esta innovación refleja el talento, la dedicación y la visión de Angélica María Agudelo Ortiz, así como el valor del entorno académico y humano que la acompañó en la Universidad del Valle.


¡Felicitaciones a Angélica María por este importante y valioso aporte al país!


Comentarios