Procesamiento del Lenguaje Natural: ¿cómo transformar los proyectos de participación?

Este artículo ha sido escrito en estrecha colaboración con los expertos en PLN de NLP Town, que nos apoyaron en nuestro propio viaje de PLN.

¿Los robots se apoderarán del mundo? Probablemente no. Sin embargo, el PLN (o Procesamiento de Lenguaje Natural) ya lo ha hecho. En los últimos años, una tecnología que era vacilante en el mejor de los casos, ha dado un gran salto adelante y ahora se está integrando en muchos de los servicios que usamos a diario.

Por supuesto, no estaríamos mencionando esto si no hubiera un vínculo con la tecnología civil. Al facilitar la manipulación y el procesamiento de grandes cantidades de texto, el PLN ofrece un gran potencial a las ciudades, gobiernos y organizaciones que quisieran utilizar el aporte de las personas en la toma de decisiones. En este artículo, le mostraremos lo que significa PLN, lo que podría significar para la participación ciudadana y lo que se puede esperar en los próximos años.

¿PLN?

El Procesamiento del Lenguaje Natural es una forma de inteligencia artificial (IA), que permite a las computadoras y al código procesar entradas complejas, que antes sólo eran comprensibles para los humanos. El PLN es una rama de la IA que se centra en el lenguaje natural, es decir, el lenguaje escrito y hablado utilizado por los seres humanos. En pocas palabras, analiza, entiende y produce texto. Aquí hay algunos ejemplos donde se utiliza hoy en día el PLN:

Traductores de texto como Google Translate o Deepl confían en el aprendizaje automático, para obtener una mejor comprensión del texto y proporcionar una traducción relevante, que va más allá de la simple traducción palabra por palabra.
La clasificación automática, es utilizada por la mayoría de los proveedores de correo electrónico para decidir qué correos electrónicos se envían a su carpeta de spam.
Los algoritmos de aprendizaje automático se utilizan para predecir el texto que vas a escribir y para sugerir palabras en los textos o correos electrónicos.

PLN en acción: la función de composición inteligente de gmail, predice lo que los usuarios están escribiendo

En el contexto de la toma de decisiones públicas, el PLN suele consistir en dar sentido al texto. La tecnología puede procesar el texto mucho más rápido que los humanos, lo que significa que puede extraer de forma rápida y fácil ideas significativas de grandes cantidades de datos. Esto significa que una ciudad/entidad que recogiera miles de contribuciones de los ciudadanos en una plataforma de participación, sería capaz de agrupar fácilmente las ideas y ver inmediatamente los principales temas de los que hablaron los ciudadanos, cuáles son los principales argumentos y dónde se ubicaron las ideas en toda la ciudad.

Establecimiento de procesos de PNL

El PLN se basa en un oscuro y bien guardado secreto: la tecnología sólo puede ser tan buena como el razonamiento humano que hay detrás de ella. Esto significa que es esencial tener mucho cuidado al establecer las técnicas de procesamiento del lenguaje natural. Las descripciones iniciales que lo alimenten y las bases de datos en las que lo entrenen, tendrán una influencia definitiva; constrúyanlo sobre información defectuosa y sólo dará resultados defectuosos.

En el contexto de las plataformas de participación ciudadana, aquí hay dos preguntas a las que debes prestar mucha atención cuando construyas tus algoritmos:

¿Cuál es el contexto? ¿De qué trata el texto – es un libro de cocina, o una discusión sobre política? ¿Es un largo texto formal, o cortos tweets con jerga y emojis?

¿Qué ideas quieres obtener? Hay múltiples objetivos finales posibles: algunos algoritmos resumirán los temas, otros mirarán las tendencias emocionales, otros trabajarán en la identificación de lugares…

Una vez que haya elegido la metodología que mejor se adapte a sus necesidades, querrá afinarla. ¿Por qué? Los parámetros utilizados en los algoritmos de PLN escogidos a mano, necesitan ser adaptados para obtener resultados precisos para su contexto y para la entrada de lenguaje natural que utilizará. Dependiendo del contexto, las palabras pueden tener diferentes significados. Piensa en la palabra “libro”, por ejemplo; significa algo completamente diferente cuando el texto es sobre una biblioteca o cuando es sobre un hotel. Además, la gente puede escribir o hablar de forma diferente dependiendo del contexto: un artículo de periódico no se escribirá en el mismo tono que los tweets.

A medida que entrena a su algoritmo en los conjuntos de datos, querrá compararlo con alguna salida manual. Una vez que los resultados del PLN se parezcan a los resultados manuales (‘perfectos’), tu algoritmo estará listo para ser utilizado. Este parecido se conoce como la ‘exactitud’ de tu algoritmo.

El PLN es una herramienta muy poderosa, pero tenemos que ser honestos, por supuesto que no es una tecnología perfecta. No puedes implementar a ciegas lo que te dice. Una precisión del 100% es casi imposible de alcanzar, lo que significa que siempre existe el riesgo de cometer errores y así llegar a conclusiones erróneas. Por lo tanto, el resultado de la tecnología de PLN debería ser considerado idealmente como un punto de partida, necesitando alguna verificación manual y un viejo razonamiento. Si su tecnología se está utilizando en una plataforma, es extremadamente útil pedir a sus usuarios su opinión y sobre las decisiones que tomen basadas en el resultado de PLN. Hacerlo así ampliará y fortalecerá sus datos de entrenamiento y por lo tanto aumentará la precisión de sus algoritmos de PLN y los mantendrá actualizados.

La inteligencia artificial en el contexto de la participación ciudadana

*Ideas publicadas en la plataforma de compromiso ciudadano de Vancouver*

El principal reto en los proyectos de participación ciudadana no es recoger los aportes de los ciudadanos o personas: es analizarlos. Las administraciones con exceso de trabajo y recursos insuficientes suelen carecer del tiempo y los conocimientos técnicos necesarios para procesar los aportes; como resultado, se pierden valiosas percepciones en el proceso. Al ayudar a las administraciones a procesar sin esfuerzo los aportes de los ciudadanos y extraer las ideas clave, el PLN podría ayudar a los gobiernos/organizaciones a tomar decisiones mejor informadas, ahorrando al mismo tiempo, tiempo y dinero.

Con el fin de ayudar a los gobiernos/organizaciones a hacer frente a este desafío, hemos integrado nuestra propia tecnología de PLN a la plataforma CitizenLab, ofreciendo así a los funcionarios un lugar centralizado para reunir, moderar y analizar las ideas de los ciudadanos. La tecnología que hemos implementado tiene cuatro vertientes principales, todas ellas centradas en el análisis de textos; en última instancia, todas ellas tienen como objetivo reducir el esfuerzo que supone el procesamiento de los datos.

Clasificación: para dar un contexto amplio al debate, la organización (ciudad, gobierno federal…) define sus propios temas o clases de antemano (por ejemplo, movilidad, bienestar, seguridad). Cada dato de los ciudadanos se añade automáticamente a una o más de estas clases. Una vez hecho esto, los administradores pueden reasignar fácilmente los aportes a sus colegas y descubrir qué temas necesitan más atención.

Similitudes: Cada dato de los ciudadanos se compara con todos los demás. Cuantas más palabras tengan en común, más similares serán, siempre que el significado de estas palabras sea el mismo. Esto evita la duplicación de contenidos y permite a los administradores agrupar a los usuarios en función de la similitud de sus aportes, descubriendo así patrones y perspectivas interesantes. Puede ser que todos los ancianos de un determinado barrio, hablen de su necesidad de una infraestructura más ecológica y adaptada, o que los jóvenes de otro barrio expresen su necesidad de más viviendas sociales.

REN: Reconocimiento de Entidades Nombradas es un tipo de PLN que vincula palabras o grupos de palabras con otra entidad – en nuestro caso, reconociendo los lugares que se mencionan en los comentarios y ubicándolos en un mapa. Transformar un nombre escrito de una calle o ciudad en coordenadas geográficas es un caso de uso obvio, pero también nos permite identificar “puntos calientes” geográficos, como un parque, una iglesia o un hospital y añadirle una ubicación.

Resumiendo: La síntesis es el siguiente paso natural a dar. Simplemente detecta todas las palabras o frases clave en las contribuciones, y resalta las ideas principales. Esto hace que sea fácil ver el panorama general, antes de decidir sumergirse.

*Localizar las ideas de los ciudadanos en un mapa*

**¿Qué es lo siguiente?**

¿Se detiene ahí? ¡Claro que no! El siempre evolutivo y constante mundo de PLN ofrece muchas más oportunidades, para mejorar la participación ciudadana y la toma de decisiones colectivas.

Como el Reconocimiento de Entidades Nombradas puede detectar lugares y puntos calientes, el PLN también puede identificar otros “valores” en trozos de texto. Lo más prometedor en el contexto de la participación ciudadana son el análisis de sentimientos, el análisis de argumentos y la tipología.

Cómo sugiere la redacción, el análisis de sentimientos es una forma de destilar las emociones dominantes en un trozo de texto. ¿Está esa persona enfadada, triste o esperanzada? El análisis de argumentos es perfecto para analizar una discusión que sigue a una idea, sugerencia u opinión y en la que participan varias personas. Transforma la contribución de cada participante de esa discusión en un argumento a favor, en contra o neutral y los agrupa en consecuencia. Y por último, un análisis de tipología identifica el tipo de texto que está mirando. ¿Es una sugerencia, una pregunta, una queja, una respuesta a un comentario previo… Todos estos detalles adicionales, ayudarán a las administraciones a tener una percepción más fina de lo que los ciudadanos están diciendo y adaptar su respuesta en consecuencia.

Para CitizenLab, otro gran paso a dar es ampliar el alcance de nuestras actuales tecnologías de PLN. Hoy por hoy se centra en el aporte escrito de los ciudadanos, con sus propios detalles. En el futuro, esa misma tecnología podría ser aplicada a otros tipos de aportes: planes estratégicos de la ciudad, presupuestos de la ciudad, discursos de los responsables locales, agendas y decisiones del consejo, artículos de noticias locales… lo que sea. El objetivo aquí sería cerrar el círculo: Un ciudadano que publique una idea sobre carriles bici en el centro de la ciudad, también podría descubrir lo que el alcalde ha dicho anteriormente sobre ello, lo que se ha planeado sobre este tema en la próxima reunión del consejo de la ciudad y cómo son los datos actuales sobre el ciclismo.

Finalmente, uno de los principales desafíos que enfrentamos es el factor humano detrás de la tecnología. Los gobiernos son un sector en el que puede ser difícil y lento implementar el cambio. Sabemos que la mejor de las plataformas, con los algoritmos más poderosos, sólo funcionará verdaderamente si es entendida y aceptada por los funcionarios públicos. Para resolver este problema, se nos ha concedido una de las subvenciones de inteligencia colectiva de Nesta, y utilizaremos los fondos para investigar cómo se utiliza actualmente la inteligencia artificial en los gobiernos.

Nesta es una fundación de innovación con sede en el Reino Unido. El plan de Inteligencia Colectiva otorga a proyectos de todo el mundo 20.000 libras para investigar la inteligencia colectiva.

Si tiene algún comentario o pregunta sobre nuestro trabajo, no dude en contactarnos! Siempre estamos buscando aportaciones para mejorar nuestro producto, y estaremos encantados de discutir ideas o nuevos estudios de casos.

Para recibir noticias regulares sobre CitizenLab y el sector civictech, suscríbase a nuestro newsletter.