«Descolonizar» la lengua con inteligencia artificial

Ilustración de Both Nomads/DALL·E 2, usada con autorización.

Necesitamos encontrar un nuevo lenguaje, un nuevo discurso, una nueva visión del mundo, así como las herramientas para crear las palabras que superen el «gran discurso humanitario». ¿Podría ayudar la tecnología?

En febrero, muchos hemos oído hablar sobre las funciones «salidas de Matrix» del nuevo ChatGPT que funciona con inteligencia artificial (IA) y que deja a los ciudadanos inquietos, estupefactos y en varios otros estados emocionales, que oscilan entre el miedo y el entusiasmo.

El uso de IA sigue siendo un rubro especializado para la mayoría de organizaciones y activistas de la sociedad civil. Aún así, están apareciendo numerosas iniciativas que emplean tecnologías emergentes e inteligencia artificial para «desconolonizar» la lengua, especialmente en el sector del desarrollo.

¿Es colonial la lengua de desarrollo?

La cuestión de si la lengua de desarrollo es colonial es un debate complejo. La imposición de lenguas y culturas europeas en las poblaciones colonizadas ha sido un elemento clave del colonialismo. Los poderes colonizadores impusieron sus lenguas, a menudo, en detrimento de las lenguas indígenas. La lengua de desarrollo puede considerarse como la continuación de este legado, pues frecuentemente excluye las lenguas indígenas y minoritarias, y refuerza patrones de dominación lingüística y cultural.

«La lengua es una parte fundamental de la identidad y herencia cultural de una comunidad. Según se pierden estas lenguas, se pierde una parte de nuestra historia y cultura colectivas. La tecnología puede ayudarnos a conservar y promover estas lenguas, si bien debemos hacerlo de una forma respetuosa e inclusiva», comenta Anju Mari Paul, investigador líder de FirstVoices, plataforma que incluye un archivo de lenguas impulsado por IA que permite a los usuarios buscar y acceder tanto a audio como a grabaciones de video de lenguas indígenas.

«Es un problema emplear francés o inglés como lenguas de desarrollo, mientras que en ciertas comunidades, como en África, se tienen diversas lenguas tribales. ¿Qué ocurre cuando el pueblo no entiende el idioma que usan?», pregunta el doctor Moses Isooba, director ejecutivo del Foro Nacional de ONG de Uganda (UNNGOF, por su nombre en inglés).

Prototipo de lengua y léxico

Isooba forma parte del equipo de desarrollo de un prototipo de lengua y léxico que emplea IA para posibilitar una comunicación más inclusiva que sea menos (o no) implícitamente neocolonial, sexista o racista. La idea es explorar la aplicación de la IA con el fin de rectificar y reemplazar el léxico peyorativo de la jerga, expresiones y terminología «impuesta» a las organizaciones de la sociedad civil que participan en el conglomerado de la ayuda internacional y el sector del desarrollo.

El equipo está diseñando el léxico para cambiar el poder de dos formas: por un lado, suprime el lenguaje problemático a la vez que se alienta una comunicación más inclusiva a través de la función de estilo encontrar y reemplazar; y, por otro lado, permite a la población emplear su propia lengua local, para lo que han probado con Luganda, lengua comúnmente hablada en Uganda.

Reminiscencias de la era colonial serían términos como «funcionario» y «en el campo». Las organizaciones humanitarias internacionales a menudo se refieren a sus oficinas en los países en desarrollo como «oficinas del país», término similar a aquel que se refiere a los puestos fronterizos coloniales, «funcionan como la cuerda que nos ata al barco colonial», menciona el doctor Isooba. Explica:

Decolonising language is critically important because language sets the terms of engagement between the north and south. In as much as possible language should be depoliticized and decolonized. Development and humanitarian assistance are political, but our language should remain nonpartisan. Political parties will come and go, but inequalities will remain if our language begins to mirror that of the people in power, especially if the intentions behind the rhetoric are disingenuous.”

Descolonizar la lengua es de vital importancia, pues la lengua establece los términos de compromiso entre el norte y el sur. La lengua debería, en la medida de lo posible, ser despolitizada y descolonializada. La asistencia humanitaria y de desarrollo es política pero nuestro idioma debería permanecer imparcial. Los partidos políticos van y vienen, pero la desigualdad permanecerá si nuestra lengua comienza a reflejar la del poder, especialmente si las intenciones tras la retórica son hipócritas.

Ilustración de Both Nomads/DALL·E 2, usada con autorización.

No podemos hablar solo con acrónimos

“La lengua de desarrollo se ha llenado tanto de jerga que incluso nuestras propias familias ya no entienden en qué estamos trabajando», explica Harsh Jaitli, de la Red de Acción Voluntaria de la India (VANI, en inglés).

La lengua se encuentra entre las herramientas más antiguas que tenemos, para bien y para mal. En un universo en línea plagado de desinformación y ataques, algunos activistas y organizaciones de la sociedad civil están centrándose ahora en «nuevas narrativas» para expandir más que reducir el espacio cívico.

En los últimos años, varias iniciativas y organizaciones han estado trabajando en la conexión entre la IA y el lenguaje. Masakhane, por ejemplo, es una iniciativa de base impulsada por la comunidad que trabaja para construir herramientas y modelos de Procesamiento del Lenguaje Natural (NLP) para lenguas africanas, con el fin de preservarlas y promocionarlas en la era digital. La traducción e interpretación forman parte del juego y las organizaciones trabajan para ampliar el espectro, por ejemplo con este glosario gratuito de terminología del desarrollo Chichewa- Inglés. AI for the People (Inteligencia Artificial para el Pueblo) aboga por un desarrollo y despliegue más inclusivo e igualitario de las tecnologías de IA. Además, ofrece recursos y cursos para involucrar a las comunidades en inteligencia artificial.

Sin embargo, de acuerdo con NeuralSpace, plataforma que ayuda a reducir la brecha lingüística en tecnología, el 90 % de las soluciones NLP están disponibles exclusivamente en lenguas europeas. La IA tiene el potencial de derribar las barreras del lenguaje para los 6000 millones de personas restantes al contrarrestar esta forma de «apartheid digital». ¿Cómo? Superando las barreras lingüísticas con, por ejemplo, sistemas de traducción completos o aplicaciones de aprendizaje de idiomas. Otras formas incluyen la creación de archivos digitales que involucran reconocimiento óptico de caracteres o reconocimiento de voz y hacen que el contenido esté disponible en idiomas nativos en lugar de en las omnipresentes lenguas «coloniales».

Todo esto suena demasiado bueno para ser verdad. Antes de que la IA pueda descolonizar la lengua, la Inteligencia Artificial debe ser descolonizada.

La paradoja de la IA

La inteligencia artificial tiene el potencial de transformar cómo nos comunicamos, pero también es el transmisor perfecto para exacerbar sesgos ya existentes. «Necesitamos abordar los problemas de sesgo en los modelos de lenguaje y asegurar que son inclusivos y representan a todos los usuarios», dice Soujanya Poria, profesora asistencia en la Universidad Tecnológica de Nanyang.

Es posible que el lenguaje en el que se entrena la IA ya esté «distorsionado» y no logre reemplazar el sesgado pensamiento y comportamiento humano.

«La descolonización del lenguaje es de vital importancia para empoderar comunidades y desafiar las narrativas dominantes. La tecnología tiene el potencial de ser una herramienta poderosa en este proceso, pero debemos cuidarnos de no replicar los mismos patrones de exclusión y marginalización que estamos tratando de superar», dice el doctor Isooba.

Preguntamos a ChatGPT si la IA podría replicar un lenguaje colonial, racista o sexista y esta fue su respuesta:

As an artificial intelligence language model, I am not capable of holding or expressing personal beliefs, values, or biases. However, I acknowledge that the data used to train me may contain biases and I strive to provide information that is accurate, unbiased, and inclusive. It is important to note that it is people who program and use AI, and they can unintentionally embed their own biases in the development and use of AI systems. Therefore, it is crucial to be aware of these potential biases and strive to create and use AI systems in an ethical, inclusive, and responsible manner.

Como modelo de lenguaje de inteligencia artificial, no puedo sostener o expresar creencias personales, valores o sesgos. Sin embargo, reconozco que los datos usados en mi formación pueden contener sesgos y me esfuerzo por brindar información que sea precisa, imparcial e inclusiva. Es importante tener en cuenta que son humanos los que programan y usan IA y pueden incluir sus propios sesgos en el desarrollo y uso de los sistemas de IA. De ahí que sea vital ser consciente de estos posibles sesgos y esforzarse por crear y usar sistemas de IA de forma ética, inclusiva y responsable.

En palabras de Timnit Gebru, de Black in AI, tenemos que alejarnos de pensar en datos «limpios» y «sucios» y acercarnos a un pensamiento sobre datos que reflejen la diversidad del mundo real.

«Una de las mejores formas de hacerlo es construyendo equipos diversos de científicos de datos que puedan reconocer y abordar sus propios sesgos», dice.

Sabelo Mhlambi y otros académicos han redactado hace poco el Manifiesto de IA descolonial con el fin de «ir más allá de los sesgos centrados en Occidente» y crear «futuros sociotécnicos dignos». La sociedad civil, además, se está involucrando cada vez más en el desarrollo de la IA, participando activamente en debates públicos y en relación con las implicaciones éticas, sociales y políticas de la tecnología de IA. Aún así, varios líderes de la sociedad y activistas, como Mwarimū Mūtemi wa Kīama de Kenia, arrestado por sus tuits, argumentan que la exclusión deliberada de las voces marginadas de procesos de toma de decisiones tecnológicas es una forma de violencia estructural.

«Debemos reconocer que el acceso a la tecnología es un derecho humano, así como trabajar para asegurar que todos tengan un lugar en la mesa» dice Kīama.

Dianne Olivian, activista de género y derechos digitales, nos cuenta cómo los marginados son «aislados» de los entornos de toma de decisiones porque estos espacios se mueven en un marco neocolonial:

Those who usually participate in these conversations also have the privilege to participate; they have the economic and cultural capital to contribute and thrive. There are of course attempts to be representative and inclusive, but we should ask: Where are these conversations happening? What do I need to have to participate? In what language are they sharing meaning? Whose voices are the loudest in the room? What happens after these conversations, what is the accountability framework?

Quienes suelen participar en estas conversaciones también tienen el privilegio de participar; tienen el capital económico y cultural para contribuir y prosperar. Por supuesto, hay intentos de ser representativos e inclusivos, pero deberíamos preguntarnos: ¿Dónde se llevan a cabo esas conversaciones? ¿Qué necesito tener para participar? ¿En qué idioma se difunden las ideas? ¿De quiénes son las voces más fuertes en la sala? ¿Qué ocurre después de esas conversaciones, qué es el marco de la responsabilidad?

Después de estas reuniones «consultivas» sobre formulación de políticas en derechos digitales y gobernabilidad de internet, volveremos a las mismas estructuras de poder digital que permiten y no permiten la información a la que accedemos y retenemos, y qué identidades se permiten existir en estas plataformas, dice Olivian:

Truly inclusive digital communities and infrastructure require transformative lens from their inception – they reject a capitalist internet. They are driven by creativity, sharing, care, consent, and well-being; they challenge and circumvent infrastructures of surveillance. And we will build that by first, shifting our focus from working towards being accepted by the loudest, most articulate voices in a stingy meeting room, to holding space and looking for those who are not even able to go through the door.

Infraestructuras y comunidades digitales realmente inclusivas requieren unas lentes transformadoras desde su inicio: rechazan una internet capitalista. Están impulsados por la creatividad, el intercambio, el cuidado, el consentimiento y bienestar; desafían y eluden las infraestructuras de vigilancia. Nosotros construiremos eso primero, cambiaremos nuestro enfoque de trabajo para que sea aceptado por las voces más fuertes y más articuladas en una sala de reuniones mediocre, a mantener el espacio y buscar a quienes ni siquiera pueden entrar por la puerta.

Inicia la conversación

Autores, por favor Conectarse »

Guías

  • Por favor, trata a los demás con respeto. No se aprobarán los comentarios que contengan ofensas, groserías y ataque personales.