«Perdido en la traducción»: Por qué el traductor de Google suele traducir mal el yoruba y otros idiomas

Grupo de usuarios de Wikimedia de Nigeria, en octubre de 2018. Wikimedia Commons (CC.BY.2.0).

Desde los inicios de internet, el inglés siempre ha sido la lengua de comunicación más utilizada en línea, el idioma «universal». De acuerdo a una estimación realizada en febrero de 2020, WebTech3 afirma que más de la mitad de todas las páginas web están en inglés.

Pero el creciente acceso a internet de internautas que hablan otras lenguas desató una revolución digital en el plano de los idiomas: con un solo clic, se puede acceder de inmediato a traducciones al inglés de múltiples idiomas.

Muchas empresas tecnológicas han realizado importantes esfuerzos para documentar palabras de otras lenguas en internet, lo que ha sentado las bases para la digitalización de muchos idiomas. Google, Yoruba Names, Masakhane MT y ALC son algunas compañías que están intentando asociar la tecnología con otros idiomas.

Tras cuatro años sin agregar ninguna lengua, a fines de febrero de 2020, Google anunció que añadiría cinco nuevos idiomas a su traductor automático, entre las cuales se cuentan el kiñaruanda, el uigur, el tártaro, el turcomano y el oriya.

Un hombre luce perplejo al leer un texto en internet. Foto de Oladimeji Ajegbile. Fuente: Pexels (uso libre).

Pero ¿alguna vez activaron la traducción automática y se dieron cuenta de que, en el mejor de los casos, el resultado era apenas aceptable, y, en el peor, totalmente desacertado?

Hay mucha controversia y muchos obstáculos con estas traducciones.

Twitter utiliza el servicio de traducción del yoruba al inglés de Google Translate y en general el resultado no es tan malo: tal vez, algunas palabras sean correctas.

Se trata de un gran reto ya que las empresas tecnológicas suelen recopilar datos lingüísticos para las traducciones al inglés desde internet. Estos datos pueden funcionar con algunos idiomas, pero hay lenguas como el yoruba o el igbo, dos idiomas muy importantes en Nigeria, que plantean muchos desafíos debido a los errores que se cometen al indicar los acentos tónicos de las palabras.

Para explicar por qué Google tardó cuatro años en agregar cinco idiomas nuevos, uno de los portavoces de la compañía explicó:

 Google Translate learns from existing translations found on the web, and when languages don’t have an abundance of web content, it’s been difficult for our system to support them effectively. … However, due to recent advances in our machine learning technology, and active involvement from our Google Translate Community members, we’ve been able to add support for these languages.

Google Translate se va perfeccionando a partir de las traducciones existentes en la red y, cuando un idioma no tiene suficiente contenido en línea, resulta difícil que nuestro sistema lo procese de manera efectiva. […] Sin embargo, gracias a los recientes avances de nuestra tecnología de aprendizaje automático y a la colaboración activa de nuestra comunidad de miembros de Google Translate, también hemos podido implementar la traducción automática para estos idiomas.

A su vez, muchos hablantes de este idioma suelen escribir con faltas de ortografía. Por esta razón, es difícil obtener traducciones adecuadas dado que estos errores no se detectan como incorrectos.

La mayoría de los traductores automáticos traduce mal algunas palabras, especialmente las que presentan matices culturales. Por ejemplo, en yoruba, el sentido de palabras como ayaba o obabìnrin depende de un contexto cultural preciso. La mayoría de los traductores automáticos traduce ambas palabras como «reina». Sin embargo, desde un punto de vista tradicional y cultural, resulta esencial diferenciar ambos términos: obabìnrin significa «reina» mientras que ayaba quiere decir «esposa del rey».

A pesar de estas dificultades terminológicas, la tecnología ha ayudado a que los idiomas africanos conquisten más espacios digitales gracias a la creación de nuevas palabras. Los idiomas africanos han crecido a partir de la influencia de nuevos dispositivos como los smartphones o las tablets, ya que, a medida que surgen nuevos conceptos y dispositivos tecnológicos, se van acuñando nuevas palabras. Este proceso logró expandir el uso y las funciones de estos idiomas.

Con la aparición de nuevas tecnologías, el vocabulario de muchos idiomas africanos se fue volviendo cada vez más sofisticado. Por ejemplo, el yoruba cuenta con algunas palabras influenciadas por la tecnología como erọ amúlétutù (aire acondicionado), erọ Ìbánisọ̀rọ̀ (teléfono) o erọ Ìlọta (molinillo/picadora). Del mismo modo, el igbo posee palabras como ekwè nti (teléfono) y ugbọ̀ àlà (vehículo). Estas sociedades han nombrado los dispositivos a partir de sus funciones.

En cursos de comunicación y publicidad en yoruba, los estudiantes aprenden que la mayoría de las personas utiliza la palabra erọ Amóhùnmáwòrán para referirse a la televisión. Este término genera muchos cuestionamientos y opiniones: algunos estudiantes sostienen que también se puede llamar de esa manera a las videocámaras y grabadoras según sus funciones.

Estos desafíos lingüísticos del ámbito tecnológico son saludables para los idiomas: estimulan el pensamiento crítico acerca de los avances lingüísticos y también tecnológicos.

En 2019, Google abrió su primer centro de investigación en inteligencia artificial (IA) en Acra, Ghana, con el objetivo de mejorar «la capacidad de Google Translate para analizar idiomas africanos de manera más precisa», según CNN. El científico e investigador Moustapha Cisse, que lidera los estudios de inteligencia artificial en África, manifestó que «un continente con más de 2000 dialectos merece una mayor atención».

Recientemente, Mozilla y BMZ anunciaron que cooperarán en el desarrollo de tecnología de voz para idiomas africanos. Iniciativas de este tipo son muy positivas para el futuro de la investigación de los idiomas africanos.

1 comentario

  • Marcela Romero Besson

    Hola, muy buen proyecto! estaba buscando el significado del nombre «Adika», que dicen que es ghanés, pero ahí descubrí que el traductor de google no tiene la opción de traducir del ghanés…
    Capaz que ustedes me pueden ayudar con eso =)

Cancela esta respuesta

Únete a la conversación -> Marcela Romero Besson

Autores, por favor Conectarse »

Guías

  • Por favor, trata a los demás con respeto. No se aprobarán los comentarios que contengan ofensas, groserías y ataque personales.