Presentamos DigiGlot, boletín sobre lenguas y tecnología

Elmo Bautista y su padre, Espíritu Bautista, ya fallecido, graban de forma digital palabras en lengua yanesha de Perú durante talleres organizados por el Instituto Lenguas Vivas. Fotografía de Eddie Avila, reproducida con autorización.

Bienvenidos a la primera edición de DigiGlot, boletín quincenal colaborativo que informa sobre cómo las comunidades de lenguas indígenas, minoritarias y en peligro adoptan y adaptan la tecnología para aumentar la presencia digital de sus lenguas, y también cambiar la escena actual en internet al aumentar la diversidad lingüística en línea. Esta publicación colaborativa será recopilada por un equipo de voluntarios. Los nombres de los colaboradores aparecerán al final de cada número.

Por ser nuestra primera entrega, esperamos que el formato y contenido de DigiGlot mejoren en los próximos meses. Estamos atentos a los comentarios de nuestros lectores y estamos abiertos a sugerencias de temas a ser tratados en futuras ediciones. Pueden ponerse en contacto con nosotros a través de la página de contacto de Rising Voices.

Tecnología y activismo digital en la agenda para el Año Internacional de las Lenguas Indígenas

Con la llegada de 2019, se inició oficialmente al Año Internacional de las Lenguas Indígenas. En diciembre de 2016, la Asamblea General de las Naciones Unidas declaró que 2019 sería dedicado a una campaña de concientización coordinada por la UNESCO y que se enfocaría en cinco áreas, que incluyen la capacidad de generar y aumentar la cooperación internacional. Se está formando un consorcio de organizaciones relacionadas con las lenguas para destacar la campaña en las redes sociales con la etiqueta #IYIL2019. Además de la campaña, UNESCO abrió una convocatoria para la presentación de trabajos de investigación, y uno de los temas principales es «Tecnología, activismo digital e inteligencia artificial (por ejemplo, las tecnologías del lenguaje)».

¿Los caracteres latinos «extendidos» haciendo que el crecimiento de las páginas de Wikipedia africanas sea más lento? 

Uno de los legados inmediatos del colonialismo europeo en la África actual es un mosaico desamalgamado de sistemas de escritura para las lenguas locales.Si bien muchas lenguas africanas han utilizado el alfabeto latino durante varias décadas, las lenguas han cambiado notablemente en el uso que hacen de caracteres especiales y acentos, o lo que se conoce como caracteres latinos «extendidos». Hasta existían casos de lenguas que se escribían diferente en cada lado de las fronteras nacionales. En esta serie de ensayos [parte 1, 2 y 3], Don Osborn analiza la normalización de lengua africana durante cuatro décadas y explica el impacto que podrían haber tenido algunas decisiones precoces sobre la ortografía en la producción actual de medios digitales.

Osborn propone que el desafío que se presentó mediante el uso de ortografías latinas extendidas, que son las que fuerzan a los usuarios a hacerse camino a través de una interfaz de entrada sin normalizar para escribir los caracteres «especiales en su propia lengua, podrían ser las responsables de limitar el desarrollo de algunas versiones africanas de Wikipedia. Su analisis concluye que las versiones de Wikipedia africanas «escritas en latín extendido y complejo componen, en promedio, un tercio del número de artículos» en comparación con los escritos con un alfabeto latino más sencillo. Si bien Osborn reconoce que se trata de un análisis preliminar, sus observaciones resultan útiles para poner de manifiesto algunas complejidades que salen a la luz al construir ecologías digitales en lenguas locales.

El selector de idioma universal de Wikipedia agrega tres lenguas de África Occidental

El nigeriano Ayokunle Odedere es miembro de Wikipedia y coordinador de la plataforma Wikimedia desde Ibadan, Nigeria. Además, organiza y acciona actividades y campañas, como el reciente proyecto AfroCine. Mientras trabajaba en Wikipedia, Odedere notó que tanto editores nuevos como experimentados tenían problemas al escribir los artículos de Wikipedia en las lenguas nacionales como yoruba, hausa e igbo cuando debían recurrir al uso de los necesarios signos diacríticos.

Si bien existen teclados especiales como el Yoruba Name para Mac y Windows, además de otros teclados virtuales que permiten al usuario visualizar estos caracteres especiales, es necesario contar con algunos conocimientos técnicos para instalarlos y utilizarlos. Odedere ideó una solución, integrada directamente a Wikipedia. Solicitó la incorporación del yoruba, hausa e igbo en el Selector Universal de Lenguas (ULS, por sus siglas en inglés) a través de la plataforma Wikimedia Community Wishlist (lista de deseos de la comunidad de Wikipedia), función disponible para Wikipedia y otros proyectos de Wikimedia que “permite a los usuarios tipear en diferentes lenguas que no están disponibles directamente a través de sus teclados, leer contenido en una plantilla para el que las fuentes no están disponibles de forma local o personalizar el idioma en que se muestra el menú». El pedido fue aprobado y el equipo de lenguas de la Fundación Wikimedia incluyó a las tres lenguas de África Occidental en el ULS. Ahora, los editores de Wikipedia que utilizan una computadora de escritorio o portátil pueden incorporar los caracteres especiales en sus textos con solo tipear el carácter tilde (~) antes de cada letra correspondiente.

Modernización de los textos en hawaiano con solo apretar un botón 

El hawaiano tiene una larga tradición escrita, con más de 125 000 páginas de periódicos publicadas durante el siglo XIX y el comienzo del siglo XX. Desafortunadamente, la mayor parte de esos textos fueron escritos en una ortografía diseñada por los misioneros que, a diferencia de la ortografía moderna, no refleja con precisión el sistema fonético de la lengua. Esto se traduce en que la lectura de esos textos antiguos resulta compleja para los hablantes actuales y, además, no están disponibles para entrenar los sistemas de procesamiento de lenguaje natural. En este trabajo de investigadores de la Universidad de Oxford y Google Deep Mind se expone un sistema que combina lo que se conoce como «transductores de estados finitos», una tecnología muy conocida en este campo, con el aprendizaje profundo para desarrollar un sistema que modernice de forma automática textos en hawaiano. Este enfoque podría aplicarse a un gran número de lenguas que han sufrido cambios ortográficos o estandarización.

¿Hablarán Siri y Alexa en galés en algún momento? 

El ministro de idioma galés, Eluned Morgan, ha remarcado la importancia de que los altavoces inteligentes y dispositivos ejecutados mediante la voz del usuario como Alexa y Siri estén disponibles para los hablantes de galés. Este objetivo forma parte del plan de acción gubernamental para la Tecnología de la Lengua Galesa, que se lanzó el 23 de octubre de 2018.

Este plan reconoce el papel que juega la tecnología en la vida diaria de las personas y la importancia para los hablantes de galés de poder hacer uso de su lengua al interactuar con esta tecnología: «Queremos que las personas puedan utilizar con facilidad en sus vidas virtuales tanto el galés y como el inglés, ya sea en los hogares, como en la escuela o el trabajo, e inclusive cuando están en movimiento». La ley de Tecnología para la lengua galesa sugiere el desarrollo de inteligencia artificial para que las máquinas puedan comprender el galés hablado, y también el mejoramiento de la traducción asistida por computadora como parte de un objetivo gubernamental más amplio de contar con un millón de hablantes de galés hacia 2050.

Tecnologías de reconocimiento por voz ayudan a documentar la lengua séneca

Un equipo de investigadores del Instituto de Tecnología de Rochester, Estados Unidos, está desarrollando tecnología de reconocimiento por voz para asistir a la documentación y transcripción de la lengua séneca. Séneca es una lengua nativa americana amenazada: cuenta con menos de 50 hablantes que manejan la lengua con fluidez, por lo que resulta de suma urgencia la documentación y preservación de la lengua. Puesto que las grabaciones y transcripciones manuales del discurso es costoso y lleva mucho tiempo, los investigadores buscan recurrir a la tecnología de reconocimiento por voz para asistirlos con esta tarea.

La tecnología de reconocimiento por voz es un proceso tecnológico que reconoce los sonidos producidos por la voz y humana y los transcribe de forma automática en texto escrito. El desarrollo de sistemas de reconocimiento por voz para lenguas con escasas fuentes de información es un desafío, porque estos sistemas necesitan gran cantidad de información para el «entrenamiento» que les permite reconocer la lengua. Para el desarrollo de esta investigación de punta, el equipo recibió 181 682 dólares durante cuatro años gracias a la Fundación Nacional de Ciencia de Estados Unidos.

Próximas actividades y oportunidades 

Han colaborado en la elaboración de este artículo Anna Belew, Derek Lackaff, Kevin Scannell, Claudia Soria y Eddie Avila, con la asistencia editorial de Georgia Popplewell.

Inicia la conversación

Autores, por favor Conectarse »

Guías

  • Por favor, trata a los demás con respeto. No se aprobarán los comentarios que contengan ofensas, groserías y ataque personales.