- Global Voices en Español - https://es.globalvoices.org -

Herramientas digitales para el galés

Categorías: Europa Occidental, Reino Unido, Lenguaje, Medios ciudadanos, Tecnología

Esta entrada forma parte de una edición especial de Global Voices sobre El galés y medios digitales [1] [en], en colaboración con Hacio'r Iaith [2].

Siempre que asisto a un encuentro internacional me sorprende ver cómo el inglés se ha convertido en el principal idioma de comunicación. Ha pasado a ser el segundo idioma de todo el mundo y en ciertos ámbitos es difícil oír otra lengua, sobre todo cuando se trata de idiomas minoritarios como el galés [3].

Un ámbito que el inglés lleva dominando desde el principio es el de la informática e internet. Pero los nuevos medios digitales también dan la oportunidad de utilizar, oír y leer otras lenguas.

The author of this post, Delyth Prys (pictured right, with the Welsh Minister for Education) is the Head of the Language Technology Unit (@techiaith) based at Canolfan Bedwyr, Bangor University, Wales. An experienced terminologist, she leads a mixed team of linguists and software developers working with Welsh in a multilingual environment.

La autora de esta entrada, Delyth Prys (a la derecha de la foto, junto con el ministro galés de Educación) es la Directora de la Language Technology Unit (@techiaith) de la Canolfan Bedwyr, Universidad de Bangor (Gales). Es una terminóloga con experiencia que dirige un equipo mixto de lingüistas y desarrolladores de software que trabajan con el galés en un ambiente multicultural.

Desarrollando recursos lingüísticos

Parte del reto al que se enfrenta el galés es el de desarrollar recursos lingüísticos para que se pueda utilizar este idioma en la red y en los medios digitales de un modo sencillo. Las lenguas mayoritarias consiguen mucha financiación, pero las minoritarias tienen que trabajar con más eficacia, reutilizar recursos y hacer que éstos rindan.

Empezamos a trabajar en una terminología galesa en 1993, y lo primero que hicimos fue desarrollar un corrector ortográfico y gramatical del galés. Hemos reutilizado muchos de los recursos creados durante los primeros años y los fuimos perfeccionando a medida que la tecnología fue mejorando y que internet se convirtiera en una parte importante de nuestras vidas.

Una de las primeras decisiones clave que tomamos fue utilizar una base de datos informatizada en la que almacenar y desarrollar la terminología, en vez de hacerlo de la forma tradicional en papel. Esto nos permitió continuar creando diccionarios y publicarlos de una forma rápida y barata en formato CD, en internet y, más recientemente, en forma de aplicaciones para móviles.

El último diccionario no está disponible en papel, y en Termiadur Addysg [4] [cy, en] se está planeando incluir juegos y otros materiales para estudiantes, profesores y padres. También ha sido el punto de partida para Termau.org [5] [cy, en], un portal terminológico nacional desde el que se puede tener acceso a más de veinte diccionarios terminológicos a la vez.

El reciclaje no termina ahí. Utilizamos las listas de palabras para mejorar nuestros correctores ortográficos y gramaticales y para producirlos en múltiples formatos, tanto para procesadores de texto comerciales como de código abierto. Nuestro proprio software Cysgliad [6] [cy] ha resultado ser muy popular, incluidos tanto Cysill [7] (corrector ortográfico y gramatical) como Cysgeir [8] (compendio de diccionarios electrónicos).

Cysgliad Spellchecker and Dictionary

La versión gratuita en internet [9] [cy] de Cysill es muy utilizada por blogueros y tuiteros, así como por niños, estudiantes  e incluso periodistas. Estas herramientas son de gran ayuda para los escritores de lenguas minoritarias que a menudo no se sienten seguros escribiendo en su lengua natal porque está excluida de gran parte de la vida pública y oficial.

Los años noventa fueron muy buenos para el galés. Por un lado, se promulgó la nueva Ley sobre el idioma galés de 1993 [10] [en], con la que el estatus de esta lengua mejoró mucho, y, por otro, se creó, en 1998, la Asamblea Nacional Galesa [11] [en], con la que se proporcionó a Gales un autogobierno limitado.

En 1995 tuvo lugar un tercer suceso importante: la publicación del diccionario de la Academia Galesa. Este completo diccionario inglés-galés ha sido muy importante para ayudar a traductores y administradores a formular políticas bilingües en Gales. Sin embargo, revisarlo y actualizarlo de la forma tradicional sería un proceso lento y costoso. En vez de eso lo digitalizamos, con lo que creamos tanto una versión en línea, a la que se puede acceder gratuitamente [12] [cy] a través de internet, como una base de datos principal en la que resultará sencillo hacer cambios.

WISPR Speech Technology

Tecnología del habla WISPR

Tecnologías del habla y traducción

Las tecnologías del habla son otra área en la que hemos intentado desarrollar recursos para el galés. Debido al reducido tamaño del mercado galés, resultó difícil conseguir apoyos económicos para tal empresa. Sin embargo, mediante la colaboración con colegas irlandeses de tres universidades de Dublín y gracias a la ayuda de una subvención de la Unión Europea, pudimos desarrollar recursos tanto para el galés como para el irlandés.

Este proyecto recibió el nombre de WISPR [13] [en, recursos para el procesamiento de voz del galés y el irlandés, por sus siglas en inglés] y llevó a la creación de recursos de sintetización de voz tanto para el galés como para el irlandés. Los recursos para el galés son de licencia libre para que se puedan incorporar a programas desarrollados por otros proveedores. Por ejemplo, Ivona [14] [en], una compañía polaca de sintetización de voz ha utilizado estos recursos para crear voces galesas de un sonido natural. Asimismo, RNIB Cymru [15] [en], una asociación de apoyo a las personas ciegas y con deficiencias visuales, trabaja con estos recursos para desarrollar una tecnología que mejore la accesibilidad a la red para las personas con discapacidades visuales.

 Más recientemente, hemos estado pensando en una tecnología de traducción entre el inglés y el galés. Estamos participando en un nuevo proyecto en colaboración con la Biblioteca Nacional de Gales [16] [cy, en] y otras instituciones para colgar documentos de la Primera Guerra Mundial en la red [17] [en, cy] . Parte de este material está en galés, y hasta ahora las personas que no hablan este idioma han tenido dificultades para utilizarlo. Estamos desarrollando motores para realizar búsquedas multilingües de modo que, si alguien busca una batalla concreta, por ejemplo, el programa muestre el material disponible sobre ella en ambas lenguas. También proporcionaremos una traducción general en inglés y un diccionario bilingüe. Prevemos muchos más usos para estos motores de manera que la gente vea que puede utilizar su propio idioma en la red y, aun así, llegar a un público más amplio.

Hay muchas más cosas que nos gustaría hacer para permitir que el galés prospere en el nuevo mundo multimedia. Con el rápido avance de las tecnologías debemos asegurarnos que el galés no se quede atrás. Conseguir financiación y encontrar a personas con las capacidades necesarias sigue siendo un reto, pero compartir y reutilizar los recursos permite hacer mucho con poco. Formar parte de una comunidad global ayuda a todos los idiomas minoritarios, y el siguiente desafío será mantener una colaboración más estrecha con otras comunidades que se encuentren en una situación parecida.