Un grupo de investigación peruano ha desarrollado un software conversor de texto a voz que puede transformar una frase en quechua, y que con el uso de un reproductor de sonido hace sonora la palabra del día que luego difunde en la lengua indígena a través de las redes sociales, como YouTube, Twitter y Facebook.
Hinantin, con sede en Cusco, Perú, se dedica a la investigación y desarrollo de software en el área de lingüística computacional y promueve el uso de las lenguas autóctonas del Perú, pues poco a poco van perdiendo hablantes.
Conversamos con Richard Castro, uno de los miembros fundadores de Hinantin, quien nos explicó que lo que hacen primero es desarrollar software relacionado de algún modo con quechua, como el conversor de texto a voz para el quechua cusqueño, que puede transformar el texto en habla automáticamente; el corrector ortográfico en línea y para LibreOffice.
Específicamente, el proyecto de conversión de texto a voz toma una frase en quechua y con el uso de un reproductor de sonido hace sonora la palabra del día y la difunde a través de las redes sociales. La cuenta en Instagram también contiene imágenes con la palabra del día y su significado en diferentes idiomas. Los podcasts se pueden escuchar en SoundCloud, como se puede apreciar en este audio con la palabra wayra, ‘viento':
En este video de YouTube, enseñan a pronunciar la palabra wayma, morado:
El proceso de elaboración consiste de un corpus o colección de texto y audio para el quechua. El proyecto se concentra en el quechua cusqueño, puneño y limeño pues los traductores encargados de esta etapa del proceso provienen de esas regiones. Quienes prestan su voz en audios usan sus respectivas formas de hablar, aunque el sistema de escritura utilizado para presentar los audios en los videos y podcasts es el quechua sureño unificado.
Cada uno de los traductores puede usar el sistema de escritura de su elección, pues los textos que introducen en el sistema son normalizados automáticamente al quechua sureño. Miembros del proyecto comparan las traducciones con los traductores automáticos para el quechua que tienen disponibles para verificar sus defectos o ventajas.
Uno de los objetivos del corpus o colección de texto y audio es que sea utilizado en la enseñanza electrónica del quechua a través de la plataforma llamada RunaSimi. Con ese fin, se ha destinado específicamente un subgrupo del corpus de texto y audio.
El grupo también coopera en el desarrollo de otros programas relacionados con el quechua, asháninka y aymara.
Dado que las lenguas indígenas conforman el patrimonio cultural del Peru, su valoración y uso forman parte de las políticas de promoción de la diversidad e interculturalidad. Se calcula que en el país existen más de 50 lenguas nativas vivas y otras varias ya extintas. El Ministerio de Cultura ha elaborado el Documento Nacional de Lenguas Indígenas que contiene datos oficiales sobre lenguas y sus hablantes. Asimismo, contiene lugares dónde aprenderlas y un mapa sonoro estadístico de las lenguas indígenas u originarias.