Aficionados de la tecnología quieren que tu teléfono te hable en suajili

Foto tomada por Eli Duke via Flickr (CC BY-SA 2.0).

Con una cantidad estimada de 100 millones de hablantes, el suajili es, después del árabe, el segundo idioma más hablado en el continente africano. Aun así, servicios como el reconocimiento automático del habla (RAH) no están disponibles en ese idioma, lo que impide que diversos usuarios con discapacidades o que no saben leer no obtengan la información que necesitan en sus vidas diarias. Esto podría cambiar muy pronto, ya que investigaciones y empresas nuevas de tecnología se están uniendo para brindar tecnologías localizados a los hablantes del suajili.

Búsqueda en internet desde un teléfono móvil

Una de estas innovaciones prometedoras está a punto de lanzarse en Kenia. Uliza (que significa «preguntar» en suajili) es una interfaz con voz que permite a los usuarios tener acceso a información en internet desde un teléfono celular muy básico.

Lo único que necesitan hacer los usuarios es llamar y preguntar algo en suajili. Al cabo de 15 y 90 minutos, un «agente de respuesta» (una persona real trabajando en el proceso) responde con voz. Por ahora, un «grupo» de alrededor 50 agentes tratan los pedidos transcribiendo las grabaciones de voz, buscando las respuestas en diversos idiomas y traduciendo la información para así enviarla a la persona que llamó en suajili.

Durante la prueba que se llevó a cabo en Nairobi, capital de Kenia, y en el oeste del país, 600 usuarios beta enviaron preguntas sobre sus representantes locales, pidieron ayuda para tareas de suajili y solicitaron información médica que sería muy delicado mencionar en persona.

Durante el proyecto piloto de Uliza, estas fueron las palabras incluidas en las preguntas más frecuentes hechas por usuarios (traducidas del suajili al inglés).

Uliza resolverá otro problema para sus futuros usuarios: la falta de acceso a información que está en internet. Existen diversas razones relacionadas entre sí para que se dé esta situación: paquetes de datos móviles muy caros, distancia al cafés cibernéticos y analfabetismo en idiomas que son más usados. Todo esto se agrava por la falta de contenido en idiomas locales.

No un problema técnico

El modelo para recaudar fondos de Uliza requiere de una labor intensiva pero tiene una gran ventaja: al tener a seres humanos encargados de las transcripciones y traducciones, se evita temporalmente la falta de grandes bases de datos que por lo usual limitan los esfuerzos del RAH (reconocimiento automático del habla) en idiomas africanos. Simultáneamente, se recogen datos de hablantes reales en una gran variedad de acentos y dialectos. Grant Bridgman, fundador de Uliza, planea usar estas cortas grabaciones y transcripciones para construir una máquina capaz de hacer esto en forma automática en el futuro. En esta conferencia en la Universidad de Tufts, Bridgman presentó la idea central detrás del proyecto:

Ya se han hecho diversas investigaciones para construir un software de reconocimiento automático del habla en suajili y en otros idiomas africanos ampliamente hablados. Sin embargo, está tomando mucho tiempo para que la tecnología llegue a las manos de las personas. En una entrevista con Global Voices, Bridgman explicó lo siguiente:

The technology exists and all of this is already available for first world languages, now we need to find a commercial model to make it viable for low-resource languages.

La tecnología existe y todo esto ya está disponible para los idiomas de primer mundo, ahora necesitamos encontrar una manera comercial para hacerlo viable en idiomas que cuentan con pocos recursos.

Compañías que buscan establecer líneas de ayuda para una base de clientes rurales a precio reducido son clientes potenciales para la fase inicial del crecimiento de Uliza. A la larga, se implementará un servicio que permitirá a los usuarios de teléfonos móviles encontrar respuestas a sus preguntas sin necesidad de estar conectados a internet. Además, podrán publicar contenido con su propia voz. El costo para el usuario será mínimo –casi lo que cuesta un SMS.

El modelo de Uliza podría ser viable para otros idiomas que cuentan con gran cantidad de hablantes. Pero no es el caso para la mayoría de los 2,000 idiomas hablados en el continente africano. Sin embargo, las soluciones podrían encontrarse en este proyecto de investigación liderado por Preethi Jyothi en el Instituto Beckman, donde un equipo de investigadores utilizaron un método probabilístico para recaudar transcripciones de hablantes no nativos. Una vez afinados los audios, las transcripciones podrían abrir la posibilidad de RAH para los idiomas menos representados, ojalá con un costo razonable.

Inicia la conversación

Autores, por favor Conectarse »

Guías

  • Por favor, trata a los demás con respeto. No se aprobarán los comentarios que contengan ofensas, groserías y ataque personales.