Ocho retos que deben superar las Wikipedias en lenguas indias

From language input to Unicode standards, Indian-language Wikipedias need a sustained effort from the community. Credit: Johann Dréo CC BY 2.0/Flickr

Desde el ingreso al idioma hasta los estándares Unicode, las Wikipedias en lengua india necesitan de un esfuerzo constante por parte de la comunidad. Créditos: Johann Dréo CC BY 2.0/Flickr.

Una versión de este artículo fue publicada previamente en The Wire.

Aun después de una década de existencia, las Wikipedias en lengua india no han conocido muchos indoparlantes. Wikipedia, la enciclopedia libre más extensa hecha en la historia humana, es lo que hoy es gracias a los cientos de miles de editores voluntarios. Sin embargo, mientras las Wikipedias en lenguas nativas se están convirtiendo en algo revolucionario en otras partes del mundo, el escenario en la India es sesgado. Aquí presento, desde mi punto de vista, algunos de los retos que las Wikipedias en lenguas indias están enfrentando actualmente.

1. Comunidades de lenguas

Las comunidades de lenguas de muchas de las lenguas indias son de tal forma que muchas de ellas no saben cómo buscar información en internet, usando su propia escritura a través del teclado. Algunas de estas comunidades aún creen que debido a que la página de inicio de Google no se presenta en su idioma, su lenguaje no existe en internet. Google, el cual empezó con cinco lenguas indias como opción en su interfaz, cuenta ahora con nueve de ellas. Pero esto no impide que un usuario Santali o uno Manipuri busque en Unicode Ol Chiki (la escritura del Santali) o en Unicode Meithei (la escritura del Manipuri), respectivamente. Google, o cualquier otro buscador, va a mostrar cualquier cosa disponible en internet en cualquier forma de escritura. Sin embargo, la percibida falta de esta importante función está evitando que mucha gente se conecte a internet, y a Wikipedia en particular.

2. La comunidad de editores de Wikipedia

Wikipedia está escrita por gente como tú o como yo. Y todo, desde la escritura hasta la edición, está hecha por voluntarios; y cualquiera puede corregir los errores e imprecisiones que existen en muchos de sus artículos. Mientras varias lenguas indias son habladas por millones de personas, las comunidades de editores de Wikipedia de estos lenguajes son muy pequeñas, con sólo un puñado de editores que contribuyen a la edición en dichas lenguas. En enero de este año, Wikipedia Hindi, por ejemplo, tenía tan sólo 89 editores, mientras que el total de hablantes de Hindi está por encima de los 550 millones.

3. Ingreso de idioma en los computadores

Una gran mayoría de gente en la India no sabe cómo tipear en su propio idioma. Hay también poca documentación que instruya a los usuarios acerca del Ingreso de idioma. Aun cuando muchas escuelas estatales en India están viendo una proliferación en el uso del computador y el acceso a internet, el ingreso del idioma nativo y otros elementos que harían parte de un entrenamiento esencial en computación básica no son ampliamente enseñados en las escuelas en todos los estados. Esto es muy desafortunado, ya que hay una gran variedad de software libre para ingreso en idioma nativo, y las dificultades que existían unos años atrás para digitar en lenguas indias son ahora casi inexistentes.

4. Ingreso de idioma en dispositivos móviles

Con más de 1000 millones de usuarios de teléfono celular, la velocidad de penetración de internet del 15% en India pronto empezará a crecer a un paso más acelerado. De uno en uno (junto con la fuerte competencia que obligará a los operadores celulares a disminuir las tarifas del uso de datos), esto ayudará a muchos indios a obtener acceso a internet. Si estas personas no están educadas sobre cómo usar el ingreso en su lengua nativa, serán víctimas de un internet «anglocéntrico» y no disfrutarán de las virtudes de éste. Muchos indios que tienen smartphones necesitan un soporte completo en lengua india, y especialmente métodos de ingreso incorporados, para ser capaces de contribuir a Wikipedia en su propio lenguaje.

5. Escasez en internet de contenidos en idioma indio

La relativa falta de contenidos en idioma indio que se encuentra en internet es otro de los grandes factores dentro de la baja adopción de Wikipedias en lenguas indias. De acuerdo con una encuesta realizada en el 2012 por la Asociación de Internet y Telefonía Celular de la India, más del 6% de la población se queda atrás con respecto a disfrutar de la esfera del internet, simplemente por una escasez de contenidos en sus lenguajes. Tomen por ejemplo mi estado, Odisha: mientras el portal de turismo oficial del gobierno del estado de Kerala está disponible en Odia y en otros lenguajes indios, al momento de escribir este artículo el portal del gobierno de Odisha no tenía información en Odia. Es desafortunado que nuestros lenguajes sean en su gran mayoría ignorados dentro de nuestros propios estados.

6. Incompatibilidad entre los estándares de los medios nuevos y tradicionales

En lugar de adoptar el estándar Unicode, muchas publicaciones de los medios de comunicación siguen usando variantes no-estándar de los sistemas de codificación ASCII/ISCII. Unicode, un estándar global, ha estado disponible para lenguas indias desde hace 25 años, pero la mayoría de los medios de impresión en lenguas vernáculas de la India ha fallado en adoptarlo. Un resultado de esto, es que en internet muchos periódicos populares en idioma indio no están disponibles en Unicode.

7. Falta de libre acceso

La mayoría de la información publicada en internet, y por el gobierno indio en particular, está protegida por derechos de autor. Este jardín de pago con restricciones por derechos de autor, limita el acceso a la información y evita que la gente comparta y aprenda más. Wikipedia, por otro lado, está distribuida bajo un licencia Creative Commons Share-Alike que permite a cualquiera hacer uso de su contenido, e incluso permite distribuirlo comercialmente. La apertura de información para las masas bajo un régimen de licencia libre, podría hacerla fácilmente accesible a millones de personas.

8. Fracaso en el servicio a personas con discapacidades

Mucha gente en India no puede leer, hablar o escribir, y el país tiene más de 60 millones de personas con alguna forma de deficiencia auditiva. Hay una desesperada necesidad de buscadores texto-a-voz (text-to-speech) y voz-a-texto (speech-to-text) de alta calidad para personas con discapacidades físicas. Estos productos también están disponibles gratuitamente, de tal forma que quien no pueda adquirir software costoso como JAWS, pueda contribuir a Wikipedia en su propio lenguaje. Muchos de los buscadores de texto-a-voz disponibles hoy en día para lenguas indias tienen un sonido tan mecánico que es difícil que un hablante promedio pueda usarlos.

Subhashish Panigrahi es un educador y evangelista del conocimiento libre, y actualmente trabaja para «Communications, Program Capacity & Learning» en la Fundación Wikimedia, y para «Acceso al Conocimiento» en el Centro para el Internet y la Sociedad. Algunas partes de este artículo fueron tomadas de un discurso dado por Subhashish en «BHASHA: Festival Digital de Lenguas Indias», en Nueva Delhi.

Inicia la conversación

Autores, por favor Conectarse »

Guías

  • Por favor, trata a los demás con respeto. No se aprobarán los comentarios que contengan ofensas, groserías y ataque personales.