¿Debería haber versiones en shona en Google y redes sociales? Este tecnólogo dice que sí.

Bailarines tradicionales tocan los tambores en Zimbabue. Imagen de TJ Maposhere vía Wikimedia Commons (CC BY-SA 4.0).

Nota editorial: Del 13 al 19 de abril de 2021, Blessing Sibanda gestionará la cuenta de Twitter de @DigiAfricanLang,  que explora cómo se puede utilizar la tecnología para revitalizar las lenguas africanas. Puedes leer más información sobre la campaña aquí.

El shona, un idioma oficial de  Zimbabue, es una de las lenguas bantúes más habladas con cerca de 10,8 millones de hablantes. Pero si bien hay diversos recursos literarios  e históricos en shona, la visibilidad del idioma en línea está lejos de ser alentadora

Blessing Sibanda, ingeniero de software, está al frente de este proyecto para que el shona btsea reconocido en el campo del procesamiento del lenguaje natural, rubro de la inteligencia artificial que se ocupa de hacer que los computadores «comprendan» y descodifiquen el lenguaje escrito y hablado.

Adéṣinà Ọmọ Yoòbá de Rising Voices habló con Blessing para saber más sobre su trabajo en intentar obtener el reconocimiento del shona en contextos de aprendizaje automático y en línea.

Adéṣinà Ọmọ Yoòbá (AOY): ¿Podrías contarnos algo más sobre ti?

Blessing Kudzaishe Sibanda. Foto usada con su autorizacion.

Blessing Kudzaishe Sibanda (BKS): My name is Blessing Kudzaishe Sibanda. I am a software engineer and researcher. I am currently pursuing a Master’s degree in Computer Science at Namibia University of Science and Technology. My research interests are in Computer Vision and natural language processing (NLP).

I am part of Masakhane, where I am conducting NLP research on low-resource languages, specifically concentrating on my native language Shona. I have been particularly involved in the machine translation and named-entity recognition (NER) initiatives for Shona.

Blessing Kudzaishe Sibanda (BKS):Me llamo Blessing Kudzaishe Sibanda. Soy ingeniero de software e investigador. Actualmente estoy realizando un posgrado en Ciencias de la Informática en la Universidad de Ciencias y Tecnología de Namibia. Me interesa la investigación sobre la visión artificial y el procesamiento del lenguaje natural (PLN).

Formo parte de Masakhane, y dirijo una investigación de PLN en lenguas con pocos recursos. Me enfoco principalmente en shona, mi idioma nativo. Me he involucrado de forma total con la traducción automática y el reconocimiento de entidades nombradas (NER por su nombre en inglés) para mi idioma.

AOY:  ¿Cuál es la situación actual de tu idioma, en línea y fuera de línea?

BKS: Shona is very active and vibrant offline. According to the website mustgo, it is one of the most spoken Bantu languages, with an estimated 10.7 million speakers. It has a rich history and literature with a lot of a documentation. Although it has great resources offline, there still a lot potential to increase its presence online.

BKS: El shona es muy activo y vibrante. Según el sitio web mustgo, es uno de los idiomas bantú más hablados, aproximadamente 10, 7 millones de personas. Tiene una historia y literatura muy ricas y documentadas. Aunque cuenta con muchos recursos fuera de linea, aún queda mucho potencial para incrementar su presencia en línea.

AOY: ¿Cuáles crees que son los mayores desafíos que enfrenta tu comunidad de idiomas respecto a comunicación digital o contenido de creación digital en su idioma materno?

BKS: I think in most African countries, inclusive of my country, the biggest challenge is that of having the language of the former colonisers as the first language. Although this has been of advantage when communicating on an international stage, it has made our own native languages not be appreciated as they should. This has to some extent made those who speak for example English be thought of as more educated or of a higher social class whilst looking down upon our own native languages. So, you find people preferring the foreign language more than the native one.

With this, I think the biggest issue which needs to be dealt with is the perspective of the native language, it needs to be shifted to make it more appealing to use whether in business or on the internet, so that people can better embrace it. From a technological standpoint, it is lagging behind in terms of tools and software which make it easier and accessible to use online. This is mostly because of the lack of resources which can be used to produce those tools. Tools and services like dictionaries, translation, keyboards (for languages with diacritics), speech, amongst others, will pay off in the long run as they make it easier to communicate with our own language online.

BKS: Creo que en la mayoría de los países africanos, incluido el mío, el mayor desafío es tener el idioma de los antiguos colonizadores como primera lengua.
Si bien esto ha sido una ventaja al hora de comunicarnos en un escenario internacional, ha hecho que nuestras propias lenguas nativas no se aprecien como deberían. Hasta cierto punto, los que hablan inglés, por ejemplo, son considerados como más educados o de una clase social más alta, mientras menosprecian nuestras propias lenguas nativas. Entonces, encuentras personas que prefieren el idioma extranjero más que el nativo.

Con esto, creo que el mayor problema que debe abordarse es la perspectiva del idioma nativo, debe cambiarse para que sea más atractivo de usar, ya sea en los negocios o en internet, para que la gente pueda adoptarlo mejor. Desde el punto de vista tecnológico, se está quedando atrás en cuanto a herramientas y software que hacen que su uso en línea sea más fácil y accesible. Esto se debe principalmente a la falta de recursos que se pueden utilizar para producir esas herramientas. Las herramientas y los servicios como diccionarios, traducción, teclados (para idiomas con signos diacríticos), voz, entre otros, valdrán la pena a largo plazo, ya que facilitan la comunicación con nuestro propio idioma en línea.

AOY: En tu opinión,, ¿cuáles son algunos de los pasos a tomar a corto plazo para incrementar el uso del idioma en internet? 

BKS: I believe the integration of local languages into everyday online tools and technologies that we use can encourage the increased use of the language on the internet. For example, with Google Search, if you could switch the main language to Shona and everything gets displayed in Shona. This should also be the option for social media sites, where most of the languages from Africa are not covered for personalising display language.

Another example is with Wikipedia. People can contribute pages using their own native languages which in a way increases the discoverability of these languages. I believe another step, as earlier noted, is investment in research and products which utilize native languages.

From a technological perspective, there is a lot of ground to cover compared to the most widely spoken languages to be at par in terms of research and products. This is an impediment, as we cannot fully express our own language whilst making those unfamiliar with it able to understand it, as the internet has made the world a global village. With these concerted efforts I believe the use of native languages online can be encouraged.

BKS: Creo que la integración de los idiomas locales en las herramientas y tecnologías en línea cotidianas que utilizamos puede fomentar un mayor uso del idioma en internet. Por ejemplo, con la búsqueda de Google, si pudiera cambiar el idioma principal a shona y todo se mostrase en shona. Esta también debería ser la opción para los sitios de redes sociales, donde la mayoría de los idiomas de África no están cubiertos para personalizar el idioma de visualización.

Otro ejemplo es Wikipedia. Las personas pueden contribuir con páginas utilizando sus propios idiomas nativos, lo que de alguna manera aumenta la capacidad de descubrimiento de estos idiomas. Creo que otro paso, como se señaló anteriormente, es la inversión en investigación y productos que utilizan idiomas nativos.

Desde una perspectiva tecnológica, hay mucho terreno por recorrer en comparación con los idiomas más hablados para estar a la par en términos de investigación y productos. Esto es un impedimento, ya que no podemos expresarnos completamente en nuestro idioma mientras hacemos que quienes no están familiarizados con ese idioma puedan entenderlo, ya que internet ha hecho del mundo una aldea global. Con estos esfuerzos coordinados, creo que se puede fomentar el uso de idiomas nativos en línea.

AOY: ¿Cuál es tu principal motivación para trabajar en hacer que tu idioma y cultura está disponible en internet? 

BKS: My motivation is to see a lot of activity when it comes to NLP technologies for Shona, and to have tools that are comparable in performance to the widely adopted languages on the internet. I believe competent tools will inevitably encourage the use of the language on the internet, and for this to happen the native speakers should be at the forefront of researching and producing these tools as they better understand their own language.

This is why I adore and am part of the Masakhane Community. It is bringing the native speakers to work and research on their own languages. It is lowering the barrier of entry into working with these technologies, providing a community and mentors to help along this journey of producing these tools. In addition to this, it is publishing research which will make it easier for others to continue this work and make sure native languages are represented in technology.

BKS: Mi motivación es ver mucha actividad cuando se trata de tecnologías de PNL para el shona, y tener herramientas que sean comparables en rendimiento a los idiomas ampliamente adoptados en internet. Creo que las herramientas competentes fomentarán inevitablemente el uso del idioma en internet y, para que esto suceda, los hablantes nativos deben estar a la vanguardia de la investigación y la producción de estas herramientas a medida que comprendan mejor su propio idioma.

Por eso adoro y soy parte de la comunidad de Masakhane. Se trata de llevar a los hablantes nativos a trabajar e investigar en sus propios idiomas. Está reduciendo la barrera de entrada para trabajar con estas tecnologías, proporciona una comunidad y mentores para ayudar en este viaje de producción de estas herramientas. Además, está publicando investigaciones que facilitarán que otros continúen este trabajo y se asegure de que las lenguas nativas estén representadas en la tecnología.

Inicia la conversación

Autores, por favor Conectarse »

Guías

  • Por favor, trata a los demás con respeto. No se aprobarán los comentarios que contengan ofensas, groserías y ataque personales.