Nueva herramienta de publicación de audio para proyecto colaborativo de Wikcionario en oriya

Montaje de grabación casera para el proyecto Kathabhidhana para el Wikcionario. Imagen vía Subhashish Panigrahi de Wikimedia Commons. CC BY-SA 4.0.

El Wikcionario, proyecto hermano multilingüe de la Wikipedia, tiene un gran potencial. En la actualidad, no existen muchos grabadores de audio de licencia abierta que puedas escuchar o descargar, especialmente si tu lengua materna no es uno de los idiomas principales. El Wikcionario ya está disponible en varios idiomas y añade a la definición de las palabras muchas anotaciones poéticas, al menos en términos del Alfabeto Poético Internacional (IPA) que están disponibles. Ahora, un proyecto comunitario del idioma oriya (odia) está ayudando a simplificar el proceso de contribuciones voluntarias en el proyecto Wikcionario Oriya.

Kathabhidhana, proyecto comunitario dirigido por Subhashish Panigrahi, contribuidor Global Voices y usuario de Wikipedia, es una solución de código abierto para grabar extensos fragmentos de palabras. Luego los publica bajo licencias abiertas para que así puedan ser útiles para proyectos como el Wikcionario.

El oriya, uno de los idiomas oficiales de India, es un idioma indo-ario hablado gran parte en India oriental por alrededor de cuarenta millones de hablantes nativos. Con más de cinco mil años de patrimonio literario, ha sido reconocido como uno de los idiomas más antiguos de Asia del sur, y le ha sido concedida la condición de idioma clásico por el gobierno indio.

Pero debido al uso de sistemas de tipeo de escritura no Unicode, la presencia del idioma en línea sigue quedándose atrás. Para encauzar estos problemas, varios convertidores de codificación de caracteres que cambia texto escrito en Unicode utilizando varios sistemas de codificación no Unicode, están incluidos en la Wikipedia en oriya; ahora tiene más de doce mil entradas. Por otra parte, el Wikcionario en oriya como diccionario en línea colaborativo gratuito en oriya, está tratando de cubrir la brecha.

El proyecto debe su inspiración a otro software de código abierto creado por Shrinivasan T, quien usó el lenguaje de programación Python para automatizar y simplificar el proceso. Ha colgado este tutorial en YouTube:

Panigrahi se inspiró para realizar el proyecto Kathabhidhana debido a que el método existente era un proceso engorroso: pronuncias y grabas una palabra, después la exportas en formato Ogg Vorbis para tu cuenta de Wikimedia Commons, que es el repositorio central de los archivos multimedia para todos los proyectos Wikimedia. Una vez subido, la entrada se añade en el proyecto Wikcionario. Aparte de grabar manualmente la pronunciación, también existe un proyecto de código abierto texto-a-pronunciación llamado Dhvani que trabaja para la mayoría de idiomas indios.

En contraste, tener grabaciones de audio de palabras en el Wikcionario ayuda a los hablantes no nativos (tanto como a las personas con discapacidades visuales) a escuchar la pronunciación de diferentes palabras. La biblioteca también puede ser utilizada para varios proyectos de procesamiento de lenguajes naturales, como los motores de texto-a-pronunciación y pronunciación-a-pronunciación.

Puedes descargar una copia del Kathabhidhana y encontrar todas las grabaciones de audio realizadas utilizando este software.

Inicia la conversación

Autores, por favor Conectarse »

Guías

  • Por favor, trata a los demás con respeto. No se aprobarán los comentarios que contengan ofensas, groserías y ataque personales.