«La documentación lingüística necesita derechos comunitarios, consentimiento y reconocimiento»: Entrevista con el escritor van gujjari Taukeer Alam

Taukeer Alam while speaking his language, Van Gujjari

Taukeer Alam, mientras habla en su idioma, van gujjari. Foto cortesía de Subhashish Panigrahi (CC BY-SA 4.0).

Este artículo es parte de la serie Spotlight de abril de 2026 de Global Voices, Perspectivas humanas sobre IA. Esta serie ofrecerá una mirada profunda hacia cómo se está usando IA en países en desarrollo, cómo su uso e implementación afectan a las comunidades individuales, qué podría significar este experimento de IA para futuras generaciones, y más. Puedes apoyar este reportaje donando aquí.

Como la mayoría de las lenguas del mundo son habladas, el conocimiento de sus hablantes también es oral. Sin embargo, en Wikipedia y en la mayoría de las publicaciones se requieren citas escritas.

El archivo digital OpenSpeaks Archives es un registro de lenguas creado en 2024 que ayuda a los wikipedistas a citar el conocimiento oral indígena.

La infraestructura técnica y educativa de este proyecto facilita a los archivistas comunitarios documentar, transcribir y archivar sus lenguas que actualmente alberga casi 20 lenguas de India, Nepal y Sri Lanka. Esta serie de entrevistas recopila las historias de algunos colaboradores de OpenSpeaks Archives.

En nombre de Rising Voices, Subhashish Panigrahi entrevistó por llamada de voz a Taukeer Alam, conservacionista indio hablante de van gujjari. El van gujjari es una lengua indígena vulnerable hablada por los van gujjar, comunidad musulmana nómada que vive principalmente en el estado de Uttarakhand, al norte de India. El video de la entrevista de Subhashish Panigrahi a Taukeer Alam se hizo para el documental “Aadhaar marginados” en OpenSpeaks Archives. Está disponible con licencia Creative Commons BY-SA 4.0.

Rising Voices (RV): ¿Qué opina de los libros, audios y videos para documentar su idioma?

Taukeer Alam (TA): Audio and video are the best mediums for documenting Van Gujjari for capturing our emotions through voice, expressions, and body language. These are very hard to capture in a book. There is another difficulty with books, especially for Indigenous languages with their own sound patterns and ways of speaking. We cannot write them fully as is: the exact way a word is pronounced, or how the sounds are released.

A word in Hindi, Van Gujjari or Punjabi might be spelled the same way, but the tone, the feeling, and the rhythm can be completely different. Audio and video show these differences clearly and feel more “pure”. In a book, any reader from any region will read the word in their own way, with their own intonation. They will not understand how that particular word is spoken in our community, how high or low the tone goes, what expression accompanies it, or what emotional weight it carries. A book is simply not as ‘alive’ as audio and video, which capture many layers of meaning beyond the words.

Taukeer Alam (TA): El audio y el video son los mejores medios para documentar el van gujjari porque capturan nuestras emociones a través de la voz, las expresiones y el lenguaje corporal, y esto es algo muy difícil de plasmar en un libro. Hay otra dificultad con los libros, y es que para las lenguas indígenas con sus propios patrones fonéticos y formas de hablar no hay una escritura exacta de la pronunciación de una palabra o de cómo se emiten los sonidos.

Una palabra en hindi, van gujjari o punyabi puede escribirse igual, pero el tono, el sentimiento y el ritmo pueden ser muy diferentes. El audio y el video muestran estas diferencias con claridad y las vuelven más “puros”. En un libro, cualquier lector de cualquier región leerá la palabra a su manera y con su propia entonación. No comprenderá cómo se pronuncia esa palabra en nuestra comunidad, qué tan agudo o grave es el tono ni qué expresión la acompaña o qué carga emocional conlleva. Simplemente, un libro no es tan “vivo” como el audio y el video, que pueden capturar múltiples capas de significado más allá de las palabras.

Rising Voices (RV): Si considera las diferentes generaciones de su comunidad, ¿qué funciona mejor: los libros, o el audio/video?

TA: Before many first generation learners in college like myself, there was no literacy in our community. Literacy did not exist for long as our people were restricted to migrate freely, they were relocated, or nomadic tribes were settled in new places. In such situation, written materials does not do very much — audio and video work better for all age groups as people cannot read. With literacy increasing among children, written material is beginning to matter. If the small stories, short narratives, or interview excerpts we collect from the community are turned into books, and used to educate children, it will become very valuable. It will help children's contextual understanding if the knowledge comes from their own roots. It connects their education to their lived reality.

For older people, audio and video always work better, because they are not going to learn reading at this stage of life. If I convert my interview with a 60 or 70 year old into a book and give it to a 40 year old who cannot read, the book is of no use to them. For them, it will only work in interview form, whether audio or video. So different forms are needed for different generations, but in my community, that is how I see it at the moment.

TA: Antes de muchos universitarios de primera generación, como yo, no había alfabetización en nuestra comunidad. La alfabetización no existió por mucho tiempo, mientras nuestro pueblo tuvo restricciones para migrar libremente, los reubicaron. En tales circunstancias, los materiales escritos no eran muy útiles; el audio y el video funcionaban mejor para todas las edades, pues las personas no sabían leer. Con el aumento de la alfabetización infantil, el material escrito empieza a ser importante. Si los cuentos, narraciones breves o fragmentos de entrevistas que recopilamos de la comunidad se convierten en libros y se utilizan para educar a los niños, se volverán muy valiosos. Ayudarán a la comprensión contextual de los niños si el conocimiento viene de sus propias raíces. Esto conectaría su educación con realidad que viven.

Para las personas mayores, el audio y el video siempre funcionan mejor porque ya no van a aprender a leer en esta etapa de la vida. Si convierto mi entrevista con una persona de 60 o 70 años en un libro y se lo doy a una persona de 40 que no sabe leer, el libro no le servirá de nada. Solo le funcionará en formato de entrevista, ya sea audio o video. Entonces, se necesitan diferentes formatos para diferentes generaciones, al menos así lo veo en la actualidad en mi comunidad.

RV: ¿Qué recomienda para que el material documentado sea accesible?

TA: First of all, knowledge and information should be accessible, whatever form it is in. We have to identify which mediums the community already uses and then make the material available there. If they use YouTube a lot, then interviews should be available on YouTube. If they are more inclined towards reading books, then the same content should be accessible through books.

Secondly, we need share the documentation with the community as quickly as possible. The sooner we go to the community, record, transcribe, translate, and share the material back, the more likely we are to preserve the quality of the knowledge. For example, I transcribed some folk songs recently. When I tried to translate them, I realized that for some songs, we no longer know the real meaning. People are still singing them, but those who truly understood the meaning have already passed away. Now others are singing just by hearing them, without knowing the literal meaning, the emotions behind the song, why it was sung, or in what situations it was created or performed. The full knowledge behind the song is gone.

So two things are vital: the material should be accessible in the language and format people use. Documentation of endangered languages should happen as early as possible. The longer we wait, the more the quality of knowledge reduces and vanishes.

TA : En primer lugar, el conocimiento y la información deben ser accesibles, cualquiera sea su formato. Debemos identificar qué medios utiliza la comunidad y a partir de ahí, poner el material a su disposición. Si  usan mucho YouTube, las entrevistas deberían estar disponibles en YouTube, y si prefieren leer libros, el mismo contenido debería estar disponible en libros.

En segundo lugar, necesitamos difundir la documentación con la comunidad lo antes posible. Cuanto antes acudamos a la comunidad, grabemos, transcribamos, traduzcamos y difundamos el material, mayor será la probabilidad de preservar la calidad del conocimiento. Hace poco transcribí algunas canciones folclóricas, y al intentar traducirlas me di cuenta de que ya no conocemos el verdadero significado de algunas. La gente sigue cantándolas, pero quienes realmente comprendían su significado han muerto. Ahora las cantan solo por haberlas oído, pero sin conocer el significado literal, las emociones que tienen detrás, por qué cantan o en qué situaciones se crearon o interpretaron. El conocimiento pleno que encierra la canción se ha perdido.

Por lo tanto, dos cosas son vitales: el material debe ser accesible en el idioma y formato que la gente utiliza. La documentación de las lenguas en peligro debe hacerse lo antes posible. Cuanto más esperemos, más se deteriorará o desaparecerá la calidad del conocimiento.

RV: ¿Cómo debería documentarse una lengua como el van gujjari, y cómo debería desarrollarse la capacidad de documentación de la comunidad?

TA: Language documentation must be participatory, involving the community’s youth who represent the community’s future. They must be kept in the loop and showed the process, the methodology, what to pay attention to, and how we frame questions. If they learn this, they can later carry on the work themselves.

Secondly, the material must be accessible to the community. If it is documented but remains far away from them, then its benefit is limited. They should be able to see, hear, and use it.

Third and last, we should use reasonably good-quality equipment. If we are interviewing a 70 or 80 year old, we do not know if we will ever again meet a person that old with that knowledge. The data we capture from them is very precious; it should be of good quality so that it lasts and remains useful.

TA: La documentación lingüística debe ser participativa, involucrar a los jóvenes de la comunidad, quienes representan su futuro. Se les debe mantener informados, mostrarles el proceso, la metodología, a qué prestar atención y cómo formulamos las preguntas. Si aprenden esto, ellos mismos podrán continuar el trabajo.

En segundo lugar, el material debe ser accesible para la comunidad. Si está documentado, pero lejano, el beneficio utilidad es limitado. Deben poder verlo, oírlo y usarlo.

En tercer y último lugar, debemos utilizar equipos de buena calidad. Si entrevistamos a una persona de 70 u 80 años, no sabemos si volveremos a encontrarnos con alguien de esa edad o nivel de conocimiento. Los datos que recopilamos son muy valiosos, deben tener buena calidad para que duren y sigan siendo útiles.

RV: ¿Le preocupa el mal uso o la explotación de datos de la comunidad con IA?

TA: Yes, I do. I worry what will happen while publishing community knowledge, which is very deep. Before sharing it anywhere, we have to think carefully. We may document and record it with good intentions, but what happens to it later? How much right will the community retain over it?

Medicinal knowledge, rituals, and other practices that are considered private or are seen as the community’s collective asset. People have lived with them, evolved them, and learned from them over thousands of years. That fear of such unique and sensitive knowledge being marketed or abused persists.

Ideally, before making such knowledge public, some kind of protection should be in place, clearly recognizing it as community knowledge. The publication should acknowledge the community’s rights, and proper consent and recognition should be needed before the content enters another domain. Then anyone using it would have to say, ‘This comes from the Van Gujjar community,’ and respect that.

Even if someone does not acknowledge it, we could still claim later that we documented and published it in, say, 2024. So it is ours and we have rights over it. Others should use it only according to the permissions given by the community. So I have no objection to documentation itself; the main questions are how and where the material is stored, and how much control and rights the community retains over it.

TA : Sí, me preocupa. Me inquieta lo que sucederá al publicar el conocimiento colectivo, que es muy profundo. Antes de difundirlo en cualquier lugar, debemos pensar con detenimiento. Podemos documentarlo y registrarlo con buenas intenciones, pero ¿qué pasará después? ¿Cuántos derechos conservará la comunidad sobre el contenido?

Hay conocimientos medicinales, rituales y otras prácticas consideradas privadas o patrimonio colectivo de la comunidad. Los pueblos han convivido con esos conocimientos, los han desarrollado y han aprendido de de ese conocimiento desde hace miles de años. Persiste el temor de que este conocimiento único y delicado se comercialice o utilice indebidamente persiste.

Antes de divulgar ese conocimiento, lo ideal sería que existiera alguna protección que lo reconociera como conocimiento comunitario. La publicación debería asegurar los derechos de la comunidad, el consentimiento y el reconocimiento adecuados antes de que el contenido pase a otro dominio. Así, quien lo utilice tendría que decir: “Esto proviene de la comunidad van gujjar”, y respetarlo.

Aunque tal vez nadie lo reconozca, podríamos argumentar después que lo documentamos y publicamos en 2024, por ejemplo. Por lo tanto, es nuestro y tenemos derechos sobre ese conocimiento. Otros deberían usarlo según la autorización de la comunidad. Entonces, si no tengo objeción a la documentación; las cuestiones principales son cómo y dónde se almacena el material, y cuánto control y derechos conserva la comunidad.

La entrevista con Alam dio como resultado “Maari Jaban Maari Birsa” (nuestro idioma, nuestra cultura), proyecto de documentación lingüística que se publicará en los OpenSpeaks Archives en 2024.

Inicia la conversación

Autores, por favor Conectarse »

Guías

  • Por favor, trata a los demás con respeto. No se aprobarán los comentarios que contengan ofensas, groserías y ataque personales.