Uno de los aspectos más laboriosos cuando se necesita trabajar con textos que están en formatos como word o PDF es precisamente convertirlos a un formato leible y analizable por un programa, es decir, volverlos datos. Pero esto no es nuevo, de hecho desde casi siempre, transcribir lo que alguien dice, sea cual sea la tecnología que se use, nunca ha sido fácil, peor aún si hablamos de formatos análogos.
Pero estamos en la época de los proyectos colaborativos y los hackers cívicos, así pues para facilitar esta labor una de las más reciente herramientas que ha salido al mercado es SayIt [en], de la comunidad Poplus [en], desarrollada entre otros, por MySociety [en], una organización que tiene como misión «ayudar a que las personas adquieran más poder en las partes cívicas y democráticas de sus vidas, a través de medios digitales.»
Según [en] el blog de Poplus, Sayit puede ser utilizado para publicar o leer, transcripciones de archivos PDF o documentos de Microsoft Word, entre varios otros formatos.
SayIt is a new way to publish transcripts online – transcripts such as parliamentary debates, court trials, speeches, or even playscripts. It can be embedded into your website, or used as a standalone instance.
Salty es una nueva manera de publicar transcripciones en línea – transcripciones tales como debates parlamentarios, procesos judiciales, discursos, o incluso guiones. Se puede insertar en su sitio web, o usarlo de forma independiente.
En la página «Acerca de» [es] de SayIt, nos explican algunas cuantas cosas más, entre ellas por qué es importante tener mejores transcripciones:
Transcripts are a kind of oil that greases the wheels of well-functioning societies. They let people discover when powerful people have made pronouncements that affect less powerful people. We believe that by making transcripts function better, more people will end up learning about decisions and opinions that affect their lives.
Las transcripciones son un clase de aceite que engrasa las ruedas de las sociedades que funcionan bien. Permiten que la gente descubra cuando los poderosos han hecho pronunciamientos que afectan a las personas con menos poder. Creemos que haciendo que las transcripciones funcionen mejor, más gente terminará aprendiendo sobre las decisiones y opiniones que afectan sus vidas.
La aplicación, que aún está en formato Alpha, es decir, que está todavía en desarrollo, ha concitado el interés de medios especializados. Wired por ejemplo conversó [en] con Myfanwy Nixon, Gerente de Marketing y Comunicaciones de MySociety, quien explica que SayIt trabaja con Akoma Ntoso, un estándar de datos abiertos, y que mucho del trabajo ha consistido en lograr que las transcripciones se muestren correctamente.
«The transcripts tend to be in all sorts of different formats — PDFs, Word documents, scans, you name it — and each requires a slightly different approach. You can't just run a magic piece of code and immediately get them all nice and shiny.»
«Las transcripciones tienden a estar en todo tipo de formatos diferentes – PDFs, documentos de Word, escaneos, lo que sea – y cada uno requiere un enfoque ligeramente diferente. No se puede tan solo ejecutar un programa mágico y de inmediato tenerlos bonitos y relucientes.»
Ella añade que en la segunda fase del proyecto se lanzará una interfaz de creación directa que formateará las transcripciones mientras son creadas.
» […] we also foresee that a lot of organisations and individuals will have existing transcripts that they want to publish. We're keen to see this happen, but we know that the biggest task will be transforming them into a format we can use. Not impossible, just (often) labour-intensive,»
«[…] también preveemos que una gran cantidad de organizaciones y personas tengan transcripciones existentes que quieren publicar. Estamos deseosos de ver que esto suceda, pero sabemos que la mayor tarea será transformarlas en un formato que podamos usar. No es imposible, solo que (a menudo) demanda mucha mano de obra»
También Robert Sharp comenta [en] en su blog respecto al lanzamiento de SayIt que «son esta clase de cosas las que dan fuerza a las campañas de base y catalizan la democracia» y explica por que es algo que le ha entusiasmado:
Readers of this blog will know how irritated I get with the quality of parliamentary and government papers online. Transcripts and other documentation are frequently uploaded as PDFs, as if the only thing a researcher or campaigner plans to do with the document is print it.
Los lectores de este blog sabrán cuán irritado me pone la calidad de documentos parlamentarios y gubernamentales en línea. Las transcripciones y otro tipo de documentación se cargan con frecuencia como PDFs, como si la única cosa que un investigador o activista planee hacer con el documento es imprimirlo.
Por otra parte en Public Sector IT, un blog de Computer Weekly, Mark Ballard escribe sobre el lanzamiento de SayIt poniéndolo en el contexto de la política inglesa, donde no hace mucho el gobernante Partido Conservador borró de internet [en] los archivos de 10 años de discursos. CW conversó con Tom Steinberg, fundador y director de MySociety, quien entre varias cosas manifestó [en]:
«The whole business of transcripts – whether its parliament or celebrity interviews – needs bringing up to speed. It's woefully old-fashioned. We want people all over the world to find out when powerful people talk about things that matter to them. If someone is talking about your road in a local government meeting today, you will never know. […] structured data is what makes each Tweet a beautifully-structured thing. It's what makes Facebook work. And it's what makes everything on the internet work. But as of today transcripts are not structured at all
Todo el asunto de las transcripciones – sean entrevistas a parlamentarios o celebridades – necesita actualizarse ¡Es terriblemente anticuado. Queremos que la gente de todo el mundo sepa cuando los poderosos hablan de cosas que son importantes para ellos. Si hoy alguien está hablando de su calle en una reunión del gobierno local, nunca lo sabrá. […] Consideremos que los datos estructurados son lo que hace de cada tweet algo maravillosamente estructurado. Es lo que hace que Facebook funcione. Y es lo que hace que todo en Internet funcione. Pero hasta hoy las transcripciones no están estructuradas en lo absoluto,
Diversos cibernautas en todo el mundo también han mostrado su expectativa por ver cómo funciona la herramienta:
@mySocietyIntl needs your help to test @SayItPoplus… it could be a great tool in the fight for #humanrights #OpenGovernment
— Diana Delamer (@DoruntineUK) January 20, 2014
MySociety necesita tu ayuda para probar Saylt…puede ser una excelente herramienta en la lucha por los derechos humanos y gobiernos abiertos
@sinarproject will soon focus on getting important transcripts accessible with Sayit thanks to @mySocietyIntl http://t.co/IWjpeEntf1
— Khairil Yusof (@kaerumy) January 17, 2014
Sinar Project pronto se enfocará en obtener transcripciones importantes accesibles con Sayit gracias a MySociety
.@SayItPoplus As a Human Rights lawyer, I am loving this tool. Already in mind the @RiosMonttTrial and the Manning trial!
— Renata Avila (@avilarenata) January 15, 2014
Como abogada de derechos humanos, esta herramienta me encanta. Ya estoy pensando en el juicio a [Efraín] Rios Montt y y el juicio a [Chelsea] Manning!
How many times does Shakespeare mention ‘Africa’ in his plays? @SayItPoplus new tool can tell you http://t.co/DDNYZCrtxT
— The Indigo Trust (@indigotrust) January 16, 2014
¿Cuántas veces Shakespeare menciona ‘Africa’ en sus obras? La nueva herramienta SayIt te lo puede decir.
Para hacernos una idea del funcionamiento de SayIt, han colgado tres ejemplos tomados de archivos en el Reino Unido: The Leveson Inquiry [en], una investigación sobre la ética de la prensa en Inglaterra; The Charles Taylor trial [en], el juicio por crímenes de guerra al expresidente de Liberia; y Las obras completas de Shakespeare [en] (puede buscar en ellas con cualquier palabra clave [en], verlas por personaje [en], o por obra [en]).
Además, para ayudar en el proceso de subir una transcripción han publicado un par de mini guías, para los lectores no técnicos [en] y para los desarrolladores [es].
Como la gente de MySociety dice en un artículo de su blog a propósito del lanzamiento de SayIt, esta herramienta puede ser de gran ayuda para publicar y tener archivadas transcripciones de: Reuniones del consejo local, audiencias de la Corte, campañas electorales, entrevistas y grupos de discusión de investigación académica, seminarios académicos, conferencias, escenificaciones, grupos de discusión de estudios de mercado, archivos históricos de eventos, como una coronación o un debate clave.
Hay muchas posibilidades ciertamente, queda ver cómo la sociedad civil y grupos de activistas o ciudadanos comunes y corrientes la usen. Para terminar, un reciente Hangout con Tom Steinberg, Director de mySociety, acerca de SayIt.
1 comentario
top secret green coffee extract reviews
SayIt, una herramienta cívica para transcripciones · Global Voices en Español