- Global Voices en Español - https://es.globalvoices.org -

Visualización de datos en Global Voices

Categorías: Activismo digital, Medios ciudadanos, Tecnología, GV Summit 2012

Gilad Lotan de SocialFlow nos presentó el recientemente popular mundo de la visualización de datos, y preguntó si es interesante y si está mejorando las historias que contamos.

Tarek Amr [1] [en] autor de Global Voices, es ingeniero de seguridad en Egipto y comienza con una diapositiva con texto increíblemente denso para demostrar la importancia de comunicarse de manera visual. Este es el objetivo principal de la visualización de datos: es la intersección de los datos que tienes, el mensaje que quieres transmitir y la manera visual en que lo transmites. Las visualizaciones presentan rápida y claramente información compleja, revelan patrones y tendencias, se entienden fácilmente y, de manera ideal, son bonitas y atractivas.

Egipto es nuevo en las elecciones políticas (no corruptas), así que Tarek creó un gráfico de la posición de diversos partidos en el espectro político:

Egyptian political spectrum graphed

Espectro político egipcio

Jacepo Carbonari analizó las posiciones de las políticas de los partidos, con muchos más datos y creó una versión más densa del gráfico político [2].

Morsi Meter

Morsimetro

Luego de las elecciones, el sitio web de Morsi publicó un mapa bastante simple de los resultados usando el gadget de resultados [3] de Michael Geary, que dio la impresión que Morsi dominaba las elecciones. Otra persona creó un mapa más matizado que mostró los verdaderos porcentajes del voto.

La visualización de datos puede ser tan simple como una barra de estado. Un grupo creó una medida, llamada Morsi Meter [4] [Morsimetro] con el estilo de Obameter [5] de PolitiFact, para medir el progreso de Morsi en cumplir las promesas que hizo durante la campaña.

El ciclo de vida de la visualización de datos de Tarek:
1. La adquisición de datos es el proceso de tomar muestras de las señales y de reunir información.
2. También hay recolección colaborativa de datos y análisis, recogidos con Google Docs.
3. Después, esos datos fueron visualizados con el gadget de resultados e infografía.


The youth who mapped Kibera

Los que trazan los mapas: 13 jóvenes de Kibera

Kibera on official maps

Kepha Ngito (@ngitok [6]) es el director de Map Kibera [7] (@mapkibera [8]). Ellos recolectan datos pertinentes a su comunidad,  trazan mapas usando tecnología GIS y la presentan en forma de mapa. Kibera no es solamente una ubicación geográfica. Representa a pueblos marginados que ni siquiera existen en mapas oficiales. El gobierno no tiene razones para brindar servicios a personas que no ve en un mapa.

 

Kibera after it was mapped

Kibera es el hogar de cerca de 250,000 personas en apenas 2.5 kilómetros cuadrados. Y aun así, en Google y otros mapas, Kibera estaba completamente en blanco. Un solitario alfiler yace en una área blanca etiquetada como bosque.

Trece jóvenes de Kibera hicieron el primer mapa de Kibera, recolectando información de ubicación acerca de puntos de agua, clínicas, letrinas públicas, colegios informales, iglesias, mezquitas, tiendas de video, peluquerías, organizaciones comunales y otros lugares cívicos. La información está disponible gratis [9] [en] en OpenStreetMap.

La presentación de esta información es el paso más importante, dice Kepha. La perspectiva que esta información ofrece es el aspecto crítico. Hoy, el mapa de Kibera empieza a parecerse a la increíblemente densa comunidad que está presente en la realidad.

Ahora, el grupo está finalizando otro mapa. Han perdido horas de sueño por decisiones acerca de qué puntos de interés incluir y cuáles dejar de lado, porque no es mucha la información que se puede mostrar en un espacio tan pequeño.

El grupo también crea medios cívicos. Voice of Kibera [10] [Voz de Kibera] es una instalación de Ushahidi diseñada para reunir cobertura ciudadana en Kibera. Los habitantes pueden publicar noticias con colaboración colectiva, que por lo general no serían cubiertas por los medios convencionales.

Kibera News Network [11] [en] es un proyecto de noticias en video, porque el equipo entiende que los medios no solamente deben contener información, sino también presentarla de manera visual. Han estado cargando videos de FlipCam a su canal de YouTube [12] desde 2010, y también están proyectando los videos a los habitantes, para que la gente entienda lo que está ocurriendo en sus barrios, independientemente del acceso a Internet. El entretenimiento es una parte importante de la vida en las barriadas. Probablemente hay una sala de proyección de video en todos los barrios de Kibera. Y las películas son un escape para los habitantes de Kibera como lo es para la gente que vive en cualquier otro lugar.

El grupo se ha ramificado al trazado temático de mapas, diseñando mapas específicos en torno a salud, educación, seguridad, y salubridad del agua. El mapa de seguridad ha permitido a la policía de Nairobi patrullar con más profundidad en la barriada de lo que lo hacían antes, porque el mapa eliminó algunos de sus miedos.

Repitieron el proceso de trazado de mapas en Mathare, otra gran barriada en Nairobi. De nuevo, tomaron la descripción casi totalmente en blanco que tenía Google de la comunidad, y la poblaron con una versión más fina de la realidad. El blog Mathare Valley [13] [en] también ayuda a exponer la realidad de Mathare al mundo.


Nathan Matias [14] (@natematias [15]) del Centro para Medios Ciudadanos [16] [en] del MIT, cambia de tema para usar los datos para aprender lecciones, además de visualizarlas. Empezó en la Clase de Noticias Participativas [17] [en] de Ethan Zuckerman, sacando noticias de las cuentas de Twitter mencionadas. Su compañero Chi-Chu Tschang [18] usó el enfoque para crear una lista de Twitter de personas que hablan de Hong Kong, y pudo detectar una historia que surgió antes que en los medios convencionales.

Esto llevó a Nathan a considerar qué voces están representadas verdaderamente en los medios. Tomó información de 20 años del New York Times y trató de analizar los encabezados y de ejectuarlos contra bases de datos de nombres de bebés en el mismo periodo. Ahora puede ver quiénes están escribiendo las historias, así como contar pronombres para rastrear el género. Los artículos de invierno en la sección de Estilo del New York Times tienden a informar solamente de un género o del otro, mientras que en verano, los dos géneros aparecen juntos en los artículos con muchas más frecuencia. Parece que prestamos más atención al sexo opuesto durante los meses más calurosos.

Top Cited Twitter Accounts: Global Voices Social Quotation Browser [19]

Cuentas de Twitter más citadas

Nathan ha cambiado su atención a Global Voices. Mirando GV enInglés, echó un vistazo a todas las cuentas de Twitter enumeradas en cada post del blog, y elaboró un navegador social para ayudar a explorar los alcances de estas personas, así como sus conexiones con otras personas.

Network map of people talked about in Global voices [20]

Puedes profundizar un único tema, como posts de GV sobre México, y ver el volumen por semana, o la gráfica de la red de personas citadas en los posts. Le da curiosidad si las mismas personas son citada con frecuencia, o si hay una mayor diversidad, con más nodos y extremos más densos. Ha clasificado los posts de Global Voices según el número de voces que incluyen. Nathan hizo todo esto para averiguar cuáles son las historias, y le gustaría explorar más con los bloggers y editores de Global Voices.


Marek Tuszynski (bio [21]) del colectivo Tactical Technology [22] [en] dice que la visualización de datos se reduce a tres pasos:

1. Ten la referencia:
Necesitamos datos para trabajos de defensoría, y después usamos vehículos con los que la gente se involucra emocionalmente: metáfora, subversión, humor, choque o contraste. La información necesita estos vehículos para hablar con la gente. Las emociones ayudan a la exposición.

2. Ten la imagen:
Usamos animación y un argumento para explicar qué es relevante acerca de los datos. Se trata de comprensión. ¿Cuánto costaría un sandwich si tuviera el precio con el mismo beneficio que el agua embotellada? Podemos dar contexto y poner las cosas en perspectiva.

3. Ten los detalles:
La mayor parte del tiempo, más información tiene como resultado más confusión. Es raro que podamos ofrecer el nivel correcto de información mientras se crea un nivel mínimo de confusión. Los detalles permiten que las personas exploren.

La visualización puede ser un punto de apertura para atraer a las personas a los datos y hacerlas intrigarse lo suficiente como para explorarla. O los datos pueden hacerla volver a casa, y hacer que los datos sean relevantes para su vida, como Map Kibera. O los datos pueden ser un proceso de colaboración, donde contribuyes con datos y ayudas a formar la historia.

Los datos son más útiles para propósitos internos, dice Marek. Los mapas de redes muestran a los actores influyentes, pero tienen que ser traducidos a versiones más claras para que la gente los entienda mejor. Hemos estado comunicando la idea detrás de los datos y visualizándola durante muchos años, pero es desde hace poco que hemos tenido las herramientas para ofrecer los detalles de manera convincente.

Marek nos señala los recursos en tacticaltech.org [23] [en], Drawing By Numbers [24] [en], una colección de servicios de visualización libre y de fuente abierta, y el recientemente lanzado Tactical Studios [25] [en]. Puedes ponerte en contacto con ellos en @info_activism [26].


Gilad Lotan [27] [en] cubre Israel para GV, y también es científico de datos en SocialFlow [28] [en]. Muchas de sus herramientas de visualización interna de datos ofrecen fuerte comprensión y no están publicadas.

No siempre necesitas gráficos bonitos. Gilad ha hecho el perfil de diversos tipos de acontecimientos de acuerdo con la frecuencia de palabras en el tiempo en Twitter. Un simple trazado de mapas de las palabras Starbucks, café, mañana y cansado que aparezcan en Twitter muestran un reflejo de nuestra vida en los datos. Bebemos café en la mañana. Vemos picos de la palabra ‘resaca’ en las mañanas del sábado y domingo, luego de los picos anteriores de la palabra ‘fiesta’. Mientra tanto, ‘cerveza’ es bastante constante en el tiempo.

The words 'hangover', 'party', and 'beer' on Twitter [29]

Los datos son nuestro reflejo

Podemos analizar el uso del idioma en Twitter, y ver picos según zonas horarios en inglés y japonés, mientras que el castellano es más constante alrededor del mundo.

Los eventos típicos de deportes muestran alto interés al comienzo del juego, seguido de una calma, y después índices muy altos a medida que el juego acaba. Los partidos tienden a seguir este perfil de actividad.

También podemos ver movimientos sociales, como MarchaAntiEPN [30], y ver su alcance contra acontecimientos de cultura popular como True Blood y los premios Tony. La propia forma de la curva nos dice qué tipo de acontecimiento representa.

La etiqueta #blamethemuslims [31] [culpa a los musulmanes] la inició una musulmana, Sanum Ghafoor [32]. Ella vive en Inglaterra harta de que los medios culpen a los musulmanes por el reciente tiroteo en Noruega (que resultó perpetrado por un noruego). ¿Está malogrado tu reloj? #blamethemuslims. El artero meme se inició en su barrio, se apagó esa noche y luego se expandió al mundo entero al día siguiente. La etiqueta explotó, pero perdió su contexto irónico original y molestó a muchas personas que lo vieron como tendencia en Twitter.

La forma del gráfico también revela la diferencia entre el crecimiento orgánico de #blamethemuslims contra un robot, AJ Discala, que tiene un pico claramente artificial en el tráfico. Las noticias de último minuto es otra actividad en la que podemos basarnos. La muerte de Whitney Houston forma un pico repentinamente en Twitter.

the #occupy hashtag on Twitter plotted versus more mainstream hashtags [33]

Etiquetas tendencia en Twitter

La etiqueta #occupy causó amplia discusión sobre cómo funcionan las tendencias de Twitter, y muchos sostienen que existe censura. Pero si vemos qué otra cosa está ocurriendo en la red, podemos ver que etiquetas más tontas sobre la boda de Kim Kardashian y #ICantRespectYouIf [no puedo respetarte si es que] superan seriamente a las protestas de Occupy. El algoritmo de Twitter favorece al nuevo contenido creciente, por encima de las tendencias que crecen gradualmente, como #occupy.

Gilad está interesado en cuánta información se difunde, sobre todo en Twitter. Un compañero de trabajo que no es particularmente influyente en Twitter (pero es hincha de los Red Sox) inició #cheeringfortheYankeesislike [hacer barra por los Yankees es como]. SocialFlow elaboró una repetición visual que muestra la aceleración del meme con el tiempo. El rápido hilito se vuelve una verdadera inundación cuando un par de influyentes usuarios de Twitter lo escogen. Un mapa de visualización tipo árbol permite a Gilad regresar y ver qué usuarios contribuyeron más a la difusión viral de la etiqueta. En este caso, podemos agrededcerle a @jaketapper [34].

Los comerciantes de todo tipo están obsesionados con cómo llegar a los que influyen, pero ya sabemos quiénes son. Con estos mapas tipo árbol muestran que los caminos reales que usamos para llegar a ellos es el camino natural.


¿Qué técnicas tienes para condensar muchos datos en una historia?
Kepha centra su atención en la calidad de los datos y el interés de las personas en la información que recoges. Las personas en Kibera se preocupan por los colegios a los que van sus hijos, la basura en sus barrios. El software es necesario, pero el producto final debería ser tan simple que no puedas decir que había involucrado un proceso complicado.

Marek dice que en trabajo de defensoría, importa con quién hablas, qué quieres decirle y qué quieres que hagan como resultado. Tus datos y cómo los presentes deberían desprenderse de las respuestas a estas preguntas.

El trabajo de Nathan con Global Voices brinda a la gente la oportunidad de llegar a los datos y explorar desde ahí. La visualización de la BBC de El mundo a los siete mil millones [35] [en] y otros exitosos proyectos de visualización de datos en internet empiezan con las personas.

¿La balcanización de las etiquetas #occupy perjudican su capacidad de ser tendencia?
Si, esa fue una razón. Pero también su lento aumento en el tiempo, más que un gran aumento (más en el blog de SocialFlow [36]; [en]).

Zeynep: Es interesante que el algoritmo de Twitter recompense los picos más que los crecimientos lentos, porque criticamos lo mismo acerca del periodismo profesional: cubren cuando el avión se estrella, no cuando despega.

Gilad: En verdad es un algoritmo bastante simple, que usa Tf*idf [37] [en], que se utiliza en una diversidad de servicios y sitios de recomendación de noticias para crear listas de lo más solicitado (incluido Tumblr). Es el método más simple de tener la mejor lista de conversaciones de una enorme cantidad de datos.

Ethan: Tenemos una fuerza y un interés increíbles en esta comunidad en torno a la visualización de datos. Preguntemos al público acá: ¿qué queremos saber sobre Global Voices y medios ciudadanos de manera más general de lo que la visualización de datos nos puede decir?

Ivan: Queremos saber si lo que decimos que estamos haciendo es relamente lo que estamos logrando. Con los mapas de la red Twitter, ¿estamos realmente haciendo participar a un grupo diverso de voces? Si solamente estamos siguiendo a un pequeño grupo, deberíamos estar haciéndolo intencionalmente y escribir al respecto.

Mucha gente en GV está trabajando en temas de justicia social — ¿cómo puede ayudar acá la visualización de datos? ¿Ha habido casos en que ha creado impacto en el terreno?
Marek: Esa es la pregunta incorrecta. No hay manera en que la imagen pueda crear cambio. Puede influir en los grupos para que actúen y organicen el cambio. Pero en todo el espectro, la imagen tiene una sola pieza. Puede ayudar o perjudicar tus esfuerzos.

Gilad: Nuestra atención está puesta en el tráfico, pero creo que podríamos hacer más para mostrar nuestra verdadera influencia y llegar más allá de las visitas al sitio web.

Deen Freelon: ¿Cómo puede iniciarse la gente en visualización de datos? Veo dos barreras para entrar: aptitud técnica (saber de API, bases de datos y herramientas de visualización) y la naturaleza de propietario de tantos datos. Para analizar Twitter, de verdad necesitas acceso completo, por lo que Twitter cobra. El API normal no te concede todos los tuiteos. Así que necesitas dinero o acceso interno para muchas conjuntos de datos, además de aptitud técnica.

Tarek anota que hay muchas herramientas gratis en internet que facilitan la creación de visualizaciones. Pero principalmente necesitamos pensar en lo que queremos crear y cómo conectar a las personas con la información.

Nathan traza una línea entre análisis de grandes conjuntos de datos y aplicaciones prácticas de datos internos de las organizaciones. Rahul Bhargava maneja DataTherapy.org [38] [en] para ayudar a que las organizaciones hagan esto exactamente.

Rob Faris: Hay defensoría y parcialización en toda clase de información. La visualización es particularmente susceptible a esas acusaciones, porque por naturaleza es una deducción de grandes cantidades de datos, y hay una naturaleza de caja negra en este trabajo. ¿Hay parámetros emergentes en la ética existente?

Tarek dice que se retrotrae a la credibilidad de las personas que realizan el trabajo, como con cualquier otra cosa. Nathan dice que los actores responsables deberían incluir las advertencias con su trabajo y explicar cómo lo realizaron. Por ejemplo, su trabajo puede haber incluido borradores de posts de Global Voices. Tarek señala los movimientos de Periodismo Abierto y Ciencia Abierta, donde los autores publican sus hojas de cálculo y datos con su trabajo para permitir que otros vuelvan a ejecutar y cuestionen su trabajo. Gilad ve pocas ansias reales para secciones de métodos en los posts — la gente solamente quiere la historia.