Visualizando Comparaciones de Proporciones
Recientemente en mi trabajo tuvimos una discusión muy importante sobre el futuro de nuestros productos - reportes, blogs, informes, etc. además de las visualizaciones que los acompañarán. La primera saldrá a la luz muy pronto y va a incluir algo como lo siguiente.
Esto es un gráfico de barras apiladas (? es stacked bar chart en inglés) que esta comparando 3 grupos: No votantes, Adultos y Votantes probables. Los datos provienen de nuestra encuesta a nivel estatal de California, EEUU. El punto que se supone está resaltando es que los latinxs en California estan subrepresentados en el electorado y los blancos estan sobrerepresentados. Es decir, aunque los latinxs sean el X% de los adultos en California representan un porcentaje menor de los Votantes probables. Lo opuesto es verdad sobre la población blanca de California.
Aquí va la primera modificación que yo hubiera hecho, porque sí lo que estas tratando de enfatizar atrae el mismo nivel de atención que el resto de los elementos de tu gráfico - no lo estás enfatizando.
Es decir, si lo que estamos tratando de enfatizar es que existe este fenómeno similar pero opuesto en las poblaciones latinx y blanca en California - resaltemos las poblaciones latinx y blanca.
Pero en realidad, lo que yo quisiera (y propuse) fue el cambiar completamente el tipo de gráfico que estamos utilizando.
Los gráficos de barras son útiles para visualizar magnitudes. El tamaño de una barra me indíca, fácilmente, que tanto de algo tengo. Es decir, cuando vez la gráfica de en medio (Adultos) y por el contexto sabes que es un porcentaje, ver una barra que sube el 42% del espacio entre el 0 y el 100 te ayuda a contextualizar ese 42% más que si fuera un círculo, por ejemplo, en un gráfico de dispersión.
En cierto modo, esta gráfica de barras apiladas es esencialmente un gráfico de pastel, pero eso es para otro blog.
El punto que quiero tocar es que en el título y las notas del gráfico no estamos hablando de magnitudes. No importa si la población latinx es 19 o 23 o 26 por ciento. Lo que importa es que en cada una de estas barras es diferente.
Lo que queremos visualizar es la diferencia, no la magnitud.
Por eso yo preferiría utilizar algo que se conoce como rangle plot o gráfico de rango (a veces también aparece en el internet como dumbbell chart o gráfico de pesas por su similitud a las pesas que uno levanta en el gimnasio).
Con este graáfico es más fácil observar las diferencias entre las 3 categorías: No votantes, Adultos, Votantes probables.
No solo de nuestros 2 grupos principales (latinxs y blancos) pero también aquí podemos ver que, por ejemplo, los números de Votantes probables y Adultos de la población afro-americana son los mismos. Es decir, no son ni sub- ni sobrerepresentados en el electorado.
Pero la verdad es que los grupos asiático-americanos, afro-americanos, y otros están presentes en el gráfico de barras por el simple hecho de que los porcentajes tienen que sumar a 100. Los números son muy bajos para extraer conclusiones y el punto que estamos tratando de ilustrar es lo que acontece en las poblaciones latinx y blanca.
Por esa razón, propuse el mostrar sólo estos dos grupos. Algo que se vería así:
Este gráfico muestra, en mi opinión, de una manera más fácil para la lectora que ambos grupos (latinxs y blancos) tienen proporciones similares de la población de adultos (35 vs 42%) pero esto cambia de manera drástica y en direcciones opuestas cuando exploramos la población de No votantes y de Votantes probables.
Con este gráfico ves dos rangos similares pero opuestos. Eso es el punto que estamos tratando de ilustrar en nuestro reporte.
Incluso sería posible ir un paso más adelante y solo comparar las proporciones de adultos y de votantes problables, ya que son las dos categorías a las que les estamos poniendo atención en el reporte (y en el título y las notas del gráfico).
Podríamos hacer algo así:
Esto ilustra todavía más efectivamente no solo que existe una diferencia similar en la manera en que estas poblaciones forman estas dos categorías (adultos y votantes problables), sino que enfatiza que estas diferencias van en direcciones opuestas: una población es sobrerepresentada y la otra es subrepresentada.
Cuando queremos visualizar diferencias es fácil pensar “Bueno, agrupo mis barras por categoría, las cambio de color y mis lectoras y lectores verán que las barras de un color son más grandes que las otras”. O como en este caso “Quienes lean este reporte podrán ver que en una barra el cachito de color naranja es más grande en esta barra que en aquella”.
Puede ser. Pero lo que en realidad estás pidiendo es que tus lectoras tomen estos numeros (o barras) y calculen la diferencia entre estos grupos y luego comparen estas diferencias con las diferencias calculadas de otras categorías.
¿Por qué? Si lo que quieres es ilustrar que ciertos grupos son diferentes, visualiza esa diferencia.
¿Qué te pareció la nota? Mandanos un tuit a @tacosdedatos o envianos un correo a ✉️ sugerencias@tacosdedatos.com. Y recuerda que puedes subscribirte a nuestro boletín aquí debajo. Cada mes te enviamos enviamos nuestras publicaciones y las últimas noticias directamente a tu caja de entrada.
Subscríbete a 🌮 tacos de datos | Aprende visualización de datos en español.
Recibe las mejores publicaciones directamente a tu caja de entrada