Alternativas a los gráficos de barra o columna

En esta entrada se muestran alternativas a los gráficos de barra o columna

Gráficos
Visualización de datos
Autor/a
Afiliación
Fecha de publicación

28 de abril de 2022

Contexto

El gráfico de barras o columnas es muy utilizado para visualizar información. En algunos casos se denomina gráfico de barras cuando las barras se muestran en posición horizontal y gráfico de columnas cuando las barras se muestran en posición vertical. Es un gráfico que generalmente incluye en el eje x a una variable categórica y en el eje y a la frecuencia o conteo de los elementos de las categorías o niveles de la variable (Figura 1).

Figura 1. Gráfico de barras o columnas para mostrar la frecuencia de las categorías o niveles de una variable categórica.

También se usa el gráfico de barras o columnas para representar un estadístico (p.e. el promedio) y su precisión de estimación (p.e. intervalo de confianza) a lo que se le llama barra de error (Figura 2). A estos gráficos tambien se les llama gráficos dinamita.

Figura 2. Gráfico de barras o columnas para representar un estadístico como el promedio y su precisión de estimación, en este caso, un intervalo de confianza al 95%.

En ambos casos la información que provee la barra está representada en su altura (o borde superior), el ancho de la barra no provee ninguna información, por lo tanto ambos gráficos constituyen una forma ineficiente de presentar información.

Alternativas

Para el caso del gráfico de barras que solo representa las frecuencia o conteos de las categorías o niveles en una variable categórica se puede usar un gráfico de lollipop o piruleta (Figura 3) o mejor aún, horizontal (Figura 4). En la forma horizontal no se tiene que rotar el texto del eje x cuando éstos son muy largos.

Figura 3. Gráfico de lollipop o piruleta para mostrar el número de individuos por especie de pingüino.



Figura 4. Gráfico de lollipop o piruleta horizontal para mostrar el número de individuos por especie de pingüino.

Para el caso del gráfico dinamita la alternativa es un gráfico de punto y barra de error, que en este caso es el intervalo de confianza al 95% (Figura 5). Este tipo de gráfico se le conoce en inglés como “point range graph”.

Figura 5. Gráfico de punto y barra de error, donde el punto representa el promedio de la masa corporal (g) y las barras de error el intervalo de confianza al 95%.

Para los ejemplos usé los datos de pingüinos (), de los cuales se consideran 3 especies y su masa corporal en gramos. Los análisis y gráficos los realicé con R () y el paquete ggplot2 ().

Horst, Allison Marie, Alison Presmanes Hill, y Kristen B Gorman. 2020. palmerpenguins: Palmer Archipelago (Antarctica) penguin data. https://allisonhorst.github.io/palmerpenguins/.
R Core Team. 2022. R: A Language and Environment for Statistical Computing. Vienna, Austria: R Foundation for Statistical Computing. https://www.R-project.org/.
Wickham, Hadley. 2016. ggplot2: Elegant Graphics for Data Analysis. Springer-Verlag New York. https://ggplot2.tidyverse.org.

Cómo citar

BibTeX
@online{spínola2022,
  author = {Spínola, Manuel},
  title = {Alternativas a los gráficos de barra o columna},
  date = {2022-04-28},
  url = {https://mspinola-ciencia-de-datos.netlify.app/posts/2022-04-28-graficos-de-barra/graficos_de_barra.html},
  langid = {es}
}
Por favor, cita este trabajo como:
Spínola, Manuel. 2022. “Alternativas a los gráficos de barra o columna.” April 28, 2022. https://mspinola-ciencia-de-datos.netlify.app/posts/2022-04-28-graficos-de-barra/graficos_de_barra.html.