Contexto
El gráfico de barras o columnas es muy utilizado para visualizar información. En algunos casos se denomina gráfico de barras cuando las barras se muestran en posición horizontal y gráfico de columnas cuando las barras se muestran en posición vertical. Es un gráfico que generalmente incluye en el eje x a una variable categórica y en el eje y a la frecuencia o conteo de los elementos de las categorías o niveles de la variable (Figura 1).
También se usa el gráfico de barras o columnas para representar un estadístico (p.e. el promedio) y su precisión de estimación (p.e. intervalo de confianza) a lo que se le llama barra de error (Figura 2). A estos gráficos tambien se les llama gráficos dinamita.
En ambos casos la información que provee la barra está representada en su altura (o borde superior), el ancho de la barra no provee ninguna información, por lo tanto ambos gráficos constituyen una forma ineficiente de presentar información.
Alternativas
Para el caso del gráfico de barras que solo representa las frecuencia o conteos de las categorías o niveles en una variable categórica se puede usar un gráfico de lollipop o piruleta (Figura 3) o mejor aún, horizontal (Figura 4). En la forma horizontal no se tiene que rotar el texto del eje x cuando éstos son muy largos.
Para el caso del gráfico dinamita la alternativa es un gráfico de punto y barra de error, que en este caso es el intervalo de confianza al 95% (Figura 5). Este tipo de gráfico se le conoce en inglés como “point range graph”.
Para los ejemplos usé los datos de pingüinos (Horst, Hill, y Gorman 2020), de los cuales se consideran 3 especies y su masa corporal en gramos. Los análisis y gráficos los realicé con R (R Core Team 2022) y el paquete ggplot2 (Wickham 2016).
Cómo citar
@online{spínola2022,
author = {Spínola, Manuel},
title = {Alternativas a los gráficos de barra o columna},
date = {2022-04-28},
url = {https://mspinola-ciencia-de-datos.netlify.app/posts/2022-04-28-graficos-de-barra/graficos_de_barra.html},
langid = {es}
}