Introducción
La minería de texto es una rama específica del análisis de datos que busca analizar y extraer información de textos. Esta utiliza una serie de procesos para transformar documentos o recursos de texto desestructurados en información estructurada. La información estructurada puede utilizarse para descubrir patrones tales como tendencias en el uso de palabras, estructura sintáctica, sentimientos u opiniones, etc.
Extensión de los discursos
La extensión de los discursos tuvo un rango de 83 a 239 frases, siendo los discursos de Mujica y Vázquez-2005 los que incluyeron el mayor y menor número de frases, respectivamente (Figura 1).
Frecuencia de uso de las palabras
Los presidentes mencionaron ciertas palabras frecuentemente durante su discurso de investidura. Entre las 10 palabras más frecuentes se destaca “país”, con una frecuencia de 111 (Figura 2, Figura 3).
Cuado se compararon los discursos de los presidentes, la palabra “país” fue la más frecuente en el discurso de Sanguinetti y Lacalle Pou, 35 y 18 veces, respectivamente (Figura 4, Figura 5).
Dispersión léxica
Este análisis permite ver la frecuencia de uso y el momento en el discurso en el que se usó la palabra.
Para el caso de las palabras, país y democracia:
La palabra país es empleada a través del discurso de los presidentes, excepto Vázquez-2015 que solo la menciona 1 vez. Sin embargo, la palabra democracia es usada de manera poco frecuente por todos los presidentes, excepto Sanguinetti (Figura 6).
Para el caso de las palabras, economía y empleo:
La palabra economía fue empleada por solo 4 presidentes y la palabra empleo fue solo mencionada en los discursos de Lacalle Herrera y Lacalle Pou (Figura 7).
Similitud y correlación entre los discursos
La similitud de los discursos obtuvo valores relativamente bajos de correlación entre todos los presidentes (Figura 8).
La distancia o disimilaridad de los discursos permitió identificar 2 grupos, uno formado por Sanguinetti y Mujica y el otro por el resto de los presidentes (Figura 9).
Análisis de sentimiento
El análisis de sentimiento se usa para evaluar emociones, actitudes y opiniones de un texto. El discurso de investidura de Lacalle Pou fue el que presentó un menor número de palabras que reflejan emociones negativas (Figura 10) y menor número de palabras que reflejan emociones positivas Figura 11).
El análisis lo realicé con R (R Core Team 2022), usando los paquetes quanteda (Benoit et al. 2018) y factoextra (Kassambara y Mundt 2020).
Literatura citada
Cómo citar
@online{spínola2022,
author = {Spínola, Manuel},
title = {Análisis de texto de los discursos de investidura de las
últimas 7 presidencias de Uruguay},
date = {2022-09-03},
url = {https://mspinola-ciencia-de-datos.netlify.app/posts/2022-09-01-presidentes-uruguay/presidentes_uruguay.html},
langid = {es}
}