Análisis de texto de los discursos de investidura de las últimas 7 presidencias de Uruguay

Análisis de los discursos de investidura de las últimas 7 presidencias de Uruguay

Minería de texto
Autor/a
Afiliación
Fecha de publicación

3 de septiembre de 2022

Introducción

La minería de texto es una rama específica del análisis de datos que busca analizar y extraer información de textos. Esta utiliza una serie de procesos para transformar documentos o recursos de texto desestructurados en información estructurada. La información estructurada puede utilizarse para descubrir patrones tales como tendencias en el uso de palabras, estructura sintáctica, sentimientos u opiniones, etc.

Extensión de los discursos

La extensión de los discursos tuvo un rango de 83 a 239 frases, siendo los discursos de Mujica y Vázquez-2005 los que incluyeron el mayor y menor número de frases, respectivamente (Figura 1).

Figura 1: Extensión de los discursos de investidura de los presidentes de Uruguay.

Frecuencia de uso de las palabras

Los presidentes mencionaron ciertas palabras frecuentemente durante su discurso de investidura. Entre las 10 palabras más frecuentes se destaca “país”, con una frecuencia de 111 (Figura 2, Figura 3).

Figura 2: Gráfico de nube de palabras de los discursos de investidura de los presidentes de Uruguay.
Figura 3: Frecuencia de las 10 palabras más mencionadas durante los discursos de investidura de los presidentes de Uruguay.

Cuado se compararon los discursos de los presidentes, la palabra “país” fue la más frecuente en el discurso de Sanguinetti y Lacalle Pou, 35 y 18 veces, respectivamente (Figura 4, Figura 5).

Figura 4: Gráfico de nube de palabras de los discursos de investidura de los presidentes de Uruguay.
Figura 5: Frecuencia de las 10 palabras más mencionadas durante los discursos de investidura de los presidentes de Uruguay.

Dispersión léxica

Este análisis permite ver la frecuencia de uso y el momento en el discurso en el que se usó la palabra.

Para el caso de las palabras, país y democracia:

Figura 6: Frecuencia y dispersión de las palabras, país y democracia, durante los discursos de investidura de los presidentes de Uruguay.

La palabra país es empleada a través del discurso de los presidentes, excepto Vázquez-2015 que solo la menciona 1 vez. Sin embargo, la palabra democracia es usada de manera poco frecuente por todos los presidentes, excepto Sanguinetti (Figura 6).

Para el caso de las palabras, economía y empleo:

Figura 7: Frecuencia y dispersión de las palabras, economía y empleo, durante los discursos de investidura de los presidentes, Luis Guillermo Solís, Carlos Alvarado y Rodrigo Chaves.

La palabra economía fue empleada por solo 4 presidentes y la palabra empleo fue solo mencionada en los discursos de Lacalle Herrera y Lacalle Pou (Figura 7).

Similitud y correlación entre los discursos

La similitud de los discursos obtuvo valores relativamente bajos de correlación entre todos los presidentes (Figura 8).

Figura 8: Similitud de los discursos de investidura de los presidentes de Uruguay.

La distancia o disimilaridad de los discursos permitió identificar 2 grupos, uno formado por Sanguinetti y Mujica y el otro por el resto de los presidentes (Figura 9).

Figura 9: Distancia o disimilaridad de los discursos de investidura de los presidentes de Uruguay.

Análisis de sentimiento

El análisis de sentimiento se usa para evaluar emociones, actitudes y opiniones de un texto. El discurso de investidura de Lacalle Pou fue el que presentó un menor número de palabras que reflejan emociones negativas (Figura 10) y menor número de palabras que reflejan emociones positivas Figura 11).

Figura 10: Frecuencia de palabras que reflejan emociones negativas en los discursos de investidura de los presidentes de Uruguay.
Figura 11: Frecuencia de palabras que reflejan emociones positivas en los discursos de investidura de los presidentes de Uruguay.

El análisis lo realicé con R (R Core Team 2022), usando los paquetes quanteda (Benoit et al. 2018) y factoextra (Kassambara y Mundt 2020).

Literatura citada

Benoit, Kenneth, Kohei Watanabe, Haiyan Wang, Paul Nulty, Adam Obeng, Stefan Müller, y Akitaka Matsuo. 2018. «quanteda: An R package for the quantitative analysis of textual data». Journal of Open Source Software 3 (30): 774. https://doi.org/10.21105/joss.00774.
Kassambara, Alboukadel, y Fabian Mundt. 2020. factoextra: Extract and Visualize the Results of Multivariate Data Analyses. https://CRAN.R-project.org/package=factoextra.
R Core Team. 2022. R: A Language and Environment for Statistical Computing. Vienna, Austria: R Foundation for Statistical Computing. https://www.R-project.org/.

Cómo citar

BibTeX
@online{spínola2022,
  author = {Spínola, Manuel},
  title = {Análisis de texto de los discursos de investidura de las
    últimas 7 presidencias de Uruguay},
  date = {2022-09-03},
  url = {https://mspinola-ciencia-de-datos.netlify.app/posts/2022-09-01-presidentes-uruguay/presidentes_uruguay.html},
  langid = {es}
}
Por favor, cita este trabajo como:
Spínola, Manuel. 2022. “Análisis de texto de los discursos de investidura de las últimas 7 presidencias de Uruguay.” September 3, 2022. https://mspinola-ciencia-de-datos.netlify.app/posts/2022-09-01-presidentes-uruguay/presidentes_uruguay.html.