La comunicación en tiempos del coronavirus (IV): Análisis de los discursos del presidente del Gobierno de España

Este artículo es la cuarta entrega de la serie sobre análisis de contenidos generados por medios digitales y usuarios de Twitter en torno al coronavirus, inicialmente centrados en España, aplicando nuestra experiencia y nuestras soluciones de Text Analytics para analizar el ingente volumen de información en lenguaje natural disponible.

Este estudio aborda de forma muy preliminar el análisis de los discursos del presidente del Gobierno de España, Pedro Sánchez Castejón, en sus comparecencias desde el inicio de la crisis hasta el momento, para extraer conclusiones de los mensajes que pretendía transmitir en cada una de sus alocuciones.

Corpus de análisis

El corpus para este análisis está formado por las transcripciones oficiales de la Secretaría de Estado de Comunicación de los discursos de las 11 comparecencias públicas del presidente desde el inicio de la crisis hasta el momento, accesibles desde el sitio web del Palacio de La Moncloa.

El primer discurso es la Comparecencia del presidente del Gobierno tras el Consejo Europeo extraordinario sobre el coronavirus [La Moncloa, martes 10 de marzo de 2020] y el último es la Conferencia de prensa del presidente del Gobierno tras la reunión de la Conferencia de presidentes autonómicos [La Moncloa, domingo 12 de abril de 2020].

Los discursos se han descargado como texto sin formato y se han procesado para analizar palabras y n-gramas más frecuentes, como se describirá a continuación.

Análisis de la comunicación

El análisis de la comunicación es otro de los escenarios para los cuales hemos desarrollado proyectos y pruebas de concepto. Desde nuestro enfoque, el objetivo es diseñar e implementar un sistema capaz de realizar automáticamente un análisis de una comunicación dada, por ejemplo, análisis de tono, sentimiento, emoción, actitud, estilo, posición perceptiva, etc.

Este tipo de análisis se puede aplicar a cualquier texto con implicaciones “emocionales”, como mensajes en redes sociales, comentarios en blogs o artículos de noticias, discursos, anuncios, etc. Esto también podría ser muy valioso para el análisis de conversación de un contact center, en combinación con otras técnicas, como el análisis de la interacción bidireccional en una conversación, incluidas las métricas de convergencia (acuerdo/desacuerdo), participación, amabilidad/lenguaje vulgar u ofensivo, etc.

Ya existen diferentes servicios o API que proporcionan algunos aspectos parciales del análisis de comunicación, como Microsoft Cognitive Service Emotion, IBM Watson Personality Insights y Tone AnalyzerIntencheck o Amazon Rekognition Emotion (para imágenes), pero habitualmente en los proyectos se necesita un único servicio unificado que combine varios o muchos de estos aspectos. En MeaningCloud hemos desarrollado APIs privadas, que reciben el texto y realizan solicitudes concurrentes a varios de nuestros servicios, específicamente, a las APIs de clasificación de texto (Text Classification y Deep Categorization), extracción de entidades y conceptos (Topics Extraction) y clustering de texto (Text Clustering), utilizando modelos genéricos disponibles públicamente y modelos específicos desarrollados para estos propósitos.

En el análisis intervienen al menos dos dimensiones: análisis del tono y análisis de la comunicación.

Análisis del tono

En este contexto, el tono podría definirse, según el Cambridge Dictionary, como “una cualidad en la voz que expresa los sentimientos o pensamientos del hablante, a menudo hacia la persona con la que se habla”. El Diccionario de la Real Academia Española presenta varias acepciones aplicables, como “inflexión de la voz y modo particular de decir algo, según la intención o el estado de ánimo de quien habla” y “carácter o modo particular de la expresión y del estilo de un texto según el asunto que trata o el estado de ánimo que pretende reflejar”.

En este análisis del tono, las herramientas de Text Analytics pueden automatizar la extracción de los siguientes aspectos:

  • Polaridad de sentimiento (positivo vs negativo) y fuerza de sentimiento (fuerte vs débil). Nosotros usamos nuestra Sentiment Analysis API.
  • Tipo de personalidad (Big 5 personality dimensions): apertura a la experiencia (openness), responsabilidad (conscientiousness), extraversión (extraversion), cordialidad (agreeableness) y neuroticismo (neuroticism), cada una medida en una escala de 0 a 100. Nosotros usamos un modelo específico de categorización texto con nuestra Deep Categorization API.
  • Análisis de las emociones: en nuestro caso, usamos el modelo básico de emociones de Ekman (felicidad, tristeza, ira, disgusto, miedo y sorpresa), o el modelo más completo de la Rueda de las emociones de Plutchik, con 8 emociones principales (alegría vs tristeza, enojo vs miedo, confianza vs asco y sorpresa vs anticipación) más 8 emociones secundarias, cada una medida en una escala de 0-100.
  • Detección de sinceridad: escala 0-100, si un texto parece ser sincero o no, comparando el número de palabras con significado vago o inespecífico con las normas generales del lenguaje. Para ello usamos nuestra Topics Extraction API.
  • Nivel de empatía: detección de señales de empatía y normalización a escala 0-100. Usamos un modelo de clasificación con Deep Categorization API.
  • Nivel de cortesía: detección de señales de cortesía, normalizando en una escala de 0-100. Nuevamente, utilizamos nuestras APIs de clasificación.

Análisis de la comunicación

Esta dimensión analiza la forma en que el escritor comunica sus ideas o pensamientos, considerando una variedad de técnicas y aspectos:

  • Estilo de comunicación: Análisis en 4 dimensiones, normalizando en una escala de 0 a 100:
    • Estilo visual: lenguaje que crea imágenes dentro de nuestra mente, con palabras como: ver, mirar, observar, enfocar, aparecer, sin sombra de dudas, a vista de pájaro
    • Estilo auditivo: lenguaje que crea sonidos dentro de nuestra mente: escuchar, oír, sonar, resonar, hablar
    • Estilo kinestésico: lenguaje que se refiere a los sentimientos que sentimos en nuestro interior: sentir, tocar, agarrar, concretar, aprovechar, de la mano
    • Estilo cognitivo: lenguaje que se refiere al pensamiento y pensamientos lógicos: comprender, pensar, aprender, procesar, decidir, considerar, conocer, motivar
  • Línea de tiempo: referencias a instantes de tiempo en el pasado, presente y futuro dentro de un texto, medidas de forma relativa.
  • Posición perceptiva, escala de 0 a 100 en cada una de los siguientes dimensiones:
    • I: Pensar y comunicar desde la propia experiencia y punto de vista (típico de los líderes): yo, mío, mi
    • II: Pensar y comunicarse mientras se piensa en la experiencia de la otra persona (muestra empatía y comprensión): , ustedél, ella, su, suya
    • III: Pensar y comunicarse como un observador externo, como si no estuviera involucrado (la retroalimentación aparece como objetiva): ellos, sus
    • IV: Pensar y comunicarse desde el punto de vista de todo el sistema (da la impresión de que el grupo de personas actúa y piensa de la misma manera): nosotros, nuestro

Análisis de los discursos

En este análisis preliminar hemos analizado las palabras y n-gramas (combinaciones de varias palabras consecutivas) más frecuentes en cada discurso.

Con esta técnica, el problema es que las palabras individuales (aisladas) tienen al menos la misma frecuencia que cualquier n-grama que la contiene, así que típicamente en los listados por frecuencia las palabras copan los primeros lugares. Lo que hemos hecho es asignar un valor de relevancia (“importancia”) a cada n-grama como score=frecuencia*longitud, donde la frecuencia es el número de veces que aparece en el texto y la longitud es el número de palabras que contiene. Por ejemplo, si “Gobierno de España” se pronunciase 15 veces, su score sería 45 (15 por 3).

Además se filtra la lista quitando palabras de palabra (stopwords) y n-gramas que empiezan o acaban por una palabra de parada, para evitar apariciones como “Gobierno de” o “en España”.

A continuación se muestran los n-gramas más frecuentes en cada uno de los discursos, empleando visualización con nubes de tags.

Comparecencia del presidente del Gobierno tras el Consejo Europeo extraordinario sobre el coronavirus [La Moncloa, martes 10 de marzo de 2020]

Las palabras más repetidas son Gobierno (44 veces), medidas (39 veces), España (30), crisis (30) y vamos (29). Como n-gramas están Gobierno de España (26 veces), salud pública (15) y comunidades autónomas (14). El término expertos se repite 19 veces, y conjunto de la ciudadanía, 7 veces.

Comparecencia del presidente del Gobierno tras el Consejo Europeo extraordinario sobre el coronavirus

Declaración institucional del presidente del Gobierno anunciando el Estado de Alarma en la crisis del coronavirus [La Moncloa, viernes 13 de marzo de 2020]

Las palabras más repetidas son virus (9 veces), recursos (7), alarma (5), social (5), emergencia (4) y España (4 veces). El n-grama más importante es Gobierno de España (3 veces), declaración del estado de alarma (2), Consejo de Ministros extraordinario (2) y frente al virus (2).

Declaración

Comparecencia del presidente del Gobierno tras la declaración del estado de alarma por el Consejo de Ministros [La Moncloa, sábado 14 de marzo de 2020]

Los términos más frecuentes son medidas (15 veces), servicios (13), y virus (12). Respecto a n-gramas: Gobierno de España (6 veces), Consejo de Ministros (5), Ministro de Sanidad (5), vías de uso público (2) y centros, servicios y establecimientos sanitarios (2).

Comparecencia del presidente del Gobierno tras la declaración del estado de alarma por el Consejo de Ministros

Comparecencia del presidente del Gobierno en el Congreso de los Diputados por el Estado de Alarma en la crisis del coronavirus [Congreso de los Diputados, miércoles 18 de marzo de 2020]

Las palabras más importantes son lugar (37 veces), señorías (35), medidas (35), salud (32), servicios (29), crisis (28), personas (27), Gobierno (26) y virus (25). Los n-gramas son millones de euros (14), Gobierno de España (10), trabajadores y trabajadoras (9), Organización Mundial de la Salud (5) y necesarios para la protección de la salud (3).

Comparecencia del presidente del Gobierno en el Congreso de los Diputados por el Estado de Alarma en la crisis del coronavirus

Comparecencia del presidente del Gobierno sobre la crisis del coronavirus [La Moncloa, sábado 21 de marzo de 2020]

Las palabras más frecuentes son España (44 veces), medidas (43), virus (28), importante (25), confinamiento (22), test (22), salud (21) y ahora (20). Los n-gramas son: medidas de confinamiento (12 veces), siete días (10), medios de comunicación (9), Organización Mundial de la Salud (7) y conjunto de la ciudadanía (6).

Comparecencia del presidente del Gobierno sobre la crisis del coronavirus

Rueda de prensa del presidente del Gobierno tras la reunión con los presidentes autonómicos [La Moncloa, domingo 22 de marzo de 2020]

En este caso, las palabras más frecuentes son: medidas (36 veces), Gobierno (34), España (30), conjunto (22), país (21) y países (21). De n-gramas aparecen Gobierno de España (16 veces), segundo lugar (10), Presidente del Gobierno (5), conjunto de la ciudadanía (4) y doblegar la curva (4).

Rueda de prensa del presidente del Gobierno tras la reunión con los presidentes autonómicos

Comparecencia del presidente del Gobierno en el Congreso de los Diputados para solicitar la prórroga del Estado de Alarma [Congreso de los Diputados, miércoles 25 de marzo de 2020]

Las palabras más frecuentes son señorías (24 veces), medidas (21), personas (16), alarma (13), gobierno (12) y máxima (10). Y respecto a n-gramas: Ministro de Sanidad (6 veces), millones de euros (5), Congreso de los Diputados (4), Gobierno de España (4), fuerzas políticas (4), todas y cada una (3), prórroga del estado de alarma (3).

Comparecencia del presidente del Gobierno en el Congreso de los Diputados para solicitar la prórroga del Estado de Alarma

Comparecencia del presidente del Gobierno sobre medidas frente al Covid-19 [La Moncloa, sábado 28 de marzo de 2020]

Respecto a las palabras, las más frecuentes son: países (47), España (38), Europa (37), respuesta (36), ahora (30), europea (27) y virus (27). Y los n-gramas son: Gobierno de España (10 veces), ahora mismo (13), sin duda alguna (12), Unión Europea (12), respuesta europea (11), y dos semanas (11). El n-grama momento más crítico que ha vivido se ha repetido 4 veces.

Comparecencia del presidente del Gobierno sobre medidas frente al Covid-19

Comparecencia del presidente del Gobierno sobre nuevas medidas contra la Covid-19 [La Moncloa, sábado 4 de abril de 2020]

Las palabras más frecuentes son vamos (37), semanas (28), Gobierno (28), lógicamente (25), podemos (24), virus (23) y alarma (22). En n-gramas destacan: Gobierno de España (13), hace tres semanas (9), sin duda alguna (11), pactos de La Moncloa (6), vamos a tener (7). La frase sacrificio, resistencia y moral de victoria se repite 3 veces y renunciar a los eurobonos, 4 veces.

Comparecencia del presidente del Gobierno sobre nuevas medidas contra la Covid-19

Comparecencia del presidente del Gobierno ante el Congreso de los Diputados para solicitar la segunda prórroga del Estado de Alarma [Congreso de los Diputados, jueves 9 de abril de 2020]

Las palabras más frecuentes son señorías (36 veces), medidas (33), España (29), crisis (25), Gobierno (25), social (21), país (18) y trabajadores (17). Los n-gramas más usados son: millones de euros (14 veces), Gobierno de España (8), crisis sanitaria (8), nueva normalidad (8), unidad y lealtad (7), económica y social (6). Las frases precios de los servicios funerarios y hoy, aquí y ahora se repiten 2 veces cada una.

Comparecencia del presidente del Gobierno ante el Congreso de los Diputados para solicitar la segunda prórroga del Estado de Alarma

Conferencia de prensa del presidente del Gobierno tras la reunión de la Conferencia de presidentes autonómicos [La Moncloa, domingo 12 de abril de 2020]

Respecto a las palabras más frecuentes, son: Gobierno (24 veces), semana (19 veces en singular, 17 veces en plural), presidente (19), social (18) y España (17). Los n-gramas son: Gobierno de España (10 veces), comunidades autónomas (9), trabajadores y trabajadoras (8), presidentes autonómicos (8) y reconstrucción económica y social (5).

Las frases todas las actividades económicas no esenciales y comité científico que asesora al gobierno se repiten 3 veces cada una.

Conferencia de prensa del presidente del Gobierno tras la reunión de la Conferencia de presidentes autonómicos

Comparación

Como los discursos son de diferente longitud (número de palabras), no tiene sentido comparar directamente la frecuencia de los términos (número de veces que aparecen) entre los diferentes discursos. Por ello, se calcula la relevancia de un término (palabra o n-grama) como la frecuencia relativa, en tanto por mil, respecto al total de palabras del discurso, es decir: score=1000*frecuencia_ngrama/longitud_discurso.

La siguiente figura muestra la evolución desde el primer discurso al último de la relevancia de tres términos concretos: España, Gobierno y país.

Evolución de la relevancia de términos

El uso del término Gobierno (junto a Gobierno de España) fue muy elevado (comparativamente) en el primer discurso del presidente, informando de las medidas tras el Consejo Europeo extraordinario (10 de marzo), en la primera declaración institucional (13 de marzo) y en la rueda de prensa tras la reunión con presidentes autonómicos (22 de marzo), haciendo énfasis en la acción del Ejecutivo. Sin embargo, su empleo fue muy reducido en la primera comparecencia sobre medidas frente a la COVID-19 (28 de marzo), probablemente para evitar centrar en la acción del Gobierno las duras medidas adoptadas.

El empleo del término España es elevado cuando se trata de discursos orientados hacia los ciudadanos (sobre todo la comparecencia del 10 de marzo o la del 21 de marzo), para incidir en la unión de todo el país, mientras que es mucho más reducido en el caso de comparecencias en el Congreso de los Diputados (18 de marzo, 25 de marzo), salvo en la última ocasión (9 de abril), donde se llamaba a la unión de todos los grupos políticos para salir de la crisis.

El término país es difícil de analizar. Podría ser un término comodín, que se use a veces como sinónimo de España, para reforzar las ideas y no ser repetitivo, y otras veces, precisamente para evitar su uso.

Conclusiones

Con este análisis, muy preliminar, hemos querido ilustrar cómo la aplicación de técnicas de Text Analytics al análisis de la comunicación en los discursos del presidente, puede aportar insights valiosos sobre el mensaje que se pretende transmitir y la forma de hacerlo, herramientas de análisis útiles en diferentes disciplinas como son la comunicación política, la publicidad, la literatura y técnicas de escritura, etc.

Las técnicas aplicadas han sido muy básicas, pero la ventaja es que son independientes del idioma, con lo que se pueden aplicar de forma directa a analizar la comunicación de cualquier personaje público. Por supuesto, también es posible aplicar otras técnicas, como las descritas en el apartado de análisis de la comunicación, como intentaremos hacer en futuros artículos.

¿Quieres conocer más detalles sobre cómo se elaboró este estudio o acceder a los datos que nos sirvieron de materia prima? Contáctanos en support@meaningcloud.com.


Acerca de Julio Villena

Technology enthusiast. Head of Innovation at @MeaningCloud: natural language processing, semantics, voice of the customer, text analytics, intelligent robotic process automation. Researcher and lecturer at @UC3M, in love with teaching and knowledge sharing.

Leave a Reply

Your email address will not be published. Required fields are marked *

*
*