Archivo del autor: Jose C. Gonzalez

Acerca de Jose C. Gonzalez

CEO at MeaningCloud. PhD in Telecommunication Engineering. Professor at Technical University of Madrid (1985-2015).

Tecnología del Lenguaje contra Desinformación

Desde las elecciones presidenciales americanas de 2016, donde se hizo muy patente el uso de noticias falsas en medios sociales como arma electoral, la preocupación de los ciudadanos y de los gobiernos por el fenómeno de la desinformación ha ido en aumento.

A modo de ejemplo, la Comisión Europea dirigió al Parlamento Europeo un “Plan de Acción contra la Desinformación” en diciembre de 2018.

En España, el Consejo de Seguridad Nacional acaba de adoptar un “Procedimiento de actuación contra la desinformación”. (Orden ministerial publicada en el BOE con fecha 5 de noviembre de 2020). Esta orden ha generado bastante controversia por su posible colisión con la libertad de expresión y el derecho a la información. Sobre las dudas planteadas por este texto, conviene leer el artículo de Borja Adsuara, publicado en el diario “El País” el día 12 de noviembre de 2020 y titulado “La ambigüedad del concepto de desinformación”. Continuar leyendo


Luchando contra el coronavirus juntos – Mensaje del director

Fighting COVID-19

Queridos amigos:

En estos días difíciles por el impacto brutal del coronavirus en nuestras vidas, nos hemos planteado cómo poder ayudar a nuestros clientes y amigos, y a las comunidades de las que forman parte nuestros empleados.

En primer lugar, creemos que continuar con nuestro trabajo diario y cumplir los compromisos con nuestros clientes es nuestra mejor aportación a la economía global y a la recuperación económica que tendrá que venir. Es imprescindible que las empresas del ámbito digital, que podemos seguir desarrollando nuestra actividad mediante el teletrabajo, mantengamos nuestra aportación a la generación de riqueza en un momento como este. La pérdida de empleo y el descomunal gasto público causado por la pandemia, con incalculables costes en protección sanitaria, social y empresarial, nos obliga moralmente a contribuir al sostenimiento de la economía desde nuestra trinchera tecnológica.

Continuar leyendo


Mejorando la gestión de emergencias analizando contenidos en redes sociales

¿Servir a los ciudadanos sin escuchar los medios sociales?App Llamada Emergencias

Los canales tradicionales de acceso a los servicios de emergencias por parte de los ciudadanos (típicamente a través de los teléfonos 112) deben ser expandidos con el análisis de medios sociales en tiempo real (canales web 2.0). Esta observación es el punto de partida de una de las líneas en las que el Grupo Telefónica (uno de los proveedores de referencia mundiales en sistemas integrados de gestión de emergencias) ha venido trabajando con vistas a su integración en su plataforma SENECA.

 

Cuadro de mando social para gestión de emergencias

Desde Daedalus (ahora MeaningCloud), hemos trabajado para Telefónica en el desarrollo de un cuadro de mando social que analiza y organiza la información compartida en redes sociales (inicialmente Twitter) antes, durante y después de que se produzca un incidente de interés para los servicios de atención a emergencias. Desde el punto de vista funcional, esto conlleva:

  • Recoger las interacciones (tuits) relativos a incidencias en un área geográfica determinada
  • Clasificarlas según el tipo de incidencia (concentraciones, accidentes, desastres naturales…)
  • Identificar la fase en el ciclo de vida de la incidencia (alerta o pre-incidencia, incidencia o post-incidencia)

 

Beneficios para las organizaciones que gestionan emergencias

Anticipar incidentes

Love Parade Duisburg

Anticipación a eventos que, por imprevisibles o por desconocerse su magnitud a priori, deban ser objeto de atención futura por los servicios de atención a emergencias. Dentro de este escenario se encuentran los eventos sobre concentración de personas que son convocados, difundidos o simplemente comentados a través de redes sociales (asistencia a eventos festivos o deportivos, manifestaciones, etc.) Predecir las dimensiones y alcance de estos eventos es fundamental para planificar la atención por parte de las diferentes autoridades. Recordemos en este sentido el caso de los disturbios a raíz de una fiesta de cumpleaños convocada en la localidad holandesa de Haren a través de la red Facebook en 2012 o la tragedia de la Love Parade de Duisburg.

Continuar leyendo


El papel de la Minería de Texto en el Sector de Seguros

¿Qué pueden hacer las aseguradoras para explotar toda su información no estructurada?

Un escenario típico de big data

Las compañías de seguros recogen ingentes volúmenes de texto diariamente, a través de múltiples canales (sus agentes, centros de atención a clientes, correo electrónico, redes sociales, web en general). Las informaciones recogidas incluyen pólizas, informes periciales y de salud, reclamaciones y quejas, resultados de encuestas, interacciones relevantes de clientes y no-clientes en redes sociales, etc. Es imposible atender, clasificar, interpretar o extraer la información esencial de todo ese material.

El Sector de Seguros es uno de los que más puede beneficiarse de la aplicación de las tecnologías para análisis inteligente de texto en formato libre (conocido como Analítica de Textos, Minería de Textos o Procesamiento de Lenguaje Natural).

Para las aseguradoras, se añade el reto de combinar el resultado del análisis de esos contenidos textuales con datos estructurados (almacenados en bases de datos convencionales) para mejorar la toma de decisiones. En este sentido, los analistas del sector consideran decisivo el uso de múltiples tecnologías basadas en Inteligencia Artificial (sistemas inteligentes), aprendizaje automático (minería de datos) y procesamiento de lenguaje natural, (tanto estadístico como simbólico o semántico).

Áreas más prometedoras de la analítica de textos en el Sector de Seguros

Detección de fraude

Detección de Fraude
Según Accenture, en un informe publicado en 2013, se estima que las compañías aseguradoras pierden en Europa entre 8.000 y 12.000 millones de euros al año debido a reclamaciones fraudulentas, con una tendencia creciente. Asimismo, el sector estima que entre un 5% y un 10% de las indemnizaciones abonadas por las compañías en el año anterior eran por motivos fraudulentos, no pudiendo ser detectados debido a la falta de herramientas analíticas predictivas.

Según el medio especializado “Health Data Management”, el sistema de prevención de fraude de Medicare en EE.UU., basado en algoritmos predictivos que analizan patrones en la facturación de proveedores, ahorró más de 200 millones de dólares en pagos rechazados en 2013.

Continuar leyendo


Análisis de la Experiencia del Cliente, la evolución del mercado de las Tecnologías del Lenguaje

Acaba de celebrarse en Bruselas la conferencia LT-Innovate 2014. LT-Innovate es un foro y una asociación de empresas europeas del sector de las tecnologías de la lengua. Para hacerse una idea del significado y de la importancia de este mercado, baste decir que en Europa cuenta con unas 450 empresas (en su mayoría PYMEs innovadoras), responsables del 0,12% del PIB europeo. Daedalus es una de las quince empresas europeas (y única española) formalmente miembros de LT-Innovate Ltd. desde su constitución como sociedad, con sede en Reino Unido, en 2012.

LTI_Manifesto_201406

LT-Innovate Innovation Manifesto 2014

En esta edición de 2014, se ha hecho público el documento “LT-Innnovate Innovation Manifesto: Desvelando la promesa de las industrias de la tecnología del lenguaje para el mercado único digital europeo”. Tuve el honor de formar parte de la mesa redonda que servía de apertura a la conferencia. El principal argumento de mi intervención era el cambio cualitativo experimentado en los últimos tiempos en el papel de nuestras tecnologías en los mercados en los que nos movemos. Durante años hemos estado incorporando nuestros sistemas para resolver problemas específicos acotados a áreas muy limitadas en nuestros clientes, más o menos visionarios o innovadores. Esta situación ha cambiado ya por completo: las tecnologías del lenguaje desempeñan ahora un papel central en un creciente número de negocios.

Las Tecnologías del Lenguaje en el Sector de los Medios

En un post reciente, me refería a esto mismo con respecto al sector de los medios de comunicación. Donde antes incorporábamos una solución para automatizar la anotación de contenidos del archivo, ahora desplegamos soluciones que afectan a la mayor parte de los aspectos del negocio editorial: etiquetamos semánticamente noticias para mejorar la experiencia de búsqueda en cualquier canal (web, móviles, tabletas), para recomendar contenidos relacionados o amedida del perfil de intereses de un lector concreto, para facilitar la encontrabilidad y la indexación por buscadores (SEO, Search Engine Optimization), para colocar publicidad en función del contexto noticioso o de la intención de los lectores, para ayudar a monetizar los contenidos de formas nuevas, etc.

Continuar leyendo


Publicación Semántica: caso de estudio para los Medios

Publicación semántica en Unidad Editorial: caso de estudio de un cliente en el sector de los medios de comunicación 

El pasado año, el grupo de medios español Unidad Editorial desarrolló y desplegó una nueva plataforma de gestión de contenidos para su redacción integrada. Unidad Editorial es una compañía del grupo italiano RCS MediaGroup y publica algunos de los periódicos y revistas con mayor circulación de España, además de contar con una cadena de emisoras de radio y una licencia de televisión digital terrestre con cuatro canales.

Newsroom El Mundo

Newsroom El Mundo

Cuando un periodista escribe una pieza (noticia, columna, reseña) y la incorpora al gestor de contenidos, hay que etiquetarla semánticamente como uno de los primeros pasos dentro de un flujo de trabajo que terminará con su despliegue en diferentes formatos, a través de diversos canales (papel, web, tabletas y aplicaciones móviles) y en diferentes cabeceras. Tras un proceso de evaluación de proveedores en los meses anteriores, la compañía seleccionó la tecnología de analítica de texto de Daedalus para el procesamiento semántico de las noticias. La publicación semántica incluía, en este caso, la identificación (con desambiguación) de entidades nombradas en la noticia (personalidades, lugares, organizaciones, etc.), expresiones temporales y monetarias, conceptos y palabras o expresiones clave, clasificación del texto conforme al esquema IPTC (estándar internacional para la clasificación de noticias en más de 1400 clases organizadas en tres niveles), análisis de sentimiento, etc.

Continuar leyendo


Patrocinio: Sentiment Analysis Symposium

Los próximos 5 y 6 de marzo tendrá lugar en Nueva York una nueva edición del Sentiment Analysis Symposium. Este es el séptimo evento de una serie organizada por el experto en el sector Seth Grimes desde el año 2010 en San Francisco y Nueva York.

Se trata de una conferencia única en varios aspectos. En primer lugar, está diseñada específicamente para atender a la comunidad de profesionales interesados en el campo de Human Analytics y sus aplicaciones de negocio. En segundo, su audiencia está integrada por una mezcla de expertos, estrategas, profesionales, investigadores y proveedores de soluciones, lo que lo convierte en un terreno perfectamente abonado para la discusión y el intercambio de puntos de vista. Y en tercer lugar, está diseñado por una sola persona (no por un comité), lo que le da una garantía de consistencia. Como experto en el negocio de la consultoría, Seth Grimes consigue el equilibrio perfecto en unas presentaciones que abarcan desde la tecnología a las aplicaciones de negocio. Asistí a la edición del evento de 2012 en Nueva York, donde impartí una breve ponencia, y puedo afirmar que la experiencia fue realmente enriquecedora.

Sentiment Analysis Symposium 2014

Pero que el título no nos confunda: no interpretemos “Análisis de Sentimiento” en un sentido restrictivo. La conferencia versa sobre cómo descubrir el valor de negocio en las opiniones, emociones y actitudes presentes en medios sociales, noticias y feedback empresarial. Además, el alcance no se limita a fuentes de texto: la voz y la imagen son también términos de la ecuación.

Continuar leyendo