Archivo de categorías: Industrias

Esta categoría agrupa los distintos sectores para los que MeaningCloud proporciona soluciones.

Respondiendo a bulos sobre medicamentos mediante Text Analytics

El pasado fin de semana estuvimos divirtiéndonos en el IV Hackathon de Salud con nuestros amigos del Grupo HULAT de la Universidad Carlos III de Madrid y del equipo que Text Mining for Life Sciences del Barcelona Supercomputer Center. En concreto tomábamos parte del reto de Sandoz #medicamentossinbulos, aplicando tecnología de text analytics al proceso de identificación y respuesta a bulos sobre medicamentos.

Un ejemplo de un caso de bulo puede ser este:

Ejemplo de bulo

Ejemplo de bulo

Podemos distinguir distintos tipos de bulos:

  • Describir una falsedad como si fuese una verdad, como en el ejemplo de arriba
  • Afirmaciones no probadas científicamente
  • Indicaciones o efectos adversos no relacionados con el fármaco en cuestión

La propuesta de valor que definimos durante el hackathon es:

Propuesta de Valor

Propuesta de Valor

 

El principal objetivo de nuestra solución es proporcionar información veraz, rápidamente, para reaccionar a un posible bulo. Esto incluye procesar fuentes externas de confianza, como la web de la Agencia Española del Medicamento o del Ministerio de Salud, entre otros, para, de forma inmediata, localizar datos fiables sobre un fármaco o una enfermedad.

Un caso de uso de este sistema se centra en profesionales de la salud: supongamos un paciente que está preguntando a su médico sobre una noticia que ha leído alertando contra el uso de una medicación que el paciente está consumiendo. Si en ese momento el profesional sanitario dispone de información sólida sobre esa noticia, puede responder al paciente referenciando a esas fuentes externas. Por ejemplo, el médico podría decir ‘la Agencia Española del Medicamento no ha publicado ninguna alerta sobre ese medicamento’ .

Durante el hackathon, preparamos una demostración en la que un bot, @trolabot, identificaba posibles bulos en una conversación de Telegram y proporcionaba a los interlocutores enlaces a contenidos veraces que permitían refutar el posible bulo.

Una herramienta de este estilo es también de utilidad para profesionales de la comunicación en el mundo de la salud, tanto influencers como agencias de comunicación.

El primer paso para identificar estos bulos pasa por saber que se menciona un medicamento a través de técnicas de reconocimiento de entidades. Esta tarea no es sencilla dada la dificultad para escribir esos nombres, como es el caso de la fenilpropanolamina. En general, el lenguaje de salud es muy particular, más complejo que el lenguaje común. Basta leer un informe de una consulta médica para darse cuenta. Por ello, para hacer un tratamiento automático de ese lenguaje es necesario contar con herramientas de text analytics capaces de adaptarse a ese lenguaje, incluyendo recursos léxicos y semánticos específicos del dominio, como pueden ser SNOMED, CIE (ICD en sus siglas en inglés), MedDRA, entre muchos otros. Como no podía ser de otra forma, estos recursos han sido preparados por profesionales de la medicina.

Una vez que sabemos que un post, una noticia o un mensaje de whatsapp hablan sobre un fármaco, es necesario determinar si se trata de un bulo. Para ello podemos explotar el tipo de lenguaje que se suele emplear en estos mensajes, donde aparecen palabras o expresiones casi específicas como ‘sanación’o frases como ‘XXX previene enfermedades como YYY’, donde XXX sería el nombre de un fármaco e YYY el nombre de cualquier enfermedad grave para la que no hay cura o para la que el fármaco no está indicado. Hay que tener en cuenta que existen fuentes de información fiable que permiten saber para qué enfermedades y síntomas está indicado un fármaco y para cuáles no. En definitiva, estamos ante un problema de clasificación de textos para el que se puede construir un modelo de clasificación específico. Dado que no se dispone de ejemplos de bulos suficientes como para entrenar un modelo basado en machine learning el punto de partida sería un modelo basado en reglas, extraídas por lingüistas a partir de los casos de bulos conocidos. Con el tiempo, los bulos recogidos pueden alimentar una colección que pueda emplearse para entrenar un nuevo modelo.

En nuestra propuesta para el reto #medicamentossinbulos tiene como núcleo las tecnologías de text analytics descritas y se distinguen dos fases:

Fase de entrenamiento/diseño del modelo de clasificación de bulos

Fase de entrenamiento/diseño del modelo de clasificación de bulos

Esta es la fase de entrenamiento en la que se combina el proceso de reconocimiento de entidades con el de clasificación. En nuestro caso, como decíamos, no hay datos suficientes sobre bulos en medicamentos como para entrenar un modelo basado en machine learning así que se han desarrollado reglas similares a la que se muestra a continuación.

Ejemplo de regla de identificación de bulos

Ejemplo de regla de identificación de bulos ” ‘fármaco’ produce ‘síntoma/enfermedad”

 

Fase de predicción del sistema de identificación de bulos

Fase de predicción del sistema de identificación de bulos

En la fase 2 se aplican en tiempo real los modelos entrenados anteriormente sobre contenidos que pueden provenir de un sistema de monitorización de medios sociales como Twitter, blogs especializados, etc.

Aunque el premio del reto fue para otra gran idea relativa a la identificación segura de lotes de medicamentos retirados, pasamos un buen rato compartiendo experiencias y aprendiendo con los participantes y mentores del hackathon. ¡Veremos qué pasa el año que viene!

 


Farmacovigilancia: Escuchando la voz del paciente

Farmaco-vigilancia: Escuchando la voz del paciente.

Para la industria farmacéutica, es esencial escuchar y comprender los comentarios que sus pacientes actuales y potenciales comunican a través de todo tipo de canales y puntos de contacto.

Si bien existe un protocolo para comunicar a las autoridades, de las reacciones adversas a medicamentos identificadas, solo se informa de un 5 a un 20% de ellas. Afortunadamente, las conversaciones sobre medicamentos, síntomas, afecciones y enfermedades pueden analizarse para aprender más sobre ellas. La inteligencia artificial contribuye de manera decisiva a monitorear los eventos adversos y comprender su impacto en cada fase del desarrollo.

Las narraciones de los pacientes sobre los medicamentos y sus efectos adversos en las redes sociales representan una fuente de datos adicional para el monitoreo de la seguridad de los productos farmacéuticos.

En MeaningCloud, hemos desarrollado una plataforma para automatizar el proceso de monitoreo de efectos adversos en las redes sociales.

Continuar leyendo


Nueva versión del modelo IAB en la API de Categorización Profunda

IAB - Interactive Advertising Bureau

El Interactive Advertising Bureau, también conocido por sus siglas IAB, es quizás la asociación más influyente en la industria de la publicidad en línea y, actualmente, reúne más de 650 empresas líderes del sector, que controlan el 86 % del mercado en los Estados Unidos. Con una fuerte presencia también en el resto del mundo industrializado, hoy en día IAB se ha convertido en un estándar referente para clasificación de contenidos, sobre todo en aquellos sectores fuertemente vinculados con la economía digital y los nuevos medios sociales.

De hecho, IAB promueve técnicas publicitarias como la segmentación por comportamiento, que permite orientar las campañas de marketing a usuarios específicos (según su edad, procedencia, orientación política, intereses, etc.) y aumentar así su eficacia. Por otro lado, el consorcio está avanzando en el ámbito de la publicidad geolocalizada, un área del marketing digital en auge gracias a la difusión masiva de los dispositivos móviles conectados a la red y al fuerte empuje del internet de las cosas. Continuar leyendo


Aplicaciones de la analítica de texto en el sector turismo

Entiende a tus visitantes, mejora tu oferta

El turismo es una de las actividades económicas de mayor volumen, con estadísticas que indican que la gente gasta más dinero en viajes que en mejoras de su vivienda, inversiones financieras o incluso salud.

Y la manera de hacer turismo está cambiando. Por ejemplo, cada vez se emplea más tiempo en investigar los detalles de un viaje usando un dispositivo móvil: en 2016 el 40% de las visitas a los sitios web sobre turismo de Estado Unidos llegaron desde un móvil y el 60% de las búsquedas de información sobre destinos se hicieron desde dispositivos móviles. Y de manera creciente el viajero consume y publica información sobre aspectos turísticos en agencias de viajes online, redes sociales o sitios de reseñas (TripAdvisor, Booking.com, etc.).

Las tecnologías de análisis semántico habilitan una nueva generación de aplicaciones contextuales que nos permiten aprovechar toda esa información y comunicarnos de manera más natural con ese turista hiperconectado, y que van desde el análisis de comentarios sociales hasta una comprensión del lenguaje natural que permite desarrollar asistentes y bots mucho más conversacionales.

Continuar leyendo


Nueva Demo de Salud: etiquetado de medicamentos, síntomas, enfermedades y efectos adversos

Los documentos del dominio de la salud muestran un vocabulario y una estructura lingüística específicos. Si echamos un vistazo a las historias clínicas electrónicas (HCE), también denominadas historias clínicas informatizadas (HCI), vemos que también aparececen datos no estructurados (es decir, texto libre). Este texto libre contiene nombres extraños de medicamentos y enfermedades que son incluso difíciles de leer. Por todas estas razones, las técnicas de analítica de texto deben adaptarse al dominio de la salud. Hemos reunido una serie de recursos en una demo que muestra cómo MeaningCloud puede etiquetar nombres de medicamentos, síntomas, enfermedades, procedimientos, etc.

Accede a la demo gratuita: https://www.meaningcloud.com/health-demo

Continuar leyendo


¿Qué es Real World Evidence y por qué es importante?

Real World Evidence. Blurred image of a hospital

La Real World Evidence (o Real World Data), en el área de salud se fundamenta en datos masivos recolectados de millones de pacientes en condiciones de la vida real, fuera del contexto de los ensayos clínicos. De este modo, más  allá de  la eficacia y las toxicidad de un tratamiento, se evalúa la a calidad de vida del paciente, la adherencia o  la capacidad de un paciente para hacer frente al coste del tratamiento. La analítica de texto es un componente esencial de de este área de conocimiento.

La austeridad y los recortes de precios relacionados con los medicamentos han puesto una presión sin precedentes en la industria farmacéutica. Se pide a los fabricantes que proporcionen información relacionada no sólo con la seguridad, el uso apropiado, y la eficacia, sino también sobre el valor clínico y económico de sus medicamentos.

Esta tendencia es global (no es solo un problema de España o de Europa) y es particularmente evidente en las áreas terapéuticas de alto costo (como la artritis reumatoide, la diabetes, y la oncología), donde se están introduciendo un gran número de nuevas y costosas terapias para el tratamiento de enfermedades crónicas.

Por otra parte, desde hace unos años disponemos de muchos nuevos datos (como las historias clínicas electrónicas) y herramientas analíticas sofisticadas que nos permiten extraer un valor considerable de ellos. Podemos evaluar los costes de las enfermedades,  la eficiencia de un tratamiento (sus costes, beneficios y riesgos), comparar la efectividad de tratamientos diversos o medir los resultados de las intervenciones a largo plazo.

Continuar leyendo


10 formas de aumentar beneficios para medios. Ebook

El proceso de creación y gestión de “contenidos inteligentes” se conoce a menudo dentro del sector de la minería de texto como “publicación semántica” o también como “enriquecimiento de contenidos”. Los tres conceptos (“contenidos inteligentes”, “publicación semántica” y “enriquecimiento de contenidos”) son en la práctica sinónimos.
En MeaningCloud hemos creado un libro electrónico.

El contexto de negocio en medios: los problemas que hemos encontrado.

Aunque el negocio de venta offline sigue siendo rentable para unos pocos, los suscriptores y compradores de papel son cada vez menos y continúan envejeciendo.
Por otra parte, la distribución generalizada y al instante de información a través de Internet ha convertido a las noticias en un producto no diferenciado (“commodity”) del que pueden disponer gratuitamente y por el que los usuarios de medios no están generalmente dispuestos a pagar.

Algunos editores de contenidos se han dado cuenta de que para conseguir clientes que paguen por esos contenidos es fundamental agregar valor a través de una mejor creación, promoción, entrega y presentación de su materia prima, de los contenidos. Igualmente, el camino de la publicidad online sigue siendo un “valor seguro”, aunque a menudo insuficiente, para la mayoría de los que publican contenidos.

En el ebook vemos 10 formas en las que los contenidos inteligentes son imprescindibles en este proceso de agregación de valor y de mejora de rentabilidad.

Continuar leyendo


El etiquetado automático IAB hace posible la publicidad semántica

Nuestra API de Text Classification soporta la taxonomía contextual estándar del IAB permitiendo etiquetar contenidos según ese modelo en grandes volúmenes y a gran velocidad y facilitando la participación en el nuevo ecosistema de publicidad online. El resultado es la impresión de anuncios en el contexto más adecuado, con un mayor rendimiento y protección de marca para los anunciantes.

Qué es la clasificación contextual de IAB y para qué sirve

La taxonomía contextual IAB QAG fue inicialmente desarrollada por el Interactive Advertising Bureau (IAB) como centro de su programa Quality Assurance Guidelines, que buscaba promover la seguridad de las marcas anunciantes, garantizando que sus anuncios no aparecían en un contexto de contenido inadecuado. El programa QAG incluía posibilidades de certificación para todo tipo de agentes en la cadena de valor de la publicidad digital, desde redes y exchanges publicitarios hasta publishers, supply side platforms (SSPs), demand side platforms (DSPs) y agency trading desks (ATDs).

Las Quality Assurance Guidelines sirven como un marco de autorregulación que garantiza a los anunciantes que sus marcas están seguras, aumenta el control de los anunciantes sobre la ubicación y el contexto de sus anuncios y ofrece transparencia al mercado estandarizando la información que fluye entre los agentes, al proporcionar un lenguaje claro y común que describe las características del inventario publicitario y de las transacciones a través de la cadena de valor.

Esencialmente la taxonomía contextual sirve para etiquetar contenidos y se compone de unos niveles 1 y 2 estándar -que especifican respectivamente la categoría general del contenido y una serie de subcategorías anidadas dentro de esa categoría principal- y de unos niveles 3 y siguientes que pueden ser definidos por cada organización. Las siguientes figuras presentan dichos niveles estándar.

Continuar leyendo


Grabación del webinar: 10 formas de aumentar los beneficios de los medios utilizando metadatos

Ayer celebramos nuestro webinar “10 formas de aumentar los beneficios de los medios utilizando metadatos”, con la participación como invitado de Mario Tascón, experto en transformación digital de medios.

A continuación tenéis acceso a la documentación y a la grabación del webinar.

Y como complemento, haciendo clic en el siguiente enlace podéis descargaros el e-book inédito “Contenidos Inteligentes – 10 formas de aumentar los beneficios de medios y otros editores utilizando metadatos”, donde se discuten en más detalle los contenidos del webinar.

Esperamos que os guste.

Continuar leyendo


Voz del Cliente en Seguros

Para las compañías de seguros resulta vital entender el feedback que sus clientes -actuales y potenciales- expresan a través de todo tipo de canales y puntos de contacto. A toda esta valiosa información le llamamos la Voz del Cliente. Por cierto, no hace mucho, le dedicamos un post al papel de la Minería de texto en el sector de seguros.

(Este post es un desarrollo de la presentación de meaningcloud.com en el I Congreso de Big Data en el sector asegurador español organizado por ICEA. Más abajo tenemos la presentación que hicimos desde Meaning Cloud).

Cada vez hay más empresas que entienden que para crecer de forma rentable en entornos de mucha competencia, necesitan clientes satisfechos. Conseguir diferenciación entre los productos de las aseguradoras no resulta fácil.  La experiencia del cliente (Customer Experience) es un elemento fundamental en el éxito comercial del sector.

Escuchar, entender y actuar sobre lo que los clientes nos están diciendo sobre su experiencia con nuestras compañías está directamente relacionado con la mejora de la Experiencia de Usuario y con la rentabilidad. En el post sobre Voz del Cliente y NPS vimos con más detalle esta correlación entre experiencia de cliente y beneficios.

 

Continuar leyendo