Archivo de categorías: Industrias

Esta categoría agrupa los distintos sectores para los que MeaningCloud proporciona soluciones.

¿Pueden los antidepresivos causar malformaciones en el feto?

Puede que no sea lo más común que en el blog de una empresa de tecnología de la información se hable de antidepresivos y embarazos, lo entendemos perfectamente. Pero en MeaningCloud hemos comprobado que los temas de salud tienen una fuerte repercusión en medios sociales y las empresas del sector, incluyendo las farmacéuticas, harían bien en tratar de entender la conversación que se genera alrededor. ¿Cómo? Mediante la tecnología de análisis de texto, como veremos a continuación.

Mirando los datos recogidos por nuestro prototipo para la monitorización de temas de salud en medios sociales nos sorprendimos del repentino incremento de menciones del término ‘embarazo’ el día 10 de julio. Para saber el porqué de este dato, acudimos a los tuits que hablaban sobre ese estado de buena esperanza. Resulta que ese mismo día se había publicado una noticia sobre un estudio aparecido en el British Medical Journal sobre los efectos nocivos que los antidepresivos pueden causar en el feto durante el embarazo.
Continuar leyendo


Analizando datos sobre salud en medios sociales

El análisis de medios sociales puede ser una buena inversión en el área de salud. A la gente le encanta compartir información en los medios sociales, incluso datos sobre salud. ¡Sí, es verdad! Y constituye el punto de partida del trabajo de investigación titulado ‘Exploring Spanish health social media for detecting drug effects’, cuyo objetivo es monitorizar las conversaciones en medios sociales para averiguar cómo hablan los usuarios sobre su relación con el consumo de fármacos. Esto permite identificar posibles efectos adversos hasta ahora desconocidos relacionados con dichos fármacos. Aunque existe un protocolo oficial para informar a las autoridades competentes de la existencia de algún efecto adverso no documentado, se llegan a comunicar solamente un 5 – 20 % de ellos. Además, se pueden analizar las conversaciones sobre fármacos, síntomas, condiciones y enfermedades para obtener más información. Por ejemplo, es posible descubrir cómo los usuarios buscan medicamentos específicos a través de los medios sociales o cómo algunos se dedican a venderlos, a menudo de forma ilegal; muchos otros hablan de la mezcla de alcohol con drogas u otras sustancias ilegales. Por supuesto, no todo lo que aparece en internet es fiable—este es otro tema—, pero puede estimular el planteamiento de nuevas hipótesis.

drugs

El equipo de investigación Grupo de Bases de Datos Avanzadas de la Universidad Carlos III de Madrid ha llevado a cabo la investigación mencionada y ha desarrollado modelos híbridos para obtener el conocimiento necesario para identificar efectos adversos. La plataforma de procesamiento del lenguaje natural que ha permitido el análisis basado en esos modelos es MeaningCloud. Las capacidades de personalización que ofrece esta plataforma han sido decisivas, puesto que han facilitado la integración de vocabulario específico y otros conocimientos del dominio de la medicina. Como sabemos, los nombres de los medicamentos y de los síntomas pueden ser muy complicados y a menudo no es fácil escribirlos adecuadamente. Los resultados del algoritmo son prometedores, ya que su recall es un 10 % mayor que el de otros algoritmos conocidos. Puedes encontrar más detalles en el artículo científico publicado por la revista BMC Medical Informatics and Decision Making Journal. Estos desarrollos forman parte del proyecto TrendMiner y están disponibles en la página web: TrendMiner Health Analytics Dashboard, que recopila los comentarios de los usuarios de medios sociales sobre fármacos antidepresivos. La consola muestra los antidepresivos mencionados junto con los síntomas relacionados; haciendo clic en cada uno de ellos se puede consultar su evolución a lo largo del tiempo. Además, en la parte inferior de la página se muestran los textos originales que se han analizado para extraer dichas menciones, los nombres de medicamentos, síntomas, enfermedades y cualquier relación haya sido identificada entre ellos. Esas relaciones pueden revelar si un fármaco es adecuado para un determinado síntoma o si una enfermedad es, en realidad, un efecto adverso provocado por el medicamento mencionado. El prototipo permite también hacer búsquedas utilizando el código ATC (Anatomical Therapeutic Chemical Classification System) y el nivel correspondiente según este sistema de clasificación. Si se activa la opción ‘By Active Substance’ [‘por principio activo’], se buscará cualquier fármaco contenga el principio activo del producto buscado. Por otro lado, la funcionalidad de búsqueda predictiva permitirá encontrar más fácilmente la expresión correcta para referirse a un fármaco o a una enfermedad.

Las empresas del dominio de salud y las farmacéuticas ya pueden explotar su información no estructurada


En la industria farmacéutica y de salud
, tenemos a nuestra disposición nuevas herramientas de ciencia de datos capaces de extraer información valiosa sobre documentos de redacción libre como las historias clínicas electrónicas. Es posible explotar la información asociada a datos como el coste de tratamientos médicos, su eficiencia (precio, ventajas y riesgos), referencias a fármacos, efectos secundarios o resultados a largo plazo.

[/raw]


Efectos adversos de los medicamentos y medios sociales

Las reacciones adversas a medicamentos (RAM) son el problema más importante de seguridad en el campo de la salud. Se refieren a los efectos dañinos y no intencionados que producen los fármacos en el tratamiento de enfermedades y profilaxis, ya sea cuando se administran dosis normales, ya sea cuando se incurre en errores de medicación o usos incorrectos. Son la cuarta causa de muerte en pacientes hospitalizados en EEUU. Por ello, el área de la farmacovigilancia está recibiendo una gran atención debido a la gran incidencia de las RAM y al alto coste que llevan asociadas (entre el 15 y el 20 por ciento del gasto hospitalario se debe a complicaciones debidas a fármacos).

Determinadas RAM no se descubren durante los ensayos clínicos dado que no pueden conocerse hasta que el fármaco lleva varios años en el mercado. Por ello, las agencias de medicamentos deben vigilar las RAM una vez comercializado el medicamento, y el principal instrumento del que disponen son los sistemas de notificación voluntaria en los que profesionales y pacientes informan sobre sospechas de RAM (en España los pacientes pueden informar desde julio de 2012). Sin embargo, estos sistemas apenas se utilizan, pues se estima que solo se notifican entre un 5% y un 20% de las RAM, ya sea por la falta de tiempo, por la complejidad del proceso, por el poco conocimiento respecto a las RAM o por la mala coordinación entre niveles asistenciales.

En el marco del proyecto europeo TrendMiner se ha creado un prototipo para analizar comentarios en redes sociales que incorpora el procesamiento semántico de MeaningCloud para reconocer las menciones de fármacos, efectos adversos y enfermedades. El sistema visualiza la evolución de estas menciones y sus “coocurrencias”, es decir, registra qué fármacos se mencionan y con qué efectos adversos. Por ejemplo, el sistema monitoriza fármacos pertenecientes a la familia de los ansiolíticos y para ello no solo tiene en cuenta las menciones de los principios activos o medicamentos genéricos de este grupo (entre otros el lorazepam y el diazepam) sino también las marcas comerciales (como el Orfidal). Todas estas menciones se pueden analizar además en relación con sus efectos terapéuticos (entre los cuales están Orfidal indicado para ansiedad) y sus efectos adversos (tales como Orfidal puede producir temblores).

Para más información sobre el proyecto, desarrollado con la participación de la Universidad Carlos III de Madrid, ir al sitio web de la universidad.

Las empresas del dominio de salud y las farmacéuticas ya pueden explotar su información no estructurada


En la industria farmacéutica y de salud
, tenemos a nuestra disposición nuevas herramientas de ciencia de datos capaces de extraer información valiosa sobre documentos de redacción libre como las historias clínicas electrónicas. Es posible explotar la información asociada a datos como el coste de tratamientos médicos, su eficiencia (precio, ventajas y riesgos), referencias a fármacos, efectos secundarios o resultados a largo plazo.


La Voz del Cliente: el sector bancario

«La Voz del cliente (VoC) es una técnica de investigación de mercado que permite descubrir con precisión lo que un cliente desea o necesita, dándole una estructura jerárquica y asignándole prioridad en función de su importancia relativa y satisfacción con las alternativas existentes»

Voz del cliente (VoC)

La Voz del cliente (VoC) no es un concepto nuevo. De una manera u otra, ha sido incluida en los procesos de control de calidad desde hace años, pero su plena integración en el flujo de trabajo sigue siendo una tarea pendiente para muchas empresas. La Voz del Cliente permite escuchar, interpretar y reaccionar a lo que se dice y luego seguir a lo largo del tiempo el impacto de las acciones llevadas a cabo.

El desafío actual al que se enfrentan las empresas reside en el volumen de datos disponibles. En esta era digital, las opiniones están aumentando constantemente y ya no se limitan a las encuestas periódicas que se envían a los clientes. El boca a boca es ahora digital y se ha vuelto más relevante que nunca: cualquier persona con una cuenta de Facebook o Twitter expresa una opinión, y cada vez más es sobre los productos y servicios que utiliza.

Un cliente típico

Un cliente

Al igual que muchos otros, el sector bancario necesita saber cómo convertir la fuente de conocimiento de primera mano que le aportan sus clientes en algo útil, algo que se pueda utilizar en el proceso de toma de decisiones de la empresa.

La Voz del Cliente combina dos elementos clave de la extracción de información: la necesidad de conocer en detalle de qué está hablando el cliente e interpretar correctamente los sentimientos asociados. El primer aspecto permite evaluar la opinión expresada desde una perspectiva cuantitativa, mientras que el segundo permite — más bien desde un punto de vista cualitativo — entender qué está haciendo bien o mal una empresa según el cliente.

El sector bancario tiene la dificultad añadida de proporcionar una muy amplia gama de productos y servicios, cada uno de ellos con subcategorías muy específicas y proporcionados a través de canales completamente diferentes.

Continuar leyendo


El papel de la Minería de Texto en el Sector de Seguros

¿Qué pueden hacer las aseguradoras para explotar toda su información no estructurada?

Un escenario típico de big data

Las compañías de seguros recogen ingentes volúmenes de texto diariamente, a través de múltiples canales (sus agentes, centros de atención a clientes, correo electrónico, redes sociales, web en general). Las informaciones recogidas incluyen pólizas, informes periciales y de salud, reclamaciones y quejas, resultados de encuestas, interacciones relevantes de clientes y no-clientes en redes sociales, etc. Es imposible atender, clasificar, interpretar o extraer la información esencial de todo ese material.

El Sector de Seguros es uno de los que más puede beneficiarse de la aplicación de las tecnologías para análisis inteligente de texto en formato libre (conocido como Analítica de Textos, Minería de Textos o Procesamiento de Lenguaje Natural).

Para las aseguradoras, se añade el reto de combinar el resultado del análisis de esos contenidos textuales con datos estructurados (almacenados en bases de datos convencionales) para mejorar la toma de decisiones. En este sentido, los analistas del sector consideran decisivo el uso de múltiples tecnologías basadas en Inteligencia Artificial (sistemas inteligentes), aprendizaje automático (minería de datos) y procesamiento de lenguaje natural, (tanto estadístico como simbólico o semántico).

Áreas más prometedoras de la analítica de textos en el Sector de Seguros

Detección de fraude

Detección de Fraude
Según Accenture, en un informe publicado en 2013, se estima que las compañías aseguradoras pierden en Europa entre 8.000 y 12.000 millones de euros al año debido a reclamaciones fraudulentas, con una tendencia creciente. Asimismo, el sector estima que entre un 5% y un 10% de las indemnizaciones abonadas por las compañías en el año anterior eran por motivos fraudulentos, no pudiendo ser detectados debido a la falta de herramientas analíticas predictivas.

Según el medio especializado “Health Data Management”, el sistema de prevención de fraude de Medicare en EE.UU., basado en algoritmos predictivos que analizan patrones en la facturación de proveedores, ahorró más de 200 millones de dólares en pagos rechazados en 2013.

Continuar leyendo


Análisis de la Experiencia del Cliente, la evolución del mercado de las Tecnologías del Lenguaje

Acaba de celebrarse en Bruselas la conferencia LT-Innovate 2014. LT-Innovate es un foro y una asociación de empresas europeas del sector de las tecnologías de la lengua. Para hacerse una idea del significado y de la importancia de este mercado, baste decir que en Europa cuenta con unas 450 empresas (en su mayoría PYMEs innovadoras), responsables del 0,12% del PIB europeo. Daedalus es una de las quince empresas europeas (y única española) formalmente miembros de LT-Innovate Ltd. desde su constitución como sociedad, con sede en Reino Unido, en 2012.

LTI_Manifesto_201406

LT-Innovate Innovation Manifesto 2014

En esta edición de 2014, se ha hecho público el documento “LT-Innnovate Innovation Manifesto: Desvelando la promesa de las industrias de la tecnología del lenguaje para el mercado único digital europeo”. Tuve el honor de formar parte de la mesa redonda que servía de apertura a la conferencia. El principal argumento de mi intervención era el cambio cualitativo experimentado en los últimos tiempos en el papel de nuestras tecnologías en los mercados en los que nos movemos. Durante años hemos estado incorporando nuestros sistemas para resolver problemas específicos acotados a áreas muy limitadas en nuestros clientes, más o menos visionarios o innovadores. Esta situación ha cambiado ya por completo: las tecnologías del lenguaje desempeñan ahora un papel central en un creciente número de negocios.

Las Tecnologías del Lenguaje en el Sector de los Medios

En un post reciente, me refería a esto mismo con respecto al sector de los medios de comunicación. Donde antes incorporábamos una solución para automatizar la anotación de contenidos del archivo, ahora desplegamos soluciones que afectan a la mayor parte de los aspectos del negocio editorial: etiquetamos semánticamente noticias para mejorar la experiencia de búsqueda en cualquier canal (web, móviles, tabletas), para recomendar contenidos relacionados o amedida del perfil de intereses de un lector concreto, para facilitar la encontrabilidad y la indexación por buscadores (SEO, Search Engine Optimization), para colocar publicidad en función del contexto noticioso o de la intención de los lectores, para ayudar a monetizar los contenidos de formas nuevas, etc.

Continuar leyendo


Publicación Semántica: caso de estudio para los Medios

Publicación semántica en Unidad Editorial: caso de estudio de un cliente en el sector de los medios de comunicación 

El pasado año, el grupo de medios español Unidad Editorial desarrolló y desplegó una nueva plataforma de gestión de contenidos para su redacción integrada. Unidad Editorial es una compañía del grupo italiano RCS MediaGroup y publica algunos de los periódicos y revistas con mayor circulación de España, además de contar con una cadena de emisoras de radio y una licencia de televisión digital terrestre con cuatro canales.

Newsroom El Mundo

Newsroom El Mundo

Cuando un periodista escribe una pieza (noticia, columna, reseña) y la incorpora al gestor de contenidos, hay que etiquetarla semánticamente como uno de los primeros pasos dentro de un flujo de trabajo que terminará con su despliegue en diferentes formatos, a través de diversos canales (papel, web, tabletas y aplicaciones móviles) y en diferentes cabeceras. Tras un proceso de evaluación de proveedores en los meses anteriores, la compañía seleccionó la tecnología de analítica de texto de Daedalus para el procesamiento semántico de las noticias. La publicación semántica incluía, en este caso, la identificación (con desambiguación) de entidades nombradas en la noticia (personalidades, lugares, organizaciones, etc.), expresiones temporales y monetarias, conceptos y palabras o expresiones clave, clasificación del texto conforme al esquema IPTC (estándar internacional para la clasificación de noticias en más de 1400 clases organizadas en tres niveles), análisis de sentimiento, etc.

Continuar leyendo


Nueva API de Publicación Semántica en MeaningCloud

Esta API permite producir y publicar contenidos más valiosos, más rápidamente y con menor coste

ACTUALIZACIÓN: esta API ha sido discontinuada. En su lugar usa nuestra Solución para Publicación Semántica, que incorpora APIs como Extracción de Topics, Clasificación de Textos o Resúmenes Automáticos.

En MeaningCloud seguimos desarrollando nuestro roadmap y ofreciendo nuevas API verticales, optimizadas para diversos sectores y aplicaciones. Es un placer anunciar que ya está disponible nuestra API de Publicación Semántica, especialmente dirigida a medios de comunicación, editoriales y proveedores de contenidos en general.

Es un paso natural ya que en S|ngular Meaning (nuestra empresa matriz, antes llamada “Daedalus”) llevamos años colaborando con las compañías más significativas de estos sectores (PRISA, Unidad Editorial, Vocento, RTVE, lainformacion.com…) y éste es uno de los mercados donde más demanda estamos detectando y más tracción están consiguiendo nuestras soluciones.

La API de Publicación Semántica incorpora el know-how que hemos desarrollado colaborando con estas grandes empresas y lo empaqueta en forma de recursos semánticos, pipelines de proceso y configuraciones específicas para los escenarios y aplicaciones más habituales de este sector: gestión de archivo, generación de contenidos, personalización de productos informativos, etc.

Continuar leyendo


TV Social con Análisis Semántico y Big Data

Recientemente hemos participado en la conferencia Big Data Spain con una charla titulada “Real time semantic search engine for social TV streams”. En esta charla resumimos nuestra experiencia en el área de Analítica de Medios Sociales, donde estamos combinando tecnologías de análisis semántico y de procesamiento de flujos de datos (streams) en tiempo real para entender las redes sociales y en concreto la TV Social

La TV Social es un fenómeno en claro crecimiento ya que cada vez es más frecuente el uso de redes sociales mientras vemos la televisión. Por ejemplo, Twitter ya reportaba el año pasado que en Reino Unido más de un tercio de todos los comentarios durante el primetime eran sobre lo que pasaba en la pantalla del televisor. Hace semanas, Facebook reivindicaba su lugar en la TV social afirmando que el volumen de comentarios privados sobre TV en su plataforma era 5 veces mayor. Esta red social ha empezado también a ofrecer hashtags e incluso una nueva API, Keywords Insight, para que algunos socios tengan acceso a estadísticas agregadas de las conversaciones dentro de los muros de Facebook.

A medida que el número de usuarios que acaban comentando su programa favorito de TV en las redes sociales con amigos o extraños, las cadenas han empezado a hacer uso de estas herramientas para participar en la conversación. Durante el último año se ha incrementado el número de programas que hacen uso de hashtags oficiales, a veces incluso varios durante una sola emisión. Más allá de la búsqueda del trending topic, los que con mayor éxito han experimentado fomentan incluso la participación de presentadores o actores durante la emisión del programa. En España, “Salvados” o “Pesadilla en la Cocina” son ejemplo de lo primero y la serie “Isabel” para el caso de los actores.   

Aunque no hay nada nuevo en el hecho de socializar alrededor del contenido de la tele, la posibilidad de medir y de destilar estos comentarios sí que es característico del nuevo contexto. Además, esta conversación no se produce al día siguiente sino que su impacto es inmediato. Todo esto se suma para abrir un nuevo abanico de posibilidades para espectadores, radiodifusores y las grandes marcas. Los usuarios han encendido la mecha de la TV Social ya que les conecta con amigos y el resto de la audiencia.  Es a la vez una forma de sentirse parte del programa y al mismo tiempo de involucrarse más. Por tanto, las herramientas que faciliten organizar y comprender la conversación son de especial interés para el espectador social. Para el resto de espectadores, incluso para aquellos que solo participan leyendo, es una forma de generar tanto recomendaciones sociales. Otro uso interesante es que analizar la conversación social permite contextualizar contenido relevante y relacionado con el programa como información sobre los actores, personajes o cualquier otro concepto del que se hable en la pantalla grande.

Continuar leyendo