Archivo de categorías: Industrias

Esta categoría agrupa los distintos sectores para los que MeaningCloud proporciona soluciones.

10 formas de aumentar beneficios para medios. Ebook

El proceso de creación y gestión de “contenidos inteligentes” se conoce a menudo dentro del sector de la minería de texto como “publicación semántica” o también como “enriquecimiento de contenidos”. Los tres conceptos (“contenidos inteligentes”, “publicación semántica” y “enriquecimiento de contenidos”) son en la práctica sinónimos.
En MeaningCloud hemos creado un libro electrónico.

El contexto de negocio en medios: los problemas que hemos encontrado.

Aunque el negocio de venta offline sigue siendo rentable para unos pocos, los suscriptores y compradores de papel son cada vez menos y continúan envejeciendo.
Por otra parte, la distribución generalizada y al instante de información a través de Internet ha convertido a las noticias en un producto no diferenciado (“commodity”) del que pueden disponer gratuitamente y por el que los usuarios de medios no están generalmente dispuestos a pagar.

Algunos editores de contenidos se han dado cuenta de que para conseguir clientes que paguen por esos contenidos es fundamental agregar valor a través de una mejor creación, promoción, entrega y presentación de su materia prima, de los contenidos. Igualmente, el camino de la publicidad online sigue siendo un “valor seguro”, aunque a menudo insuficiente, para la mayoría de los que publican contenidos.

En el ebook vemos 10 formas en las que los contenidos inteligentes son imprescindibles en este proceso de agregación de valor y de mejora de rentabilidad.

Continuar leyendo


El etiquetado automático IAB hace posible la publicidad semántica

Nuestra API de Text Classification soporta la taxonomía contextual estándar del IAB permitiendo etiquetar contenidos según ese modelo en grandes volúmenes y a gran velocidad y facilitando la participación en el nuevo ecosistema de publicidad online. El resultado es la impresión de anuncios en el contexto más adecuado, con un mayor rendimiento y protección de marca para los anunciantes.

Qué es la clasificación contextual de IAB y para qué sirve

La taxonomía contextual IAB QAG fue inicialmente desarrollada por el Interactive Advertising Bureau (IAB) como centro de su programa Quality Assurance Guidelines, que buscaba promover la seguridad de las marcas anunciantes, garantizando que sus anuncios no aparecían en un contexto de contenido inadecuado. El programa QAG incluía posibilidades de certificación para todo tipo de agentes en la cadena de valor de la publicidad digital, desde redes y exchanges publicitarios hasta publishers, supply side platforms (SSPs), demand side platforms (DSPs) y agency trading desks (ATDs).

Las Quality Assurance Guidelines sirven como un marco de autorregulación que garantiza a los anunciantes que sus marcas están seguras, aumenta el control de los anunciantes sobre la ubicación y el contexto de sus anuncios y ofrece transparencia al mercado estandarizando la información que fluye entre los agentes, al proporcionar un lenguaje claro y común que describe las características del inventario publicitario y de las transacciones a través de la cadena de valor.

Esencialmente la taxonomía contextual sirve para etiquetar contenidos y se compone de unos niveles 1 y 2 estándar -que especifican respectivamente la categoría general del contenido y una serie de subcategorías anidadas dentro de esa categoría principal- y de unos niveles 3 y siguientes que pueden ser definidos por cada organización. Las siguientes figuras presentan dichos niveles estándar.

Continuar leyendo


Grabación del webinar: 10 formas de aumentar los beneficios de los medios utilizando metadatos

Ayer celebramos nuestro webinar “10 formas de aumentar los beneficios de los medios utilizando metadatos”, con la participación como invitado de Mario Tascón, experto en transformación digital de medios.

A continuación tenéis acceso a la documentación y a la grabación del webinar.

Y como complemento, haciendo clic en el siguiente enlace podéis descargaros el e-book inédito “Contenidos Inteligentes – 10 formas de aumentar los beneficios de medios y otros editores utilizando metadatos”, donde se discuten en más detalle los contenidos del webinar.

Esperamos que os guste.

Continuar leyendo


Voz del Cliente en Seguros

Para las compañías de seguros resulta vital entender el feedback que sus clientes -actuales y potenciales- expresan a través de todo tipo de canales y puntos de contacto. A toda esta valiosa información le llamamos la Voz del Cliente. Por cierto, no hace mucho, le dedicamos un post al papel de la Minería de texto en el sector de seguros.

(Este post es un desarrollo de la presentación de meaningcloud.com en el I Congreso de Big Data en el sector asegurador español organizado por ICEA. Más abajo tenemos la presentación que hicimos desde Meaning Cloud).

Cada vez hay más empresas que entienden que para crecer de forma rentable en entornos de mucha competencia, necesitan clientes satisfechos. Conseguir diferenciación entre los productos de las aseguradoras no resulta fácil.  La experiencia del cliente (Customer Experience) es un elemento fundamental en el éxito comercial del sector.

Escuchar, entender y actuar sobre lo que los clientes nos están diciendo sobre su experiencia con nuestras compañías está directamente relacionado con la mejora de la Experiencia de Usuario y con la rentabilidad. En el post sobre Voz del Cliente y NPS vimos con más detalle esta correlación entre experiencia de cliente y beneficios.

 

Continuar leyendo


¿Pueden los antidepresivos causar malformaciones en el feto?

Puede que no sea lo más común que en el blog de una empresa de tecnología de la información se hable de antidepresivos y embarazos, lo entendemos perfectamente. Pero en MeaningCloud hemos comprobado que los temas de salud tienen una fuerte repercusión en medios sociales y las empresas del sector, incluyendo las farmacéuticas, harían bien en tratar de entender la conversación que se genera alrededor. ¿Cómo? Mediante la tecnología de análisis de texto, como veremos a continuación.

Mirando los datos recogidos por nuestro prototipo para la monitorización de temas de salud en medios sociales nos sorprendimos del repentino incremento de menciones del término ‘embarazo’ el día 10 de julio. Para saber el porqué de este dato, acudimos a los tuits que hablaban sobre ese estado de buena esperanza. Resulta que ese mismo día se había publicado una noticia sobre un estudio aparecido en el British Medical Journal sobre los efectos nocivos que los antidepresivos pueden causar en el feto durante el embarazo.
Continuar leyendo


Analizando datos sobre salud en medios sociales

El análisis de medios sociales puede ser una buena inversión en el área de salud. A la gente le encanta compartir información en los medios sociales, incluso datos sobre salud. ¡Sí, es verdad! Y constituye el punto de partida del trabajo de investigación titulado ‘Exploring Spanish health social media for detecting drug effects’, cuyo objetivo es monitorizar las conversaciones en medios sociales para averiguar cómo hablan los usuarios sobre su relación con el consumo de fármacos. Esto permite identificar posibles efectos adversos hasta ahora desconocidos relacionados con dichos fármacos. Aunque existe un protocolo oficial para informar a las autoridades competentes de la existencia de algún efecto adverso no documentado, se llegan a comunicar solamente un 5 – 20 % de ellos. Además, se pueden analizar las conversaciones sobre fármacos, síntomas, condiciones y enfermedades para obtener más información. Por ejemplo, es posible descubrir cómo los usuarios buscan medicamentos específicos a través de los medios sociales o cómo algunos se dedican a venderlos, a menudo de forma ilegal; muchos otros hablan de la mezcla de alcohol con drogas u otras sustancias ilegales. Por supuesto, no todo lo que aparece en internet es fiable—este es otro tema—, pero puede estimular el planteamiento de nuevas hipótesis.

drugs

El equipo de investigación Grupo de Bases de Datos Avanzadas de la Universidad Carlos III de Madrid ha llevado a cabo la investigación mencionada y ha desarrollado modelos híbridos para obtener el conocimiento necesario para identificar efectos adversos. La plataforma de procesamiento del lenguaje natural que ha permitido el análisis basado en esos modelos es MeaningCloud. Las capacidades de personalización que ofrece esta plataforma han sido decisivas, puesto que han facilitado la integración de vocabulario específico y otros conocimientos del dominio de la medicina. Como sabemos, los nombres de los medicamentos y de los síntomas pueden ser muy complicados y a menudo no es fácil escribirlos adecuadamente. Los resultados del algoritmo son prometedores, ya que su recall es un 10 % mayor que el de otros algoritmos conocidos. Puedes encontrar más detalles en el artículo científico publicado por la revista BMC Medical Informatics and Decision Making Journal. Estos desarrollos forman parte del proyecto TrendMiner y están disponibles en la página web: TrendMiner Health Analytics Dashboard, que recopila los comentarios de los usuarios de medios sociales sobre fármacos antidepresivos. La consola muestra los antidepresivos mencionados junto con los síntomas relacionados; haciendo clic en cada uno de ellos se puede consultar su evolución a lo largo del tiempo. Además, en la parte inferior de la página se muestran los textos originales que se han analizado para extraer dichas menciones, los nombres de medicamentos, síntomas, enfermedades y cualquier relación haya sido identificada entre ellos. Esas relaciones pueden revelar si un fármaco es adecuado para un determinado síntoma o si una enfermedad es, en realidad, un efecto adverso provocado por el medicamento mencionado. El prototipo permite también hacer búsquedas utilizando el código ATC (Anatomical Therapeutic Chemical Classification System) y el nivel correspondiente según este sistema de clasificación. Si se activa la opción ‘By Active Substance’ [‘por principio activo’], se buscará cualquier fármaco contenga el principio activo del producto buscado. Por otro lado, la funcionalidad de búsqueda predictiva permitirá encontrar más fácilmente la expresión correcta para referirse a un fármaco o a una enfermedad.

Las empresas del dominio de salud y las farmacéuticas ya pueden explotar su información no estructurada


En la industria farmacéutica y de salud
, tenemos a nuestra disposición nuevas herramientas de ciencia de datos capaces de extraer información valiosa sobre documentos de redacción libre como las historias clínicas electrónicas. Es posible explotar la información asociada a datos como el coste de tratamientos médicos, su eficiencia (precio, ventajas y riesgos), referencias a fármacos, efectos secundarios o resultados a largo plazo.

[/raw]


Efectos adversos de los medicamentos y medios sociales

Las reacciones adversas a medicamentos (RAM) son el problema más importante de seguridad en el campo de la salud. Se refieren a los efectos dañinos y no intencionados que producen los fármacos en el tratamiento de enfermedades y profilaxis, ya sea cuando se administran dosis normales, ya sea cuando se incurre en errores de medicación o usos incorrectos. Son la cuarta causa de muerte en pacientes hospitalizados en EEUU. Por ello, el área de la farmacovigilancia está recibiendo una gran atención debido a la gran incidencia de las RAM y al alto coste que llevan asociadas (entre el 15 y el 20 por ciento del gasto hospitalario se debe a complicaciones debidas a fármacos).

Determinadas RAM no se descubren durante los ensayos clínicos dado que no pueden conocerse hasta que el fármaco lleva varios años en el mercado. Por ello, las agencias de medicamentos deben vigilar las RAM una vez comercializado el medicamento, y el principal instrumento del que disponen son los sistemas de notificación voluntaria en los que profesionales y pacientes informan sobre sospechas de RAM (en España los pacientes pueden informar desde julio de 2012). Sin embargo, estos sistemas apenas se utilizan, pues se estima que solo se notifican entre un 5% y un 20% de las RAM, ya sea por la falta de tiempo, por la complejidad del proceso, por el poco conocimiento respecto a las RAM o por la mala coordinación entre niveles asistenciales.

En el marco del proyecto europeo TrendMiner se ha creado un prototipo para analizar comentarios en redes sociales que incorpora el procesamiento semántico de MeaningCloud para reconocer las menciones de fármacos, efectos adversos y enfermedades. El sistema visualiza la evolución de estas menciones y sus “coocurrencias”, es decir, registra qué fármacos se mencionan y con qué efectos adversos. Por ejemplo, el sistema monitoriza fármacos pertenecientes a la familia de los ansiolíticos y para ello no solo tiene en cuenta las menciones de los principios activos o medicamentos genéricos de este grupo (entre otros el lorazepam y el diazepam) sino también las marcas comerciales (como el Orfidal). Todas estas menciones se pueden analizar además en relación con sus efectos terapéuticos (entre los cuales están Orfidal indicado para ansiedad) y sus efectos adversos (tales como Orfidal puede producir temblores).

Para más información sobre el proyecto, desarrollado con la participación de la Universidad Carlos III de Madrid, ir al sitio web de la universidad.

Las empresas del dominio de salud y las farmacéuticas ya pueden explotar su información no estructurada


En la industria farmacéutica y de salud
, tenemos a nuestra disposición nuevas herramientas de ciencia de datos capaces de extraer información valiosa sobre documentos de redacción libre como las historias clínicas electrónicas. Es posible explotar la información asociada a datos como el coste de tratamientos médicos, su eficiencia (precio, ventajas y riesgos), referencias a fármacos, efectos secundarios o resultados a largo plazo.


La Voz del Cliente: el sector bancario

«La Voz del cliente (VoC) es una técnica de investigación de mercado que permite descubrir con precisión lo que un cliente desea o necesita, dándole una estructura jerárquica y asignándole prioridad en función de su importancia relativa y satisfacción con las alternativas existentes»

Voz del cliente (VoC)

La Voz del cliente (VoC) no es un concepto nuevo. De una manera u otra, ha sido incluida en los procesos de control de calidad desde hace años, pero su plena integración en el flujo de trabajo sigue siendo una tarea pendiente para muchas empresas. La Voz del Cliente permite escuchar, interpretar y reaccionar a lo que se dice y luego seguir a lo largo del tiempo el impacto de las acciones llevadas a cabo.

El desafío actual al que se enfrentan las empresas reside en el volumen de datos disponibles. En esta era digital, las opiniones están aumentando constantemente y ya no se limitan a las encuestas periódicas que se envían a los clientes. El boca a boca es ahora digital y se ha vuelto más relevante que nunca: cualquier persona con una cuenta de Facebook o Twitter expresa una opinión, y cada vez más es sobre los productos y servicios que utiliza.

Un cliente típico

Un cliente

Al igual que muchos otros, el sector bancario necesita saber cómo convertir la fuente de conocimiento de primera mano que le aportan sus clientes en algo útil, algo que se pueda utilizar en el proceso de toma de decisiones de la empresa.

La Voz del Cliente combina dos elementos clave de la extracción de información: la necesidad de conocer en detalle de qué está hablando el cliente e interpretar correctamente los sentimientos asociados. El primer aspecto permite evaluar la opinión expresada desde una perspectiva cuantitativa, mientras que el segundo permite — más bien desde un punto de vista cualitativo — entender qué está haciendo bien o mal una empresa según el cliente.

El sector bancario tiene la dificultad añadida de proporcionar una muy amplia gama de productos y servicios, cada uno de ellos con subcategorías muy específicas y proporcionados a través de canales completamente diferentes.

Continuar leyendo


El papel de la Minería de Texto en el Sector de Seguros

¿Qué pueden hacer las aseguradoras para explotar toda su información no estructurada?

Un escenario típico de big data

Las compañías de seguros recogen ingentes volúmenes de texto diariamente, a través de múltiples canales (sus agentes, centros de atención a clientes, correo electrónico, redes sociales, web en general). Las informaciones recogidas incluyen pólizas, informes periciales y de salud, reclamaciones y quejas, resultados de encuestas, interacciones relevantes de clientes y no-clientes en redes sociales, etc. Es imposible atender, clasificar, interpretar o extraer la información esencial de todo ese material.

El Sector de Seguros es uno de los que más puede beneficiarse de la aplicación de las tecnologías para análisis inteligente de texto en formato libre (conocido como Analítica de Textos, Minería de Textos o Procesamiento de Lenguaje Natural).

Para las aseguradoras, se añade el reto de combinar el resultado del análisis de esos contenidos textuales con datos estructurados (almacenados en bases de datos convencionales) para mejorar la toma de decisiones. En este sentido, los analistas del sector consideran decisivo el uso de múltiples tecnologías basadas en Inteligencia Artificial (sistemas inteligentes), aprendizaje automático (minería de datos) y procesamiento de lenguaje natural, (tanto estadístico como simbólico o semántico).

Áreas más prometedoras de la analítica de textos en el Sector de Seguros

Detección de fraude

Detección de Fraude
Según Accenture, en un informe publicado en 2013, se estima que las compañías aseguradoras pierden en Europa entre 8.000 y 12.000 millones de euros al año debido a reclamaciones fraudulentas, con una tendencia creciente. Asimismo, el sector estima que entre un 5% y un 10% de las indemnizaciones abonadas por las compañías en el año anterior eran por motivos fraudulentos, no pudiendo ser detectados debido a la falta de herramientas analíticas predictivas.

Según el medio especializado “Health Data Management”, el sistema de prevención de fraude de Medicare en EE.UU., basado en algoritmos predictivos que analizan patrones en la facturación de proveedores, ahorró más de 200 millones de dólares en pagos rechazados en 2013.

Continuar leyendo


Análisis de la Experiencia del Cliente, la evolución del mercado de las Tecnologías del Lenguaje

Acaba de celebrarse en Bruselas la conferencia LT-Innovate 2014. LT-Innovate es un foro y una asociación de empresas europeas del sector de las tecnologías de la lengua. Para hacerse una idea del significado y de la importancia de este mercado, baste decir que en Europa cuenta con unas 450 empresas (en su mayoría PYMEs innovadoras), responsables del 0,12% del PIB europeo. Daedalus es una de las quince empresas europeas (y única española) formalmente miembros de LT-Innovate Ltd. desde su constitución como sociedad, con sede en Reino Unido, en 2012.

LTI_Manifesto_201406

LT-Innovate Innovation Manifesto 2014

En esta edición de 2014, se ha hecho público el documento “LT-Innnovate Innovation Manifesto: Desvelando la promesa de las industrias de la tecnología del lenguaje para el mercado único digital europeo”. Tuve el honor de formar parte de la mesa redonda que servía de apertura a la conferencia. El principal argumento de mi intervención era el cambio cualitativo experimentado en los últimos tiempos en el papel de nuestras tecnologías en los mercados en los que nos movemos. Durante años hemos estado incorporando nuestros sistemas para resolver problemas específicos acotados a áreas muy limitadas en nuestros clientes, más o menos visionarios o innovadores. Esta situación ha cambiado ya por completo: las tecnologías del lenguaje desempeñan ahora un papel central en un creciente número de negocios.

Las Tecnologías del Lenguaje en el Sector de los Medios

En un post reciente, me refería a esto mismo con respecto al sector de los medios de comunicación. Donde antes incorporábamos una solución para automatizar la anotación de contenidos del archivo, ahora desplegamos soluciones que afectan a la mayor parte de los aspectos del negocio editorial: etiquetamos semánticamente noticias para mejorar la experiencia de búsqueda en cualquier canal (web, móviles, tabletas), para recomendar contenidos relacionados o amedida del perfil de intereses de un lector concreto, para facilitar la encontrabilidad y la indexación por buscadores (SEO, Search Engine Optimization), para colocar publicidad en función del contexto noticioso o de la intención de los lectores, para ayudar a monetizar los contenidos de formas nuevas, etc.

Continuar leyendo