Archivo de categorías: Tecnologías del Lenguaje

Entradas sobre tecnologías del lenguaje.

Voz del Empleado, Voz del Cliente y NPS

Cada vez hay más empresas que entienden que para crecer de forma rentable en entornos de mucha competencia, necesitan conseguir clientes satisfechos. Y saben que las personas de su organización, los empleados, tienen un papel fundamental en conseguir mejorar la experiencia del cliente.

En esta pelea competitiva por mejorar la fidelidad de los clientes, las empresas tienen que ser capaces de escuchar y entender lo que los clientes están diciendo. Es lo que llamamos la Voz del Cliente (VoC).

Una misión, como la de conseguir clientes satisfechos, que no vaya unida a una medida precisa del éxito (o del fracaso), es sólo un brindis al sol. Ya lo decía Lord Kevin: si no se puede medir, no se puede mejorar.

El Net Promoter Score (NPS) se ha convertido, para muchísimas empresas en la métrica fundamental para medir la satisfacción del cliente.

En la misma línea, la misión de conseguir personas motivadas y felices en nuestra organización también tiene su métrica: el eNPS (el NPS del empleado). Por tanto, hay que escuchar y entender igualmente la Voz del Empleado.

Tanto el NPS como el eNPS, como veremos más abajo, necesitan encontrar el porqué que se esconde detrás de la valoración numérica. Ambos recogen las respuestas de miles de clientes y empleados a la pregunta abierta ¿Cuál es principal razón que te lleva a dar esta valoración? Es aquí donde la tecnología lingüística de Meaning Cloud interviene.
Continuar leyendo


Introducción al análisis de sentimientos (minería de opiniones)

En la última década, el análisis de sentimientos (SA, sentiment analysis), también conocido como minería de opiniones (opinion mining), ha despertado un creciente interés. Resulta un gran reto para las tecnologías del lenguaje, ya que obtener buenos resultados es mucho más difícil de lo que muchos creen. La tarea de clasificar automáticamente un texto escrito en un lenguaje natural en un sentimiento positivo o negativo, opinión o subjetividad (Pang and Lee, 2008), es a veces tan complicada que incluso es difícil poner de acuerdo a diferentes anotadores humanos sobre la clasificación a asignar a un texto dado. La interpretación personal de un individuo es diferente de la de los demás, y además se ve afectada por factores culturales y experiencias propias de cada persona. Y la tarea es aún más difícil cuanto más corto sea el texto, y peor escrito esté, como es el caso de los mensajes en redes sociales como Twitter o Facebook.

Continuar leyendo


Analizando datos sobre salud en medios sociales

El análisis de medios sociales puede ser una buena inversión en el área de salud. A la gente le encanta compartir información en los medios sociales, incluso datos sobre salud. ¡Sí, es verdad! Y constituye el punto de partida del trabajo de investigación titulado ‘Exploring Spanish health social media for detecting drug effects’, cuyo objetivo es monitorizar las conversaciones en medios sociales para averiguar cómo hablan los usuarios sobre su relación con el consumo de fármacos. Esto permite identificar posibles efectos adversos hasta ahora desconocidos relacionados con dichos fármacos. Aunque existe un protocolo oficial para informar a las autoridades competentes de la existencia de algún efecto adverso no documentado, se llegan a comunicar solamente un 5 – 20 % de ellos. Además, se pueden analizar las conversaciones sobre fármacos, síntomas, condiciones y enfermedades para obtener más información. Por ejemplo, es posible descubrir cómo los usuarios buscan medicamentos específicos a través de los medios sociales o cómo algunos se dedican a venderlos, a menudo de forma ilegal; muchos otros hablan de la mezcla de alcohol con drogas u otras sustancias ilegales. Por supuesto, no todo lo que aparece en internet es fiable—este es otro tema—, pero puede estimular el planteamiento de nuevas hipótesis.

drugs

El equipo de investigación Grupo de Bases de Datos Avanzadas de la Universidad Carlos III de Madrid ha llevado a cabo la investigación mencionada y ha desarrollado modelos híbridos para obtener el conocimiento necesario para identificar efectos adversos. La plataforma de procesamiento del lenguaje natural que ha permitido el análisis basado en esos modelos es MeaningCloud. Las capacidades de personalización que ofrece esta plataforma han sido decisivas, puesto que han facilitado la integración de vocabulario específico y otros conocimientos del dominio de la medicina. Como sabemos, los nombres de los medicamentos y de los síntomas pueden ser muy complicados y a menudo no es fácil escribirlos adecuadamente. Los resultados del algoritmo son prometedores, ya que su recall es un 10 % mayor que el de otros algoritmos conocidos. Puedes encontrar más detalles en el artículo científico publicado por la revista BMC Medical Informatics and Decision Making Journal. Estos desarrollos forman parte del proyecto TrendMiner y están disponibles en la página web: TrendMiner Health Analytics Dashboard, que recopila los comentarios de los usuarios de medios sociales sobre fármacos antidepresivos. La consola muestra los antidepresivos mencionados junto con los síntomas relacionados; haciendo clic en cada uno de ellos se puede consultar su evolución a lo largo del tiempo. Además, en la parte inferior de la página se muestran los textos originales que se han analizado para extraer dichas menciones, los nombres de medicamentos, síntomas, enfermedades y cualquier relación haya sido identificada entre ellos. Esas relaciones pueden revelar si un fármaco es adecuado para un determinado síntoma o si una enfermedad es, en realidad, un efecto adverso provocado por el medicamento mencionado. El prototipo permite también hacer búsquedas utilizando el código ATC (Anatomical Therapeutic Chemical Classification System) y el nivel correspondiente según este sistema de clasificación. Si se activa la opción ‘By Active Substance’ [‘por principio activo’], se buscará cualquier fármaco contenga el principio activo del producto buscado. Por otro lado, la funcionalidad de búsqueda predictiva permitirá encontrar más fácilmente la expresión correcta para referirse a un fármaco o a una enfermedad. Por favor, echa un vistazo al prototipo y dinos qué te parece. Y si alguno de los gráficos te parece interesante, ¡puedes tuitearlo incluso desde ahí! ¡Cualquier comentario es más que bienvenido! 


Migrando desde Textalytics: API de Corrección y Análisis Lingüístico

Recientemente hemos publicado y actualizado en MeaningCloud dos de las funcionalidades que faltaban por migrar desde Textalytics:

  • Correción automática de textos que permite revisar la ortografía, gramática y estilo de tus textos en varios idiomas: Español, Inglés, Francés e Italiano.
  • Análisis língüístico detallado incluyendo lematización, análisis morfológico y sintáctico también para múltiples idiomas. En este caso además de Español, Inglés, Francés e Italiano también está disponible para Portugués y Catalán.

Todos los usuarios de Textalytics tienen acceso a MeaningCloud usando el mismo correo y clave que ya tenían. Si no recuerdas tu contraseña, puedes renovarla en este enlace.

Desarrolladores que usan las API de Textalytics de Corrección Automática o de Lematización y Análisis Morfológico y Sintáctico

Si eres usuario de las anteriores funcionalidades y deseas migrar a MeaningCloud, puedes hacerlo ya. Puedes seguir los siguientes pasos:

  1. Actualiza el punto de acceso en tus peticiones para usar MeaningCloud, tanto el formato de la petición como el de la respuesta no cambian. Recuerda que puedes usar tanto HTTP como HTTPS.
    API Textalytics MeaningCloud
    Spell, Grammar and Style Proofreading
    https://textalytics.com/core/stilus-1.2
    http://api.meaningcloud.com/stilus-1.2
    Lemmatization, POS and Parsing API
    http://textalytics.com/core/parser-1.2
    http://api.meaningcloud.com/parser-1.2
  2. Comprueba tu clave de licencia en MeaningCloud y asegúrate de que usas la licencia correcta (y única) como valor del parámetro ‘license key’ en todas las llamadas. Puedes cortar y pegar tu licencia desde la sección Licenses en los detalles de tu cuenta o desde la página de inicio para desarrolladores.

Como siempre, si tienes dudas o problemas no dudes en escribirnos a support@meaningcloud.com. En cualquier caso y para garantizar la transición sin problemas de las aplicaciones que las usan, todos los puntos de acceso de las APIs de Textalytics permaneceran operativos hasta el 1 de junio de 2015.


Mejorando la gestión de emergencias analizando contenidos en redes sociales

¿Servir a los ciudadanos sin escuchar los medios sociales?App Llamada Emergencias

Los canales tradicionales de acceso a los servicios de emergencias por parte de los ciudadanos (típicamente a través de los teléfonos 112) deben ser expandidos con el análisis de medios sociales en tiempo real (canales web 2.0). Esta observación es el punto de partida de una de las líneas en las que el Grupo Telefónica (uno de los proveedores de referencia mundiales en sistemas integrados de gestión de emergencias) ha venido trabajando con vistas a su integración en su plataforma SENECA.

Cuadro de mando social para gestión de emergencias

Desde Daedalus, hemos trabajado para Telefónica en el desarrollo de un cuadro de mando social que analiza y organiza la información compartida en redes sociales (inicialmente Twitter) antes, durante y después de que se produzca un incidente de interés para los servicios de atención a emergencias. Desde el punto de vista funcional, esto conlleva:

  • Recoger las interacciones (tuits) relativos a incidencias en un área geográfica determinada
  • Clasificarlas según el tipo de incidencia (concentraciones, accidentes, desastres naturales…)
  • Identificar la fase en el ciclo de vida de la incidencia (alerta o pre-incidencia, incidencia o post-incidencia)

Beneficios para las organizaciones que gestionan emergencias

Anticipar incidentesLove Parade Duisburg

Anticipación a eventos que, por imprevisibles o por desconocerse su magnitud a priori, deban ser objeto de atención futura por los servicios de atención a emergencias. Dentro de este escenario se encuentran los eventos sobre concentración de personas que son convocados, difundidos o simplemente comentados a través de redes sociales (asistencia a eventos festivos o deportivos, manifestaciones, etc.) Predecir las dimensiones y alcance de estos eventos es fundamental para planificar la atención por parte de las diferentes autoridades. Recordemos en este sentido el caso de los disturbios a raíz de una fiesta de cumpleaños convocada en la localidad holandesa de Haren a través de la red Facebook en 2012 o la tragedia de la Love Parade de Duisburg.

Continuar leyendo


El papel de la Minería de Texto en el Sector de Seguros

¿Qué pueden hacer las aseguradoras para explotar toda su información no estructurada?

Un escenario típico de big data

Las compañías de seguros recogen ingentes volúmenes de texto diariamente, a través de múltiples canales (sus agentes, centros de atención a clientes, correo electrónico, redes sociales, web en general). Las informaciones recogidas incluyen pólizas, informes periciales y de salud, reclamaciones y quejas, resultados de encuestas, interacciones relevantes de clientes y no-clientes en redes sociales, etc. Es imposible atender, clasificar, interpretar o extraer la información esencial de todo ese material.

El Sector de Seguros es uno de los que más puede beneficiarse de la aplicación de las tecnologías para análisis inteligente de texto en formato libre (conocido como Analítica de Textos, Minería de Textos o Procesamiento de Lenguaje Natural).

Para las aseguradoras, se añade el reto de combinar el resultado del análisis de esos contenidos textuales con datos estructurados (almacenados en bases de datos convencionales) para mejorar la toma de decisiones. En este sentido, los analistas del sector consideran decisivo el uso de múltiples tecnologías basadas en Inteligencia Artificial (sistemas inteligentes), aprendizaje automático (minería de datos) y procesamiento de lenguaje natural, (tanto estadístico como simbólico o semántico).

Áreas más prometedoras de la analítica de textos en el Sector de Seguros

Detección de fraude

Detección de Fraude
Según Accenture, en un informe publicado en 2013, se estima que las compañías aseguradoras pierden en Europa entre 8.000 y 12.000 millones de euros al año debido a reclamaciones fraudulentas, con una tendencia creciente. Asimismo, el sector estima que entre un 5% y un 10% de las indemnizaciones abonadas por las compañías en el año anterior eran por motivos fraudulentos, no pudiendo ser detectados debido a la falta de herramientas analíticas predictivas.

Según el medio especializado “Health Data Management”, el sistema de prevención de fraude de Medicare en EE.UU., basado en algoritmos predictivos que analizan patrones en la facturación de proveedores, ahorró más de 200 millones de dólares en pagos rechazados en 2013.

Continuar leyendo


Análisis de la Experiencia del Cliente, la evolución del mercado de las Tecnologías del Lenguaje

Acaba de celebrarse en Bruselas la conferencia LT-Innovate 2014. LT-Innovate es un foro y una asociación de empresas europeas del sector de las tecnologías de la lengua. Para hacerse una idea del significado y de la importancia de este mercado, baste decir que en Europa cuenta con unas 450 empresas (en su mayoría PYMEs innovadoras), responsables del 0,12% del PIB europeo. Daedalus es una de las quince empresas europeas (y única española) formalmente miembros de LT-Innovate Ltd. desde su constitución como sociedad, con sede en Reino Unido, en 2012.

LTI_Manifesto_201406

LT-Innovate Innovation Manifesto 2014

En esta edición de 2014, se ha hecho público el documento “LT-Innnovate Innovation Manifesto: Desvelando la promesa de las industrias de la tecnología del lenguaje para el mercado único digital europeo”. Tuve el honor de formar parte de la mesa redonda que servía de apertura a la conferencia. El principal argumento de mi intervención era el cambio cualitativo experimentado en los últimos tiempos en el papel de nuestras tecnologías en los mercados en los que nos movemos. Durante años hemos estado incorporando nuestros sistemas para resolver problemas específicos acotados a áreas muy limitadas en nuestros clientes, más o menos visionarios o innovadores. Esta situación ha cambiado ya por completo: las tecnologías del lenguaje desempeñan ahora un papel central en un creciente número de negocios.

Las Tecnologías del Lenguaje en el Sector de los Medios

En un post reciente, me refería a esto mismo con respecto al sector de los medios de comunicación. Donde antes incorporábamos una solución para automatizar la anotación de contenidos del archivo, ahora desplegamos soluciones que afectan a la mayor parte de los aspectos del negocio editorial: etiquetamos semánticamente noticias para mejorar la experiencia de búsqueda en cualquier canal (web, móviles, tabletas), para recomendar contenidos relacionados o amedida del perfil de intereses de un lector concreto, para facilitar la encontrabilidad y la indexación por buscadores (SEO, Search Engine Optimization), para colocar publicidad en función del contexto noticioso o de la intención de los lectores, para ayudar a monetizar los contenidos de formas nuevas, etc.

Continuar leyendo


Patrocinio: Sentiment Analysis Symposium

Los próximos 5 y 6 de marzo tendrá lugar en Nueva York una nueva edición del Sentiment Analysis Symposium. Este es el séptimo evento de una serie organizada por el experto en el sector Seth Grimes desde el año 2010 en San Francisco y Nueva York.

Se trata de una conferencia única en varios aspectos. En primer lugar, está diseñada específicamente para atender a la comunidad de profesionales interesados en el campo de Human Analytics y sus aplicaciones de negocio. En segundo, su audiencia está integrada por una mezcla de expertos, estrategas, profesionales, investigadores y proveedores de soluciones, lo que lo convierte en un terreno perfectamente abonado para la discusión y el intercambio de puntos de vista. Y en tercer lugar, está diseñado por una sola persona (no por un comité), lo que le da una garantía de consistencia. Como experto en el negocio de la consultoría, Seth Grimes consigue el equilibrio perfecto en unas presentaciones que abarcan desde la tecnología a las aplicaciones de negocio. Asistí a la edición del evento de 2012 en Nueva York, donde impartí una breve ponencia, y puedo afirmar que la experiencia fue realmente enriquecedora.

Sentiment Analysis Symposium 2014

Pero que el título no nos confunda: no interpretemos “Análisis de Sentimiento” en un sentido restrictivo. La conferencia versa sobre cómo descubrir el valor de negocio en las opiniones, emociones y actitudes presentes en medios sociales, noticias y feedback empresarial. Además, el alcance no se limita a fuentes de texto: la voz y la imagen son también términos de la ecuación.

Continuar leyendo


Webinar: incorpora procesamiento semántico a tus aplicaciones

Descubre en este Webinar cómo hacer más inteligentes tus contenidos y procesos con nuestras API semánticas

Las empresas están inundadas de contenidos no estructurados y necesitan convertirlos en recursos más explotables y útiles. Las tecnologías semánticas facilitan extraer la máxima señal de todo ese “ruido” de una manera eficaz, rápida y escalable, permitiendo

  • Entender lo que se dice en medios sociales de manera exhaustiva, a bajo coste y en tempo real
  • Enriquecer, relacionar y personalizar dinámicamente toda clase de contenidos multimedia para mejor combinarlos, distribuirlos y monetizarlos
  • Estructurar y extraer el significado de todo tipo de activos de información para una gestión, análisis y explotación más eficientes

Hasta ahora, el procesamiento semántico no estaba a alcance de todos. Por eso en Daedalus hemos lanzado MeaningCloud: una familia de API semánticas en la nube pensada para aquellos desarrolladores / integradores / startups que quieran construir soluciones semánticas de manera eficaz, rápida y barata.

Textalytics

El servicio Meaning-as-a-Service ofrece varias API, cada una con una funcionalidad específica del dominio de aplicación, así como SDK y plug-ins que hacen que su aprendizaje y uso sea mucho más fácil.

Textalytics API alto nivel

Lo vamos a explicar con más detalle en un webinar gratuito el próximo 8 de octubre. Veremos con ejemplos cómo Textalytcs reduce el esfuerzo necesario para obtener resultados y el time-to-market en la aplicación de tecnologías semánticas. Más información y registro aquí.

Webinar – Textalytics: La manera más sencilla de incorporar procesamiento semántico a tus contenidos y procesos

  • Día: martes, 8 de octubre de 2013
  • Hora inicio: 16:00 hora CET (Madrid)
  • Duración: 45 min.

Registrarme en Webinar

Esperamos contar con tu asistencia.
ACTUALIZACIÓN: Para vuestra comodidad hemos subido los contenidos a esta página del sitio de Daedalus.


MeaningCloud – Meaning as a Service: oferta semántica en modo SaaS

Hace unas semanas hablábamos por aquí de cómo en s|ngular meaning (antes “Daedalus”)   hemos explorado diversos modelos de negocio basados en API para la comercialización de nuestras tecnologías semánticas. Nuestra percepción era que las funcionalidades lingüísticas básicas son difíciles de usar para muchos desarrolladores -no expertos en estas tecnologías- y que eso les obliga a construir soluciones mediante un proceso de prueba y error tipo “hágaselo usted mismo”, que es lento e ineficiente.

Nuestra visión era ofrecer al mercado unas API con una filosofía más plug-and-play, que proporcionen una funcionalidad más cercana al negocio, una curva de aprendizaje más rápida y -como resultado- una mayor productividad. Esa visión había cristalizado en nuestro productoMeaningCloud y hoy podemos decir que ese producto ya está disponible.

MeaningCloud es la manera más sencilla de “semantizar” tus aplicaciones

MeaningCloud (antes llamado “Textalytics”) una oferta en modo SaaS que ofrece una funcionalidad de procesamiento semántico de alto nivel multilenguaje a aquellos desarrolladores / integradores que quieran desarrollar soluciones semánticas de manera eficaz, rápida y barata. En comparación con otras ofertas semánticas en modo servicio, MeaningCloud ofrece varias API, cada una de ellas con una funcionalidad específica y cercana a un dominio de aplicación, así como SDK, plug-ins… que hacen que el aprendizaje y el uso sea mucho más fácil, reduciendo el tiempo necesario para obtener resultados y el time-to-market.

Textalytics - Meaning as a Service

Continuar leyendo