La categorización más precisa y detallada

La Categorización Profunda representa la evolución de las tecnologías de clasificación. Esta API asigna una o varias categorías de una taxonomía predefinida a los diferentes fragmentos de un texto . Y lo hace aplicando una potente tecnología de reglas semánticas que aporta la máxima exactitud en la clasificación a la vez que permite la más rápida y eficiente definición de modelos.

Además, la API es capaz de explicar las categorías asignadas a cada fragmento, identificando las expresiones en el mismo que han disparado las correspondientes reglas. Úsala cuando necesites la máxima precisión y detalle en la categorización y optimizar los costes de implementación.

La API de Categorización Profunda de MeaningCloud

Cada vez es mayor la necesidad de industrializar la extracción de insights profundos del texto. En escenarios que van desde la monitorización de medios a la analítica de contratos ya no basta con el análisis superficial del contenido para extraer unas categorías genéricas y unas menciones inconexas, sino que es necesario entrar en el detalle del significado de esos textos. Y hacerlo de una forma escalable y asequible frente a los inmensos volúmenes y variedad de esos contenidos.

La API de Categorización Profunda de MeaningCloud es un primer paso en esa línea, inaugurando un campo que en MeaningCloud hemos llamado Deep Semantic Analytics. Esta API parte de una taxonomía con categorías predefinidas para, en lugar de una clasificación a nivel de documento completo, realizar una categorización del texto a nivel de fragmento. Trata de descubrir bloques de texto o pasajes que expresan “subcontextos” y reflejar la estructura de temas y subtemas dentro de un documento, para así entenderlo mejor.

Y para ello aplica novedosas tecnologías que permiten crear modelos de categorización con la máxima sencillez y adaptación al contexto, con una mínima inversión y reducidos plazos de implementación.

Tecnología de reglas semánticas

El motor de Categorización Profunda incorpora una innovadora tecnología de reglas que no solo abarca los niveles léxico y gramatical, sino que llega al nivel semántico. Estas reglas se basan en el análisis morfosintáctico y semántico profundo que MeaningCloud hace del texto para permitir definir patrones abstractos que se refieren a las funciones y formas gramaticales y a las categorías semánticas de los términos. Esta información semántica puede provenir tanto de la ontología del producto como de diccionarios personales creados por el usuario, lo que hace a las reglas muy potentes y configurables.

Además, las reglas incorporan expresiones avanzadas (regulares, de proximidad, operadores lógicos) y macros que multiplican su expresividad. La ventaja es que en lugar de basar las reglas en formas literales de los términos podemos basarlas en la función y el significado de las expresiones. De este modo se puede conseguir un compromiso óptimo entre sencillez (abstracción) y potencia en la creación de modelos de categorización.

Aplicaciones

Los escenarios que se pueden beneficiar de una categorización detallada y precisa son innumerables, entre ellos: .

Categorización de contenidos

Clasifica con gran detalle y precisión todo tipo de contenidos (p.ej., páginas web, noticias) para poder recuperarlos, navegarlos y relacionarlos mejor o insertar publicidad enfocada.

Comprensión profunda de documentos

Descubre la estructura de temas y subtemas de un documento complejo (contrato, memoria financiera) para tener un mapa de su significado y poder enfocar análisis posteriores (p.ej., extracción de términos en cláusulas de contratos).

Análisis de la Voz del Cliente

Analiza el feedback no estructurado generado por tus clientes en encuestas, contact center o medios sociales para descubrir sus necesidades, percepciones y preferencias. Disponible como un Pack Vertical MeaningCloud.

Análisis de la Voz del Empleado

Gestiona más eficazmente el talento en tu organización descubriendo las opiniones, deseos y capacidades que tus empleados expresan en evaluaciones de desempeño, encuestas o entrevistas. Disponible como un Pack Vertical MeaningCloud.

Ventajas de la API de Categorización Profunda

La Categorización Profunda ofrece grandes ventajas frente a otras tecnologías de clasificación más tradicionales:

Granular

Hace una categorización a nivel de fragmento, descubriendo la estructura temática de un documento, p.ej., para identificar las cláusulas y pasajes de un contrato que tienen que ver con un determinado tema.

Exacto

Al estar basada en reglas semánticas es posible aumentar la precisión y la cobertura hasta niveles inalcanzables con otras tecnologías, sin más que añadir reglas enfocadas.

Categorías dinámicas

Se pueden usar diccionarios personales para definir entidades y conceptos en determinadas clases semánticas (p.ej., marcas comerciales) que se utilicen dinámicamente en las reglas que definen las categorías.

Autoexplicativo

Justifica la asignación de las categorías a los fragmentos, mostrando las expresiones que han disparado las reglas correspondientes, y proporciona medidas de confianza.

Para textos cortos y documentos complejos

La tecnología de reglas se comporta bien tanto en textos con pocas palabras como en documentos con múltiples apartados.

Modelos predefinidos

Usa la API inmediatamente aprovechando sus modelos de categorización preelaborados, como por ejemplo los de análisis de la Voz del Cliente o la Voz del Empleado incluidos en los Packs Verticales de MeaningCloud.

Personalizable (próximamente)

Utiliza nuestras herramientas de creación y validación de reglas para construir fácilmente modelos totalmente adaptados a tu escenario de uso.

No requiere corpus de entrenamiento exhaustivos

A diferencia de otras tecnologías, las reglas semánticas permiten desarrollar modelos sin necesidad de un conjunto de entrenamiento extenso, sin más que una comprensión abstracta de las categorías.

Multiidioma

Actualmente disponible en 6 idiomas y pronto en muchos más.

¿Cuándo usar Categorización Profunda en lugar de Clasificación de Texto?

La API de Clasificación de Texto ofrece una alternativa perfectamente viable cuando se trata de categorizar contenidos según una taxonomía predefinida, especialmente cuando se dispone de textos de entrenamiento que sirven para alimentar su tecnología de aprendizaje automático. Sin embargo, hay escenarios que aconsejan el uso de la Categorización Profunda:

  • Se desea una categorización a nivel de fragmento, no sólo a nivel de documento.
  • Se requiere una explicación de la asignación de cada categoría.
  • No se dispone de textos de entrenamiento suficientes.
  • Se desea un compromiso óptimo entre exactitud y coste.