Identifica automáticamente la estructura de contenidos de un documento

 

La API de Análisis de la Estructura de Documentos identifica los componentes estructurales principales de un documento o email, extrayendo títulos, cabeceras de secciones, asunto, destinatario, remitente, etc. para generar una especie de “tabla de contenidos” del documento o mensaje. Úsala para obtener una visión de la estructura de componentes de un documento.

La API de Análisis de la Estructura de Documentos de MeaningCloud

Lamentablemente no todos los documentos vienen con su tabla de contenidos incorporada. Muchos documentos y otros contenidos (ej.: emails) se nos presentan como una secuencia de palabras que habría que recorrer de principio a fin para tener una idea de su estructura. La API de Análisis de la Estructura de un Documento de MeaningCloud extrae automáticamente esa estructura tanto de documentos (título, cabeceras de secciones y subsecciones) como de emails (destinatario, remitente, tema).

De este modo podemos conseguir una comprensión estructural de un contenido, identificando los componentes del documento y sus títulos tal como aparecen en el original.

Aplicaciones del análisis de la estructura de documentos

La posibilidad de identificar automáticamente las partes de un documento nos proporciona una visión estructural que puede ser muy útil en diversas aplicaciones.


Gestión del conocimiento

Cuando el conocimiento de la organización está almacenado en miles de documentos, identificar los componentes que integran cada uno permite aprovecharlos mejor.


Publicación de contenidos

Complementar los contenidos con una descripción de su estructura hace que estos sean más explotables y valiosos.


Vigilancia de comunicaciones

Poder analizar automáticamente la estructura de una colección de emails permite detectar patrones sospechosos en aplicaciones de cumplimiento normativo.

Características de la API de Análisis de la Estructura de Documentos

La API de Análisis de la Estructura es potente y versátil y funciona en una variedad de escenarios.

Multiidioma

Funciona con independencia del idioma en el que está escrito el texto.

Potente

Basada tanto en el marcado del documento como en marcadores del lenguaje.

Para documentos y emails

Identifica tanto las partes de documentos como los componentes de mensajes de email.

Flexible y fácil de integrar

Admite diversos formatos y su interfaz estándar permite incorporarla fácilmente a cualquier aplicación.