Archivo de categorías: Tecnologías del Lenguaje

Entradas sobre tecnologías del lenguaje.

Tecnología del Lenguaje contra Desinformación

Desde las elecciones presidenciales americanas de 2016, donde se hizo muy patente el uso de noticias falsas en medios sociales como arma electoral, la preocupación de los ciudadanos y de los gobiernos por el fenómeno de la desinformación ha ido en aumento.

A modo de ejemplo, la Comisión Europea dirigió al Parlamento Europeo un “Plan de Acción contra la Desinformación” en diciembre de 2018.

En España, el Consejo de Seguridad Nacional acaba de adoptar un “Procedimiento de actuación contra la desinformación”. (Orden ministerial publicada en el BOE con fecha 5 de noviembre de 2020). Esta orden ha generado bastante controversia por su posible colisión con la libertad de expresión y el derecho a la información. Sobre las dudas planteadas por este texto, conviene leer el artículo de Borja Adsuara, publicado en el diario “El País” el día 12 de noviembre de 2020 y titulado “La ambigüedad del concepto de desinformación”. Continuar leyendo


Ya disponible el nivel 3 de la taxonomía de contenidos de IAB en nuestra API de Categorización Profunda

IAB - Interactive Advertising BureauEl marketing digital se está convirtiendo, a pasos agigantados, en un pilar fundamental en los planes empresariales de prácticamente todos los modelos de negocio. Los métodos se refinan y la búsqueda de la conexión entre marca y usuario espera ser cada vez más precisa: un anuncio afín ya no es suficiente, ahora debe aparecer en el momento y el lugar adecuados. En esta tarea, la categorización resulta una herramienta clave. 

Por ello, en MeaningCloud hemos mejorado nuestro modelo de categorización de IAB en inglés integrado en nuestra API de Categorización Profunda

  • Añadiendo el nivel 3 de la taxonomía de contenidos a las categorías de categorización.
  • Mejorando la precisión de las categorías preexistentes.
  • Incluyendo los identificadores únicos definidos por el propio IAB para cada una de las categorías. 

Continuar leyendo


La comunicación en tiempos del coronavirus (IV): Análisis de los discursos del presidente del Gobierno de España

Este artículo es la cuarta entrega de la serie sobre análisis de contenidos generados por medios digitales y usuarios de Twitter en torno al coronavirus, inicialmente centrados en España, aplicando nuestra experiencia y nuestras soluciones de Text Analytics para analizar el ingente volumen de información en lenguaje natural disponible.

Este estudio aborda de forma muy preliminar el análisis de los discursos del presidente del Gobierno de España, Pedro Sánchez Castejón, en sus comparecencias desde el inicio de la crisis hasta el momento, para extraer conclusiones de los mensajes que pretendía transmitir en cada una de sus alocuciones.

Continuar leyendo


La comunicación en tiempos del coronavirus (III): Análisis temático de Twitter en España con modelo específico COVID-19

Este es el tercer artículo de la serie sobre análisis de contenidos generados por medios de comunicación y usuarios en redes sociales en torno al coronavirus, aplicando nuestra experiencia y nuestras soluciones de Text Analytics para analizar el ingente volumen de información en lenguaje natural disponible.

Este estudio es la continuación del análisis temático de Twitter en España, pero aplicando el modelo de categorización específico que desarrollamos con la temática del coronavirus (modelo COVID-19), utilizado en el análisis temático de noticias en medios digitales de España. El objetivo es analizar el interés temático en Twitter, utilizando el modelo específico desarrollado, en cada Comunidad Autónoma, en los últimos 10 días.

Continuar leyendo


La comunicación en tiempos del coronavirus (II): Análisis temático de Twitter en España

Este es el segundo artículo (ver el primero aquí) de la serie sobre análisis de contenidos generados por medios de comunicación y usuarios en redes sociales en torno al coronavirus, aplicando nuestra experiencia y nuestras soluciones de Text Analytics para analizar el ingente volumen de información en lenguaje natural.

En este caso nos centramos en intentar analizar, en la medida de lo posible, el interés temático en Twitter en cada región de España, específicamente realizando un análisis por Comunidad Autónoma, en los últimos 10 días.

Continuar leyendo


تحليل النصوص باللغة العربية

نهدف في “مينينج كلاود” (MeaningCloud) إلى تقديم منتج تحليل النصوص الأكثر تقدمًا مع توفير التغطية الأوسع للغات في السوق. لهذا السبب عملنا على إطلاق العديد من الحزم الجديدة للغات قبل انتهاء عام 2019؛ وذلك بهدف زيادة التغطية التي تقدمها حزمتنا القياسية – الإنجليزية والإسبانية والفرنسية والإيطالية والبرتغالية والكتالونية – وحزمتنا الخاصة باللغات الاسكندنافية – السويدية والدنماركية والنرويجية والفنلندية.

Arabic

الحزمة الثالثة التي أطلقت هي حزمة اللغة العربية. اللغة العربية هي خامس أكثر لغة انتشارًا في العالم، فهي اللغة الرسمية في عشرين دولة، وكذلك فهي اللغة الرسمية المشتركة في ست دول أخرى. كما أنها اللغة الأولى لأكثر من 280 مليون متحدث، واللغة الثانية لعدد 250 مليون آخرين. بالإضافة لذلك، يوجد العديد من ملايين المسلمين ممن يعيشون في دول أخرى لديهم معرفة باللغة العربية لأسباب دينية.

ومن أكثر خصائصها تميزًا، انها تستخدم نظامها الخاص في الكتابة، حيث يبدأ النص من اليمين لليسار وتتصل الأحرف سويًا داخل الكلمة. بهذه الطريقة يمكن للحرف الواحد أن يأتي في 4 أشكال مختلفة. ومن المثير للاهتمام أيضًا عدم وجود حروف كبرى “Captial” في اللغة العربية. وبسبب أن الأسماء الشائعة يمكن الخلط بينها وبين الأسماء الصحيحة، فإن الأخيرة تكتب في الغالب بين قوسين أو علامتي تنصيص.

تقدم “مينينج كلاود” (MeaningCloud) الآن تغطيتها للغة العربية التي توفر الوظائف التالية:

ستمدد هذه التغطية في الإصدارات اللاحقة للمنتج اعتمادًا على متطلبات السوق. يمكنكم الحصول على مزيد من التفاصيل عبر صفحتنا الجديدة صفحة التغطية اللغوية.

إذًا، ما هذه المهام الخاصة بتحليل النصوص، وما استخداماتها؟
Continuar leyendo


Интеллектуальный анализ текста на русском

В MeaningCloud мы стремимся предоставить наиболее прогрессивный продукт для интеллектуального анализа текста с самым широким на рынке охватом языков. Именно поэтому до конца 2019 года мы работали над выпуском нескольких новых языковых пакетов для расширения охвата, обеспечиваемого нашим стандартным пакетом: английский, испанский, французский, итальянский, португальский и каталанский – а также нашим скандинавским пакетом: шведским, датским, норвежским и финским.

Вторым выпущенным пакетом стал русский. Русский является официальным языком в Российской Федерации, Белоруссии, Казахстане и Киргизии. Фактически он был разговорным языком в Советском Союзе, поэтому продолжает использоваться в странах Балтики, на Кавказе и в Центральной Азии. Это самый распространенный славянский язык, на котором говорят 144 миллиона человек.

В русской письменности используется кириллица, и хотя транслитерация на латиницу получила широкое распространение в связи с техническими ограничениями, связанными в отсутствием кириллической клавиатуры за рубежом, потребность в ней возникает все реже и реже благодаря расширению Юникод, включающему русский алфавит, которое обеспечивает работу множества программ.

MeaningCloud теперь предлагает охват русского языка для следующего функционала:

Russian pack

Этот охват будет расширяться при последующих выпусках продуктов в зависимости от рыночного спроса. Более подробная информация представлена на нашей новой странице охвата языков.

Что же такое задачи интеллектуального анализа текста, и для чего они используются?
Continuar leyendo


中文文本分析

在MeaningCloud,我们的目标是以市场上最大的语言覆盖面,提供最先进的文本分析产品。因此在2019年结束之前,我们努力工作,推出了多项新的语言包,以扩大我们标准语言包(英语、西班牙语、法语、意大利语、葡萄牙语和加泰罗尼亚语)与北欧语言包(瑞典语、丹麦语、挪威语和芬兰语)的覆盖面。

我们推出的第一个语言包是中文语言包。中文,是中华人民共和国的官方语言。这种语言的母语者数量最多,占全球人口的近16%。

中文(包含其所有种类在内)是一类基于表意文字的语言,传统上是竖版排列,从上至下、自右向左逐列阅读。MeaningCloud所支持的中文种类是简体中文

MeaningCloud目前对中文提供以下功能:

Chinese pack

这一功能将根据市场需求在后续产品发布中进一步扩展。您可以在我们新上线的语言覆盖面网页上获取详细信息。

那么这些文本分析任务是什么,它们有何用处呢?
Continuar leyendo


Automatización robótica de procesos (RPA) mejor con IA: dos casos de uso

RPA-Inteligencia Artificial

Muchas organizaciones podrán mejorar extraordinariamente su eficiencia, al añadir Inteligencia Artificial (IA) a la Automatización de Procesos Robóticos, lo que conocemos como RPA, las siglas en inglés para Robotic Process Automation.

En un post anterior (The leading role of Natural Language Processing in Robotic Process Automation) presentamos el tema de los beneficios que aporta el Procesamiento del Lenguaje Natural al RPA. En este post, vemos dos casos de uso en los que el procesamiento en lenguaje natural, integrado con los paquetes de software RPA / BPM, es lo suficientemente maduro como para resolver problemas típicos de extracción de información, de manera muy rentable.

Continuar leyendo


Caso de estudio: Voz del paciente en la industria farmacéutica

Las compañías farmacéuticas están extendiendo sus proyectos de Voz del Paciente a las redes sociales: comentarios en foros web, encuestas, Twitter, etc.

El objetivo de la prueba de concepto de esta compañía farmacéutica en España fue: “Recopilar y analizar cuantitativa y cualitativamente la voz del paciente desde los canales donde se expresa”, en redes sociales como foros web, Facebook, Twitter y otros sistemas.

Para la industria farmacéutica, es esencial escuchar y comprender los comentarios que sus clientes actuales y potenciales se expresan a través de todo tipo de medios y puntos de contacto.

Y los foros web reúnen millones de posts. Un foro web es un punto de encuentro para pacientes. Comparten apoyo, experiencias y sabiduría con compañeros, familiares y amigos.

Continuar leyendo