Archivo de categorías: Tecnologías del Lenguaje

Entradas sobre tecnologías del lenguaje.

تحليل النصوص باللغة العربية

نهدف في “مينينج كلاود” (MeaningCloud) إلى تقديم منتج تحليل النصوص الأكثر تقدمًا مع توفير التغطية الأوسع للغات في السوق. لهذا السبب عملنا على إطلاق العديد من الحزم الجديدة للغات قبل انتهاء عام 2019؛ وذلك بهدف زيادة التغطية التي تقدمها حزمتنا القياسية – الإنجليزية والإسبانية والفرنسية والإيطالية والبرتغالية والكتالونية – وحزمتنا الخاصة باللغات الاسكندنافية – السويدية والدنماركية والنرويجية والفنلندية.

Arabic

الحزمة الثالثة التي أطلقت هي حزمة اللغة العربية. اللغة العربية هي خامس أكثر لغة انتشارًا في العالم، فهي اللغة الرسمية في عشرين دولة، وكذلك فهي اللغة الرسمية المشتركة في ست دول أخرى. كما أنها اللغة الأولى لأكثر من 280 مليون متحدث، واللغة الثانية لعدد 250 مليون آخرين. بالإضافة لذلك، يوجد العديد من ملايين المسلمين ممن يعيشون في دول أخرى لديهم معرفة باللغة العربية لأسباب دينية.

ومن أكثر خصائصها تميزًا، انها تستخدم نظامها الخاص في الكتابة، حيث يبدأ النص من اليمين لليسار وتتصل الأحرف سويًا داخل الكلمة. بهذه الطريقة يمكن للحرف الواحد أن يأتي في 4 أشكال مختلفة. ومن المثير للاهتمام أيضًا عدم وجود حروف كبرى “Captial” في اللغة العربية. وبسبب أن الأسماء الشائعة يمكن الخلط بينها وبين الأسماء الصحيحة، فإن الأخيرة تكتب في الغالب بين قوسين أو علامتي تنصيص.

تقدم “مينينج كلاود” (MeaningCloud) الآن تغطيتها للغة العربية التي توفر الوظائف التالية:

ستمدد هذه التغطية في الإصدارات اللاحقة للمنتج اعتمادًا على متطلبات السوق. يمكنكم الحصول على مزيد من التفاصيل عبر صفحتنا الجديدة صفحة التغطية اللغوية.

إذًا، ما هذه المهام الخاصة بتحليل النصوص، وما استخداماتها؟
Continuar leyendo


Интеллектуальный анализ текста на русском

В MeaningCloud мы стремимся предоставить наиболее прогрессивный продукт для интеллектуального анализа текста с самым широким на рынке охватом языков. Именно поэтому до конца 2019 года мы работали над выпуском нескольких новых языковых пакетов для расширения охвата, обеспечиваемого нашим стандартным пакетом: английский, испанский, французский, итальянский, португальский и каталанский – а также нашим скандинавским пакетом: шведским, датским, норвежским и финским.

Вторым выпущенным пакетом стал русский. Русский является официальным языком в Российской Федерации, Белоруссии, Казахстане и Киргизии. Фактически он был разговорным языком в Советском Союзе, поэтому продолжает использоваться в странах Балтики, на Кавказе и в Центральной Азии. Это самый распространенный славянский язык, на котором говорят 144 миллиона человек.

В русской письменности используется кириллица, и хотя транслитерация на латиницу получила широкое распространение в связи с техническими ограничениями, связанными в отсутствием кириллической клавиатуры за рубежом, потребность в ней возникает все реже и реже благодаря расширению Юникод, включающему русский алфавит, которое обеспечивает работу множества программ.

MeaningCloud теперь предлагает охват русского языка для следующего функционала:

Russian pack

Этот охват будет расширяться при последующих выпусках продуктов в зависимости от рыночного спроса. Более подробная информация представлена на нашей новой странице охвата языков.

Что же такое задачи интеллектуального анализа текста, и для чего они используются?
Continuar leyendo


中文文本分析

在MeaningCloud,我们的目标是以市场上最大的语言覆盖面,提供最先进的文本分析产品。因此在2019年结束之前,我们努力工作,推出了多项新的语言包,以扩大我们标准语言包(英语、西班牙语、法语、意大利语、葡萄牙语和加泰罗尼亚语)与北欧语言包(瑞典语、丹麦语、挪威语和芬兰语)的覆盖面。

我们推出的第一个语言包是中文语言包。中文,是中华人民共和国的官方语言。这种语言的母语者数量最多,占全球人口的近16%。

中文(包含其所有种类在内)是一类基于表意文字的语言,传统上是竖版排列,从上至下、自右向左逐列阅读。MeaningCloud所支持的中文种类是简体中文

MeaningCloud目前对中文提供以下功能:

Chinese pack

这一功能将根据市场需求在后续产品发布中进一步扩展。您可以在我们新上线的语言覆盖面网页上获取详细信息。

那么这些文本分析任务是什么,它们有何用处呢?
Continuar leyendo


Automatización robótica de procesos (RPA) mejor con IA: dos casos de uso

RPA-Inteligencia Artificial

Muchas organizaciones podrán mejorar extraordinariamente su eficiencia, al añadir Inteligencia Artificial (IA) a la Automatización de Procesos Robóticos, lo que conocemos como RPA, las siglas en inglés para Robotic Process Automation.

En un post anterior (The leading role of Natural Language Processing in Robotic Process Automation) presentamos el tema de los beneficios que aporta el Procesamiento del Lenguaje Natural al RPA. En este post, vemos dos casos de uso en los que el procesamiento en lenguaje natural, integrado con los paquetes de software RPA / BPM, es lo suficientemente maduro como para resolver problemas típicos de extracción de información, de manera muy rentable.

Continuar leyendo


Caso de estudio: Voz del paciente en la industria farmacéutica

Las compañías farmacéuticas están extendiendo sus proyectos de Voz del Paciente a las redes sociales: comentarios en foros web, encuestas, Twitter, etc.

El objetivo de la prueba de concepto de esta compañía farmacéutica en España fue: “Recopilar y analizar cuantitativa y cualitativamente la voz del paciente desde los canales donde se expresa”, en redes sociales como foros web, Facebook, Twitter y otros sistemas.

Para la industria farmacéutica, es esencial escuchar y comprender los comentarios que sus clientes actuales y potenciales se expresan a través de todo tipo de medios y puntos de contacto.

Y los foros web reúnen millones de posts. Un foro web es un punto de encuentro para pacientes. Comparten apoyo, experiencias y sabiduría con compañeros, familiares y amigos.

Continuar leyendo


Web scraping y analítica de texto

Los proyectos de análisis de texto muy a menudo utilizan fuentes públicas de Internet. Estos proyectos generalmente comienzan extrayendo datos de varios sitios web. Llamamos a este proceso “web scraping” (o “scraping”, que significa “raspar”). Aunque una persona puede llevar a cabo este proceso de manera manual, el término “web scraping”  a menudo se refiere a métodos automatizados ejecutados utilizando un rastreador web (“web crawler”).

Como ejemplos de proyectos donde el proceso de web scraping añade una valiosa cantidad de información podemos mencionar los de experiencia del cliente (o también los de experiencia del paciente o la experiencia del empleado), la optimización dinámica de los precios, el monitoreo de la competencia o la verificación del cumplimiento normativo.

Continuar leyendo


Contact center: 6 formas de aprovechar la analítica de texto y de voz

Contact center. Illustration

En los contact-center, la tecnología de análisis de texto brinda una oportunidad sin precedentes para convertir las interacciones de los clientes en oportunidades de negocio. Podemos mejorar la experiencia del cliente, aumentar las ventas, reducir la rotación de clientes y optimizar la eficiencia de los procesos.

Continuar leyendo


«Text mining» in poche parole: MeaningCloud in italiano

Nei nostri post precedenti abbiamo parlato dell’analisi del testo in francese e in portoghese utilizzando gli strumenti di Text Mining di MeaningCloud. Per concludere questa serie linguistica, oggi vediamo che tipo di analisi possiamo eseguire in italiano.

La lingua italiana viene parlata in diversi stati europei, tra i quali l’Italia, la Repubblica di San Marino, la Città del Vaticano, la Slovenia, la Croazia e la Svizzera, con un totale di quasi 70 milioni di parlanti. Poiché gli italiani sono emigrati in tutto il mondo, la loro lingua è presente anche dall’altra parte dell’oceano. In Sud America, per esempio, è la seconda lingua più parlata in Argentina. Negli Stati Uniti, nonostante non sia una delle lingue ufficiali, molti cittadini sono di origine italiana e quindi parlano italiano in patria. Per questo motivo abbiamo deciso di includere nel nostro pacchetto di lingue standard una lingua così diffusa.

Hello in many languages

Analogamente ai nostri post precedenti, spiegheremo da un punto di vista linguistico che cos’è l’analisi del testo (o Text Mining) e quali funzionalità fornisce MeaningCloud in italiano.

Continuar leyendo


Farmacovigilancia: Escuchando la voz del paciente

Farmaco-vigilancia: Escuchando la voz del paciente.

Para la industria farmacéutica, es esencial escuchar y comprender los comentarios que sus pacientes actuales y potenciales comunican a través de todo tipo de canales y puntos de contacto.

Si bien existe un protocolo para comunicar a las autoridades, de las reacciones adversas a medicamentos identificadas, solo se informa de un 5 a un 20% de ellas. Afortunadamente, las conversaciones sobre medicamentos, síntomas, afecciones y enfermedades pueden analizarse para aprender más sobre ellas. La inteligencia artificial contribuye de manera decisiva a monitorear los eventos adversos y comprender su impacto en cada fase del desarrollo.

Las narraciones de los pacientes sobre los medicamentos y sus efectos adversos en las redes sociales representan una fuente de datos adicional para el monitoreo de la seguridad de los productos farmacéuticos.

En MeaningCloud, hemos desarrollado una plataforma para automatizar el proceso de monitoreo de efectos adversos en las redes sociales.

Continuar leyendo


Análise de texto explicada: MeaningCloud em português

Algumas semanas atrás falamos sobre o desempenho da análise de texto do MeaningCloud em textos franceses. Chegou a hora do português!

O Português, junto com o espanhol, tem uma presença enorme na América do Sul. É falado por mais de 200 milhões de pessoas apenas no Brasil. Não só tem uma influência imensa na economia na América do Sul, mas também na Europa, onde é usado por mais de 10 milhões de pessoas. A África também tem nativos do português. A Angola, que tem uma população de mais de 24 milhões de pessoas, reconhece o português como seu idioma oficial. A sua presença nesses três continentes o torna difícil de esquecer no nosso pacote de idiomas padrão. No MeaningCloud, oferecemos duas variantes de português: Português do Brasil e da Europa.

Hello in many languages

Se o conceito de “análise de texto” parece um pouco vago ou se você está procurando por algo mais especificamente relacionado à linguagem, este post é ideal para você. Mantemos uma diversidade de idiomas e queremos mostrar todas as funcionalidades que fornecemos em português.

Continuar leyendo