de sistema informático que será capaz de extraer, resumir y rastrear información acerca de hechos y creencias a partir
de un texto libre, informa la Universidad de Cornell en un
comunicado.
Será desarrollado por científicos del Cornell Natural Language Processing Group (
NLP) de la
universidad de Pittsburgh, a partir de tres líneas de investigación, según describe una de sus creadores,
Janyce Wiebe, que codirige el NLP con
Diane Litman y
Rebbeca Hwa.
En primer lugar, los especialistas pretenden generar algoritmos fáciles de manejar que automáticamente puedan crear
patrones acerca de un tema concreto, con el fin de identificar fenómenos y vínculos asociados a hechos relevantes, como un
atentado terrorista.
Para la seguridad nacional En segundo lugar, se desarrollarán otros algoritmos
que permitan distinguir afirmaciones factuales u objetivas de las aserciones subjetivas o no-factuales. También identificarán
creencias acordes con determinadas organizaciones y evaluarán la intensidad, la polarización, la motivación y los tipos de
actitudes relacionados con dichas creencias.
Por último, se elaborarán métodos de rastreo de la evolución de creencias
y sucesos a lo largo del tiempo. Con este trabajo, se esperan descubrir patrones de actividad, cooperación y convicciones
en individuos de distinto tipo y en regiones geográficas diversas.
El proyecto ha sido respaldado económicamente por
el
Department of Homeland Security (departamento de seguridad nacional) estadounidense, que ha acordado una financiación de 2,4 millones de dólares. En el proyecto,
que ha recibido el nombre de
"Information Extraction of Events and Beliefs from Text", participarán, además de la universidad de Pittsburg, las universidades de Cornell y de Utah.
Las tres universidades
forman uno de los cuatro centros nacionales encargados de trabajar en nuevos métodos de análisis de datos para la seguridad
nacional. La metodología para detectar opiniones, emociones y expresiones en el lenguaje ha sido explicada en un
artículo de la mencionada universidad.
Intención y fiabilidad El "Information Extraction of Events and Beliefs
from Text" pretende analizar el lenguaje natural utilizando las técnicas clásicas de representación (gráfica sujeto-verbo,
por ejemplo) y las relaciones de las palabras en las frases (diferentes palabras o grupos de palabras que se refieren al mismo
concepto), así como supervisar el aprendizaje. No se pretenden analizar discursos completos, sino más bien oraciones e incluso
sólo palabras.
Las nuevas técnicas, principalmente desarrolladas en la universidad de Pittsburgh, en el NLP, permiten
distinguir los enunciados relacionados con las opiniones, rastreando dentro de ellos los componentes asociados a categorías
preestablecidas, así como la entonación positiva o negativa de las frases e incluso de cada palabra. Permite asimismo evaluar
la fiabilidad de cada enunciado.
Una combinación de ciencia computacional y de lingüística hará posible un sistema
de análisis de sentimientos y subjetividad, de semántica léxica, de procesamiento del discurso o de extracción de información
a partir del lenguaje, y por métodos empíricos. Para ello, resulta esencial un esquema detallado de anotaciones que definan
los componentes clave y las propiedades de la expresión de dichas emociones privadas.
Análisis de la subjetividad
Con este programa informático se pretende extraer información de artículos, noticias o cualquier tipo de texto, acerca
de, por ejemplo, posibles atentados terroristas, accidentes, adquisiciones empresariales o páginas web.
La tecnología
de análisis lingüístico ha sufrido un enorme despliegue en los últimos años, aunque su eficacia es aún relativamente baja
debido, principalmente, a que en los textos o en el lenguaje en general la información contenida suele ser de los dos tipos:
objetiva y subjetiva.
El lenguaje subjetivo expresa opiniones, juicios o estimaciones. Es muy común en noticias y
páginas web, que se han convertido en la primera fuente de análisis de la mayoría de las aplicaciones de extracción de información
a partir de los textos.
El objetivo de la investigación es utilizar el análisis de esa subjetividad para crear un
sistema de obtención de información más exacto, así como mejorar las técnicas de extracción de información a partir del análisis
de la subjetividad en el lenguaje. Así se espera reconocer ciertos cambios en el tiempo, como por ejemplo, un aumento o disminución
del grado de agresividad con que se expresan aquellas personas que pertenecen a grupos de interés, o cualquier modificación
en su retórica.
Yaiza Martínez
Fuente: tendencias21