César Antonio Aguilar
Facultad de Letras
06/12/2017
Curso de procesamiento del
lenguaje natural
La semántica desde un enfoque lingüístico (1)
De acuerdo a lo que hemos venido viendo en clases anteriores, el
procesamiento computacional de la información semántica contenida en
textos es una línea de investigación pujante, que impacta directamente en
muchos problemas de la lingüística computacional.
Un ejemplo de este
impacto son, por
supuesto, la
generación de
ontologías, como
hemos visto en
sesiones anteriores.
3
Ahora bien, un hecho que a veces pasa desapercibido, pero es
importante, es que el impacto de los avances en cómputo también
afectan los estudios de orden teórico en lingüística. Un ejemplo de esto
es Ray Jackendoff (1948), al postular los conceptos de interfaz y
arquitectura lingüísticas.
La semántica desde un enfoque lingüístico (2)
Para entender mejor
cómo funciona estas
interfaces, analicemos la
siguiente frase:
The little star’s beside the
big star.
Lo que tenemos aquí es
una radiografía que nos
muestra todo el proceso
que ocurre para construir
esta frase.
Cada uno de estos
procesos se desarrolla en
una interfaz específica.
La semántica desde un enfoque lingüístico (3)
Lo que Jackendoff logra hacer al plantear esta idea es rescatar la vieja concepción que tenía
Saussure sobre el signo lingüístico, aunque con una mayor fineza. La interfaz semántica es
un módulo del lenguaje que relaciona una “imagen mental” con su representación física en
palabras.
Cuando llegamos al nivel semántico, comprendemos que si las
oraciones representan situaciones o eventos que ocurren en la realidad,
es porque en nuestra mente proyectamos el concepto que tenemos
asociado a tal evento, considerando todos sus elementos y
participantes:
La semántica desde un enfoque lingüístico (4)
6
La teoría de las interfaces lingüísticas (1)
Jackendoff considera que el módulo semántico está próximo a un plano
conceptual, en tanto que el módulo sintáctico es el resultado de un
proceso previo de configuración de una estructura lingüística , la cual
necesita adecuar su contenido léxico, dependiendo del evento que tendrá
que expresar.
En este sentido, una oración es una interfaz que cumple la siguiente función:
mapear una representación sintáctica para un contenido conceptual dado.
7
La teoría de las interfaces lingüísticas (2)
Jackendoff y otros autores consideran que el hecho de permitir un acceso a la
sintaxis por parte de un nivel conceptual no debe ser algo caótico, sino todo lo
contrario. En este sentido, una estructura argumental puede ser entendida como el
mapeo de funciones que hace un contenido conceptual sobre el conjunto de
estructuras sintácticas posibles de una lengua:
8
Mapeo de funciones (1)
Vamos a tratar de entender el mapeo de funciones del siguiente
modo: Supongamos que tenemos un predicado del tipo X es un
satélite de Y. Más o menos entendemos, por extensión, una relación
como: La Luna es un satélite de la Tierra.
…Ser un satélite de…
9
Como pueden observar, existen dos detalles en este tipo de relaciones:
1. Que el predicado … Ser un satélite de… requiere de dos argumentos, y
que éstos tienen un orden concreto.
2. Que tal predicado se puede aplicar a otros objetos que puedan operar
como argumentos similares. Si esto es así, entonces podemos formar un
conjunto de lunas y planetas ligados por el predicado …Ser un satélite
de…
En otras palabras, lo que tenemos es una función del tipo:
Mapeo de funciones (2)
<Luna, Tierra>
10
Mapeo de funciones (3)
Ahora, para generar nuevos predicados, vamos a tomar en cuenta
dos unidades básicas:
Funciones: indican los valores que pueden asumir uno
o más objetos dentro de una relación.
Relaciones: son vínculos formales, los cuales se
pueden establecer a partir de reglas, que se dan entre
objetos dentro de un conjunto, sean tuplas o no.
11
Mapeo de funciones (4)
Con estas dos unidades, podemos hacer un cálculo de predicados
aplicable a cualquier cosa:
A = (Planeta)
A = A [Relación de
referencia]
A = B [Relación de sentido]
X es un planeta
X = Venus
X = “El lucero del alba”
X = “El lucero
vespertino”
12
Otra forma de representar esto, en términos de una auténtica
función, es:
Mercurio
Venus
Tierra
Marte
Júpiter
Saturno
Urano
Neptuno
f (X ), X es un planeta X puede ser =
Mapeo de funciones (5)
13
Mapeo de funciones (6)
Podemos ajustar nuestras proposiciones del siguiente modo:
y = “el objeto Lucero del Alba”
f( )= “SER el planeta llamado Venus”
x = “el objeto Venus”
f (x, y) = z
“Los argumentos ‘Venus’ y ‘Lucero del Alba’ cumplen con la
función del predicado ‘SER Venus’”
14
Composicionalidad semántica (1)
Un fenómeno que ha interesado mucho a los lingüistas teóricos y
computaciones derivado de lo anterior es uno que se conoce como
composicionalidad. Brevemente, una lingüista norteamericana,
Barbara Partee (1940), da la siguiente definición:
Barbara Partee
(1940)
http://people.umass.edu/partee/
Un ejemplo sencillo de esto es el verbo en inglés to bake (esp.
“hornear”. Considerando el significado de este verbo, ¿cuál es la
diferencia entre estas dos oraciones?
1. Todas las palabras de una lengua cuentan con un significado
específico asociado a un concepto.
2. Tales significados tienden a adecuarse a un contexto de uso dado, en
concreto el contexto de una oración, párrafo o discurso dado.
Cuando hablamos de composición en semántica, lo que queremos
decir es que:
a. John baked the potato.
b. John baked the cake.
Composicionalidad semántica (2)
2. El satélite barrió la superficie de Terranova
hoy por la mañana
Y otra cosa muy diferente es el significado de:
Veamos otro ejemplo: una cosa es el significado de la oración:
1. Las señoras barrieron el parque hoy por
la mañana
Composicionalidad semántica (5)
19
La forma en como se ha estudiado hasta el momento la
composicionalidad ha sido, sobre todo, desde un enfoque teórico-
descriptivo, ponderando sobre todo el uso de modelos formales para
explicar su funcionamiento.
De hecho, el terreno más fértil
para estudiarla ha sido la
interfaz sintaxis/semántica.
Digamos que cuando
analizamos el significado de
una oración, percibimos mejor
cómo opera la
composicionalidad.
Composicionalidad semántica (6)
20
La visión distributiva del lenguaje (1)
En los años 50, la lingüística norteamericana estaba asumiendo una
visión matemática sobre el funcionamiento del lenguaje humano. El
principal representante de esta corriente en ese momento era Zellig
Harris.
Zellig Harris
(1909-1992)
Harris fue uno de los primeros lingüistas que puso
atención en cómo las lenguas operaban de manera
similar a un sistema matemático, de tal suerte que:
1. Sus unidades de construcción se pueden
agrupar en dos conjuntos: simples y complejas
2. Sus procesos recursivos, los cuales dan lugar a
su capacidad combinatoria
3. Esta combinatoria da lugar a la identificación de
patrones regulares, los cuales muestran
frecuencias de uso claras y medibles
21
La visión distributiva del lenguaje (2)
Veamos un ejemplo sobre cómo entendía Harris todo esto.
Pensemos en la co-ocurrencia de palabras como cat y dog, según la
siguiente tabla:
22
La visión distributiva del lenguaje (3)
Dados estos valores, ¿cuáles son para ustedes las palabras que
pueden asociarse mejor? Veamos:
23
La visión distributiva del lenguaje (4)
Ahora bien, ¿qué otro grupo de palabras se pueden relacionar de
manera cercana, dada su distribución?:
24
La visión distributiva del lenguaje (5)
Si trasladamos las relaciones entre estos pares de palabras (cat/ dog
y bread/pasta) a un plano espacial, podemos modelar dos vectores,
siguiendo la explicación que nos dio Ana Bertha en clases anteriores:
25
La visión distributiva del lenguaje (6)
Harris lo que nos diría al observar estos vectores es lo siguiente:
26
Equivalencias entre semántica formal y distributiva (1)
El análisis de pares de palabras como las anteriores nos da pistas
sobre la información semántica que pueden compartir entre sí. Ahora,
¿qué pasa cuando analizamos frases y oraciones?
En breve, se puede ver que la composicionalidad puede ser vista
también como un fenómeno de distribución. P. e., consideren la
siguiente proposición:
27
A partir de una proposición como la anterior, somos capaces de sintetizar
una buena parte del contenido de información semántica que tiene el
nombre postdoc, e incluso podemos inferir que puede aparecer en el
contexto de oraciones como:
Equivalencias entre semántica formal y distributiva (2)
The article was written by the postdoctoral student yesterday
28
Contrastemos lo anterior con la siguiente idea: ¿qué pasa si encuentro
las mismas relaciones, pero esta vez en oraciones contenidas, p. e., en
los reportes de actividades que los investigadores universitarios llenan
para justificar la labor de sus postdoctorales, p.e.:
Equivalencias entre semántica formal y distributiva (4)
29
Ahora bien, proyectemos en un plano cartesiano las relaciones que
establecen las palabras postdoc, studend y wealth, y generemos sus
vectores, esto es:
Equivalencias entre semántica formal y distributiva (5)
30
¿El sentido común se puede parametrizar? (1)
Veamos otro ejemplo para comprender el sentido de la pregunta.
Supónganse que analizamos un corpus, y hacemos una identificación de
nombres y verbos como:
Si lo pensamos un rato, todos estos
nombres y verbos describen atributos y
datos que validan (o invalidan, también es
posible) nuestro conocimiento del mundo.
31
¿El sentido común se puede parametrizar? (2)
Ahora bien, generemos de nuevo nuestro plano cartesiano y tracemos
nuestros vectores, asignando un valor a cada relación para determinar
qué palabras están más cercanas o alejadas:
32
¿El sentido común se puede parametrizar? (3)
Si diseñamos una matriz de distribución con nuestras palabras, tenemos
algo como lo siguiente:
33
¿El sentido común se puede parametrizar? (4)
Ahora bien, una forma de establecer una similitud semántica entre estas
palabras es empleando una fórmula geométrica como el cálculo de
coseno, esto es:
34
¿El sentido común se puede parametrizar? (5)
Con estos datos ya podemos inferir varias relaciones semánticas, p.
e.:
36
¿El sentido común se puede parametrizar? (6)
Y considerando lo anterior, digamos que nuestro sistema de análisis
semántico computacional está haciendo inferencias usando un tipo de
sentido común artificial, esto es:
37
¿El sentido común se puede parametrizar? (6)
Tales inferencias no tienen por qué estar desligadas de los modelos
tradicionales de semántica formal; de hecho, se pueden combinar y
generar métodos híbridos, p. e.:
38
La composicionalidad es un fenómeno probabilístico (1)
Una vez planteado lo anterior, volvamos al fenómeno de la
composicionalidad semántica, y pensemos cómo esta puede ser
modelada en un espacio vectorial.
Partamos entonces recordando la definición dada por Barbara Partee:
40
La composicionalidad es un fenómeno probabilístico (3)
Esto lo podemos ejemplificar con experimentos que hemos hecho Olga
Acosta y yo para detectar términos hipónimos e hiperónimos en el área
de medicina, considerando la identificación de frases nominales que
contengan adjetivos relacionales, p. e.:
41
La composicionalidad es un fenómeno probabilístico (4)
De hecho, el significado de estos términos es composicional: si se
modifica el adjetivo relacional asociado al nombre (o sustantivo)
enfermedad, cambia completamente el significado. Veamos:
42
La composicionalidad es un fenómeno probabilístico (5)
Volvamos al ejemplo de old dog, ¿qué información debemos tomar en
cuenta para considerar que esta frase representa un fenómeno de
composicionalidad?:
Blog del curso:
http://cesaraguilar.weebly.com/curso-de-
procesamiento-del-lenguaje-natural.html
Gracias por su atención
Top Related