Curso de procesamiento del lenguaje natural - Iniciocesaraguilar.weebly.com/uploads/2/7/7/5/2775690/pln_clase14.pdf · La semántica desde un enfoque lingüístico (1) De acuerdo

Page 1: Curso de procesamiento del lenguaje natural - Iniciocesaraguilar.weebly.com/uploads/2/7/7/5/2775690/pln_clase14.pdf · La semántica desde un enfoque lingüístico (1) De acuerdo

César Antonio Aguilar

Facultad de Letras

06/12/2017

Curso de procesamiento del

lenguaje natural

[email protected]

mailto:[email protected]

Page 2: Curso de procesamiento del lenguaje natural - Iniciocesaraguilar.weebly.com/uploads/2/7/7/5/2775690/pln_clase14.pdf · La semántica desde un enfoque lingüístico (1) De acuerdo

La semántica desde un enfoque lingüístico (1)

De acuerdo a lo que hemos venido viendo en clases anteriores, el

procesamiento computacional de la información semántica contenida en

textos es una línea de investigación pujante, que impacta directamente en

muchos problemas de la lingüística computacional.

Un ejemplo de este

impacto son, por

supuesto, la

generación de

ontologías, como

hemos visto en

sesiones anteriores.

Page 3: Curso de procesamiento del lenguaje natural - Iniciocesaraguilar.weebly.com/uploads/2/7/7/5/2775690/pln_clase14.pdf · La semántica desde un enfoque lingüístico (1) De acuerdo

3

Ahora bien, un hecho que a veces pasa desapercibido, pero es

importante, es que el impacto de los avances en cómputo también

afectan los estudios de orden teórico en lingüística. Un ejemplo de esto

es Ray Jackendoff (1948), al postular los conceptos de interfaz y

arquitectura lingüísticas.

La semántica desde un enfoque lingüístico (2)

Page 4: Curso de procesamiento del lenguaje natural - Iniciocesaraguilar.weebly.com/uploads/2/7/7/5/2775690/pln_clase14.pdf · La semántica desde un enfoque lingüístico (1) De acuerdo

Para entender mejor

cómo funciona estas

interfaces, analicemos la

siguiente frase:

The little star’s beside the

big star.

Lo que tenemos aquí es

una radiografía que nos

muestra todo el proceso

que ocurre para construir

esta frase.

Cada uno de estos

procesos se desarrolla en

una interfaz específica.

La semántica desde un enfoque lingüístico (3)

Page 5: Curso de procesamiento del lenguaje natural - Iniciocesaraguilar.weebly.com/uploads/2/7/7/5/2775690/pln_clase14.pdf · La semántica desde un enfoque lingüístico (1) De acuerdo

Lo que Jackendoff logra hacer al plantear esta idea es rescatar la vieja concepción que tenía

Saussure sobre el signo lingüístico, aunque con una mayor fineza. La interfaz semántica es

un módulo del lenguaje que relaciona una “imagen mental” con su representación física en

palabras.

Cuando llegamos al nivel semántico, comprendemos que si las

oraciones representan situaciones o eventos que ocurren en la realidad,

es porque en nuestra mente proyectamos el concepto que tenemos

asociado a tal evento, considerando todos sus elementos y

participantes:

La semántica desde un enfoque lingüístico (4)

Page 6: Curso de procesamiento del lenguaje natural - Iniciocesaraguilar.weebly.com/uploads/2/7/7/5/2775690/pln_clase14.pdf · La semántica desde un enfoque lingüístico (1) De acuerdo

6

La teoría de las interfaces lingüísticas (1)

Jackendoff considera que el módulo semántico está próximo a un plano

conceptual, en tanto que el módulo sintáctico es el resultado de un

proceso previo de configuración de una estructura lingüística , la cual

necesita adecuar su contenido léxico, dependiendo del evento que tendrá

que expresar.

En este sentido, una oración es una interfaz que cumple la siguiente función:

mapear una representación sintáctica para un contenido conceptual dado.

Page 7: Curso de procesamiento del lenguaje natural - Iniciocesaraguilar.weebly.com/uploads/2/7/7/5/2775690/pln_clase14.pdf · La semántica desde un enfoque lingüístico (1) De acuerdo

7

La teoría de las interfaces lingüísticas (2)

Jackendoff y otros autores consideran que el hecho de permitir un acceso a la

sintaxis por parte de un nivel conceptual no debe ser algo caótico, sino todo lo

contrario. En este sentido, una estructura argumental puede ser entendida como el

mapeo de funciones que hace un contenido conceptual sobre el conjunto de

estructuras sintácticas posibles de una lengua:

Page 8: Curso de procesamiento del lenguaje natural - Iniciocesaraguilar.weebly.com/uploads/2/7/7/5/2775690/pln_clase14.pdf · La semántica desde un enfoque lingüístico (1) De acuerdo

8

Mapeo de funciones (1)

Vamos a tratar de entender el mapeo de funciones del siguiente

modo: Supongamos que tenemos un predicado del tipo X es un

satélite de Y. Más o menos entendemos, por extensión, una relación

como: La Luna es un satélite de la Tierra.

…Ser un satélite de…

Page 9: Curso de procesamiento del lenguaje natural - Iniciocesaraguilar.weebly.com/uploads/2/7/7/5/2775690/pln_clase14.pdf · La semántica desde un enfoque lingüístico (1) De acuerdo

9

Como pueden observar, existen dos detalles en este tipo de relaciones:

1. Que el predicado … Ser un satélite de… requiere de dos argumentos, y

que éstos tienen un orden concreto.

2. Que tal predicado se puede aplicar a otros objetos que puedan operar

como argumentos similares. Si esto es así, entonces podemos formar un

conjunto de lunas y planetas ligados por el predicado …Ser un satélite

de…

En otras palabras, lo que tenemos es una función del tipo:

Mapeo de funciones (2)

<Luna, Tierra>

Page 10: Curso de procesamiento del lenguaje natural - Iniciocesaraguilar.weebly.com/uploads/2/7/7/5/2775690/pln_clase14.pdf · La semántica desde un enfoque lingüístico (1) De acuerdo

10

Mapeo de funciones (3)

Ahora, para generar nuevos predicados, vamos a tomar en cuenta

dos unidades básicas:

Funciones: indican los valores que pueden asumir uno

o más objetos dentro de una relación.

Relaciones: son vínculos formales, los cuales se

pueden establecer a partir de reglas, que se dan entre

objetos dentro de un conjunto, sean tuplas o no.

Page 11: Curso de procesamiento del lenguaje natural - Iniciocesaraguilar.weebly.com/uploads/2/7/7/5/2775690/pln_clase14.pdf · La semántica desde un enfoque lingüístico (1) De acuerdo

11

Mapeo de funciones (4)

Con estas dos unidades, podemos hacer un cálculo de predicados

aplicable a cualquier cosa:

A = (Planeta)

A = A [Relación de

referencia]

A = B [Relación de sentido]

X es un planeta

X = Venus

X = “El lucero del alba”

X = “El lucero

vespertino”

Page 12: Curso de procesamiento del lenguaje natural - Iniciocesaraguilar.weebly.com/uploads/2/7/7/5/2775690/pln_clase14.pdf · La semántica desde un enfoque lingüístico (1) De acuerdo

12

Otra forma de representar esto, en términos de una auténtica

función, es:

Mercurio

Venus

Tierra

Marte

Júpiter

Saturno

Urano

Neptuno

f (X ), X es un planeta X puede ser =

Mapeo de funciones (5)

Page 13: Curso de procesamiento del lenguaje natural - Iniciocesaraguilar.weebly.com/uploads/2/7/7/5/2775690/pln_clase14.pdf · La semántica desde un enfoque lingüístico (1) De acuerdo

13

Mapeo de funciones (6)

Podemos ajustar nuestras proposiciones del siguiente modo:

y = “el objeto Lucero del Alba”

f( )= “SER el planeta llamado Venus”

x = “el objeto Venus”

f (x, y) = z

“Los argumentos ‘Venus’ y ‘Lucero del Alba’ cumplen con la

función del predicado ‘SER Venus’”

Page 14: Curso de procesamiento del lenguaje natural - Iniciocesaraguilar.weebly.com/uploads/2/7/7/5/2775690/pln_clase14.pdf · La semántica desde un enfoque lingüístico (1) De acuerdo

14

Composicionalidad semántica (1)

Un fenómeno que ha interesado mucho a los lingüistas teóricos y

computaciones derivado de lo anterior es uno que se conoce como

composicionalidad. Brevemente, una lingüista norteamericana,

Barbara Partee (1940), da la siguiente definición:

Barbara Partee

(1940)

http://people.umass.edu/partee/

Page 15: Curso de procesamiento del lenguaje natural - Iniciocesaraguilar.weebly.com/uploads/2/7/7/5/2775690/pln_clase14.pdf · La semántica desde un enfoque lingüístico (1) De acuerdo

Un ejemplo sencillo de esto es el verbo en inglés to bake (esp.

“hornear”. Considerando el significado de este verbo, ¿cuál es la

diferencia entre estas dos oraciones?

1. Todas las palabras de una lengua cuentan con un significado

específico asociado a un concepto.

2. Tales significados tienden a adecuarse a un contexto de uso dado, en

concreto el contexto de una oración, párrafo o discurso dado.

Cuando hablamos de composición en semántica, lo que queremos

decir es que:

a. John baked the potato.

b. John baked the cake.

Composicionalidad semántica (2)

Page 16: Curso de procesamiento del lenguaje natural - Iniciocesaraguilar.weebly.com/uploads/2/7/7/5/2775690/pln_clase14.pdf · La semántica desde un enfoque lingüístico (1) De acuerdo

Lo cual quiere decir:

Y la respuesta es:

Son

transformadas

en:

Composicionalidad semántica (3)

Page 17: Curso de procesamiento del lenguaje natural - Iniciocesaraguilar.weebly.com/uploads/2/7/7/5/2775690/pln_clase14.pdf · La semántica desde un enfoque lingüístico (1) De acuerdo

En contraparte, la oración:

Quiere decir:Producen:

Composicionalidad semántica (4)

Page 18: Curso de procesamiento del lenguaje natural - Iniciocesaraguilar.weebly.com/uploads/2/7/7/5/2775690/pln_clase14.pdf · La semántica desde un enfoque lingüístico (1) De acuerdo

2. El satélite barrió la superficie de Terranova

hoy por la mañana

Y otra cosa muy diferente es el significado de:

Veamos otro ejemplo: una cosa es el significado de la oración:

1. Las señoras barrieron el parque hoy por

la mañana

Composicionalidad semántica (5)

Page 19: Curso de procesamiento del lenguaje natural - Iniciocesaraguilar.weebly.com/uploads/2/7/7/5/2775690/pln_clase14.pdf · La semántica desde un enfoque lingüístico (1) De acuerdo

19

La forma en como se ha estudiado hasta el momento la

composicionalidad ha sido, sobre todo, desde un enfoque teórico-

descriptivo, ponderando sobre todo el uso de modelos formales para

explicar su funcionamiento.

De hecho, el terreno más fértil

para estudiarla ha sido la

interfaz sintaxis/semántica.

Digamos que cuando

analizamos el significado de

una oración, percibimos mejor

cómo opera la

composicionalidad.

Composicionalidad semántica (6)

Page 20: Curso de procesamiento del lenguaje natural - Iniciocesaraguilar.weebly.com/uploads/2/7/7/5/2775690/pln_clase14.pdf · La semántica desde un enfoque lingüístico (1) De acuerdo

20

La visión distributiva del lenguaje (1)

En los años 50, la lingüística norteamericana estaba asumiendo una

visión matemática sobre el funcionamiento del lenguaje humano. El

principal representante de esta corriente en ese momento era Zellig

Harris.

Zellig Harris

(1909-1992)

Harris fue uno de los primeros lingüistas que puso

atención en cómo las lenguas operaban de manera

similar a un sistema matemático, de tal suerte que:

1. Sus unidades de construcción se pueden

agrupar en dos conjuntos: simples y complejas

2. Sus procesos recursivos, los cuales dan lugar a

su capacidad combinatoria

3. Esta combinatoria da lugar a la identificación de

patrones regulares, los cuales muestran

frecuencias de uso claras y medibles

Page 21: Curso de procesamiento del lenguaje natural - Iniciocesaraguilar.weebly.com/uploads/2/7/7/5/2775690/pln_clase14.pdf · La semántica desde un enfoque lingüístico (1) De acuerdo

21

La visión distributiva del lenguaje (2)

Veamos un ejemplo sobre cómo entendía Harris todo esto.

Pensemos en la co-ocurrencia de palabras como cat y dog, según la

siguiente tabla:

Page 22: Curso de procesamiento del lenguaje natural - Iniciocesaraguilar.weebly.com/uploads/2/7/7/5/2775690/pln_clase14.pdf · La semántica desde un enfoque lingüístico (1) De acuerdo

22

La visión distributiva del lenguaje (3)

Dados estos valores, ¿cuáles son para ustedes las palabras que

pueden asociarse mejor? Veamos:

Page 23: Curso de procesamiento del lenguaje natural - Iniciocesaraguilar.weebly.com/uploads/2/7/7/5/2775690/pln_clase14.pdf · La semántica desde un enfoque lingüístico (1) De acuerdo

23

La visión distributiva del lenguaje (4)

Ahora bien, ¿qué otro grupo de palabras se pueden relacionar de

manera cercana, dada su distribución?:

Page 24: Curso de procesamiento del lenguaje natural - Iniciocesaraguilar.weebly.com/uploads/2/7/7/5/2775690/pln_clase14.pdf · La semántica desde un enfoque lingüístico (1) De acuerdo

24

La visión distributiva del lenguaje (5)

Si trasladamos las relaciones entre estos pares de palabras (cat/ dog

y bread/pasta) a un plano espacial, podemos modelar dos vectores,

siguiendo la explicación que nos dio Ana Bertha en clases anteriores:

Page 25: Curso de procesamiento del lenguaje natural - Iniciocesaraguilar.weebly.com/uploads/2/7/7/5/2775690/pln_clase14.pdf · La semántica desde un enfoque lingüístico (1) De acuerdo

25

La visión distributiva del lenguaje (6)

Harris lo que nos diría al observar estos vectores es lo siguiente:

Page 26: Curso de procesamiento del lenguaje natural - Iniciocesaraguilar.weebly.com/uploads/2/7/7/5/2775690/pln_clase14.pdf · La semántica desde un enfoque lingüístico (1) De acuerdo

26

Equivalencias entre semántica formal y distributiva (1)

El análisis de pares de palabras como las anteriores nos da pistas

sobre la información semántica que pueden compartir entre sí. Ahora,

¿qué pasa cuando analizamos frases y oraciones?

En breve, se puede ver que la composicionalidad puede ser vista

también como un fenómeno de distribución. P. e., consideren la

siguiente proposición:

Page 27: Curso de procesamiento del lenguaje natural - Iniciocesaraguilar.weebly.com/uploads/2/7/7/5/2775690/pln_clase14.pdf · La semántica desde un enfoque lingüístico (1) De acuerdo

27

A partir de una proposición como la anterior, somos capaces de sintetizar

una buena parte del contenido de información semántica que tiene el

nombre postdoc, e incluso podemos inferir que puede aparecer en el

contexto de oraciones como:

Equivalencias entre semántica formal y distributiva (2)

The article was written by the postdoctoral student yesterday

Page 28: Curso de procesamiento del lenguaje natural - Iniciocesaraguilar.weebly.com/uploads/2/7/7/5/2775690/pln_clase14.pdf · La semántica desde un enfoque lingüístico (1) De acuerdo

28

Contrastemos lo anterior con la siguiente idea: ¿qué pasa si encuentro

las mismas relaciones, pero esta vez en oraciones contenidas, p. e., en

los reportes de actividades que los investigadores universitarios llenan

para justificar la labor de sus postdoctorales, p.e.:

Equivalencias entre semántica formal y distributiva (4)

Page 29: Curso de procesamiento del lenguaje natural - Iniciocesaraguilar.weebly.com/uploads/2/7/7/5/2775690/pln_clase14.pdf · La semántica desde un enfoque lingüístico (1) De acuerdo

29

Ahora bien, proyectemos en un plano cartesiano las relaciones que

establecen las palabras postdoc, studend y wealth, y generemos sus

vectores, esto es:

Equivalencias entre semántica formal y distributiva (5)

Page 30: Curso de procesamiento del lenguaje natural - Iniciocesaraguilar.weebly.com/uploads/2/7/7/5/2775690/pln_clase14.pdf · La semántica desde un enfoque lingüístico (1) De acuerdo

30

¿El sentido común se puede parametrizar? (1)

Veamos otro ejemplo para comprender el sentido de la pregunta.

Supónganse que analizamos un corpus, y hacemos una identificación de

nombres y verbos como:

Si lo pensamos un rato, todos estos

nombres y verbos describen atributos y

datos que validan (o invalidan, también es

posible) nuestro conocimiento del mundo.

Page 31: Curso de procesamiento del lenguaje natural - Iniciocesaraguilar.weebly.com/uploads/2/7/7/5/2775690/pln_clase14.pdf · La semántica desde un enfoque lingüístico (1) De acuerdo

31

¿El sentido común se puede parametrizar? (2)

Ahora bien, generemos de nuevo nuestro plano cartesiano y tracemos

nuestros vectores, asignando un valor a cada relación para determinar

qué palabras están más cercanas o alejadas:

Page 32: Curso de procesamiento del lenguaje natural - Iniciocesaraguilar.weebly.com/uploads/2/7/7/5/2775690/pln_clase14.pdf · La semántica desde un enfoque lingüístico (1) De acuerdo

32

¿El sentido común se puede parametrizar? (3)

Si diseñamos una matriz de distribución con nuestras palabras, tenemos

algo como lo siguiente:

Page 33: Curso de procesamiento del lenguaje natural - Iniciocesaraguilar.weebly.com/uploads/2/7/7/5/2775690/pln_clase14.pdf · La semántica desde un enfoque lingüístico (1) De acuerdo

33

¿El sentido común se puede parametrizar? (4)

Ahora bien, una forma de establecer una similitud semántica entre estas

palabras es empleando una fórmula geométrica como el cálculo de

coseno, esto es:

Page 34: Curso de procesamiento del lenguaje natural - Iniciocesaraguilar.weebly.com/uploads/2/7/7/5/2775690/pln_clase14.pdf · La semántica desde un enfoque lingüístico (1) De acuerdo

34

¿El sentido común se puede parametrizar? (5)

Con estos datos ya podemos inferir varias relaciones semánticas, p.

e.:

Page 35: Curso de procesamiento del lenguaje natural - Iniciocesaraguilar.weebly.com/uploads/2/7/7/5/2775690/pln_clase14.pdf · La semántica desde un enfoque lingüístico (1) De acuerdo

35

¿El sentido común se puede parametrizar? (5)

Lo que advierte aquí es lo siguiente:

Page 36: Curso de procesamiento del lenguaje natural - Iniciocesaraguilar.weebly.com/uploads/2/7/7/5/2775690/pln_clase14.pdf · La semántica desde un enfoque lingüístico (1) De acuerdo

36

¿El sentido común se puede parametrizar? (6)

Y considerando lo anterior, digamos que nuestro sistema de análisis

semántico computacional está haciendo inferencias usando un tipo de

sentido común artificial, esto es:

Page 37: Curso de procesamiento del lenguaje natural - Iniciocesaraguilar.weebly.com/uploads/2/7/7/5/2775690/pln_clase14.pdf · La semántica desde un enfoque lingüístico (1) De acuerdo

37

¿El sentido común se puede parametrizar? (6)

Tales inferencias no tienen por qué estar desligadas de los modelos

tradicionales de semántica formal; de hecho, se pueden combinar y

generar métodos híbridos, p. e.:

Page 38: Curso de procesamiento del lenguaje natural - Iniciocesaraguilar.weebly.com/uploads/2/7/7/5/2775690/pln_clase14.pdf · La semántica desde un enfoque lingüístico (1) De acuerdo

38

La composicionalidad es un fenómeno probabilístico (1)

Una vez planteado lo anterior, volvamos al fenómeno de la

composicionalidad semántica, y pensemos cómo esta puede ser

modelada en un espacio vectorial.

Partamos entonces recordando la definición dada por Barbara Partee:

Page 39: Curso de procesamiento del lenguaje natural - Iniciocesaraguilar.weebly.com/uploads/2/7/7/5/2775690/pln_clase14.pdf · La semántica desde un enfoque lingüístico (1) De acuerdo

39

La composicionalidad es un fenómeno probabilístico (2)

Algo que sale a la luz es lo siguiente:

Page 40: Curso de procesamiento del lenguaje natural - Iniciocesaraguilar.weebly.com/uploads/2/7/7/5/2775690/pln_clase14.pdf · La semántica desde un enfoque lingüístico (1) De acuerdo

40

La composicionalidad es un fenómeno probabilístico (3)

Esto lo podemos ejemplificar con experimentos que hemos hecho Olga

Acosta y yo para detectar términos hipónimos e hiperónimos en el área

de medicina, considerando la identificación de frases nominales que

contengan adjetivos relacionales, p. e.:

Page 41: Curso de procesamiento del lenguaje natural - Iniciocesaraguilar.weebly.com/uploads/2/7/7/5/2775690/pln_clase14.pdf · La semántica desde un enfoque lingüístico (1) De acuerdo

41

La composicionalidad es un fenómeno probabilístico (4)

De hecho, el significado de estos términos es composicional: si se

modifica el adjetivo relacional asociado al nombre (o sustantivo)

enfermedad, cambia completamente el significado. Veamos:

Page 42: Curso de procesamiento del lenguaje natural - Iniciocesaraguilar.weebly.com/uploads/2/7/7/5/2775690/pln_clase14.pdf · La semántica desde un enfoque lingüístico (1) De acuerdo

42

La composicionalidad es un fenómeno probabilístico (5)

Volvamos al ejemplo de old dog, ¿qué información debemos tomar en

cuenta para considerar que esta frase representa un fenómeno de

composicionalidad?:

Page 43: Curso de procesamiento del lenguaje natural - Iniciocesaraguilar.weebly.com/uploads/2/7/7/5/2775690/pln_clase14.pdf · La semántica desde un enfoque lingüístico (1) De acuerdo

43

La composicionalidad es un fenómeno probabilístico (5)

En conclusión:

Page 44: Curso de procesamiento del lenguaje natural - Iniciocesaraguilar.weebly.com/uploads/2/7/7/5/2775690/pln_clase14.pdf · La semántica desde un enfoque lingüístico (1) De acuerdo

Blog del curso:

http://cesaraguilar.weebly.com/curso-de-

procesamiento-del-lenguaje-natural.html

Gracias por su atención

http://cesaraguilar.weebly.com/curso-de-procesamiento-del-lenguaje-natural.html

Download - Curso de procesamiento del lenguaje natural - Iniciocesaraguilar.weebly.com/uploads/2/7/7/5/2775690/pln_clase14.pdf · La semántica desde un enfoque lingüístico (1) De acuerdo