44
César Antonio Aguilar Facultad de Letras 06/12/2017 Curso de procesamiento del lenguaje natural [email protected]

Curso de procesamiento del lenguaje natural - Iniciocesaraguilar.weebly.com/uploads/2/7/7/5/2775690/pln_clase14.pdf · La semántica desde un enfoque lingüístico (1) De acuerdo

  • Upload
    phamthu

  • View
    218

  • Download
    3

Embed Size (px)

Citation preview

César Antonio Aguilar

Facultad de Letras

06/12/2017

Curso de procesamiento del

lenguaje natural

[email protected]

La semántica desde un enfoque lingüístico (1)

De acuerdo a lo que hemos venido viendo en clases anteriores, el

procesamiento computacional de la información semántica contenida en

textos es una línea de investigación pujante, que impacta directamente en

muchos problemas de la lingüística computacional.

Un ejemplo de este

impacto son, por

supuesto, la

generación de

ontologías, como

hemos visto en

sesiones anteriores.

3

Ahora bien, un hecho que a veces pasa desapercibido, pero es

importante, es que el impacto de los avances en cómputo también

afectan los estudios de orden teórico en lingüística. Un ejemplo de esto

es Ray Jackendoff (1948), al postular los conceptos de interfaz y

arquitectura lingüísticas.

La semántica desde un enfoque lingüístico (2)

Para entender mejor

cómo funciona estas

interfaces, analicemos la

siguiente frase:

The little star’s beside the

big star.

Lo que tenemos aquí es

una radiografía que nos

muestra todo el proceso

que ocurre para construir

esta frase.

Cada uno de estos

procesos se desarrolla en

una interfaz específica.

La semántica desde un enfoque lingüístico (3)

Lo que Jackendoff logra hacer al plantear esta idea es rescatar la vieja concepción que tenía

Saussure sobre el signo lingüístico, aunque con una mayor fineza. La interfaz semántica es

un módulo del lenguaje que relaciona una “imagen mental” con su representación física en

palabras.

Cuando llegamos al nivel semántico, comprendemos que si las

oraciones representan situaciones o eventos que ocurren en la realidad,

es porque en nuestra mente proyectamos el concepto que tenemos

asociado a tal evento, considerando todos sus elementos y

participantes:

La semántica desde un enfoque lingüístico (4)

6

La teoría de las interfaces lingüísticas (1)

Jackendoff considera que el módulo semántico está próximo a un plano

conceptual, en tanto que el módulo sintáctico es el resultado de un

proceso previo de configuración de una estructura lingüística , la cual

necesita adecuar su contenido léxico, dependiendo del evento que tendrá

que expresar.

En este sentido, una oración es una interfaz que cumple la siguiente función:

mapear una representación sintáctica para un contenido conceptual dado.

7

La teoría de las interfaces lingüísticas (2)

Jackendoff y otros autores consideran que el hecho de permitir un acceso a la

sintaxis por parte de un nivel conceptual no debe ser algo caótico, sino todo lo

contrario. En este sentido, una estructura argumental puede ser entendida como el

mapeo de funciones que hace un contenido conceptual sobre el conjunto de

estructuras sintácticas posibles de una lengua:

8

Mapeo de funciones (1)

Vamos a tratar de entender el mapeo de funciones del siguiente

modo: Supongamos que tenemos un predicado del tipo X es un

satélite de Y. Más o menos entendemos, por extensión, una relación

como: La Luna es un satélite de la Tierra.

…Ser un satélite de…

9

Como pueden observar, existen dos detalles en este tipo de relaciones:

1. Que el predicado … Ser un satélite de… requiere de dos argumentos, y

que éstos tienen un orden concreto.

2. Que tal predicado se puede aplicar a otros objetos que puedan operar

como argumentos similares. Si esto es así, entonces podemos formar un

conjunto de lunas y planetas ligados por el predicado …Ser un satélite

de…

En otras palabras, lo que tenemos es una función del tipo:

Mapeo de funciones (2)

<Luna, Tierra>

10

Mapeo de funciones (3)

Ahora, para generar nuevos predicados, vamos a tomar en cuenta

dos unidades básicas:

Funciones: indican los valores que pueden asumir uno

o más objetos dentro de una relación.

Relaciones: son vínculos formales, los cuales se

pueden establecer a partir de reglas, que se dan entre

objetos dentro de un conjunto, sean tuplas o no.

11

Mapeo de funciones (4)

Con estas dos unidades, podemos hacer un cálculo de predicados

aplicable a cualquier cosa:

A = (Planeta)

A = A [Relación de

referencia]

A = B [Relación de sentido]

X es un planeta

X = Venus

X = “El lucero del alba”

X = “El lucero

vespertino”

12

Otra forma de representar esto, en términos de una auténtica

función, es:

Mercurio

Venus

Tierra

Marte

Júpiter

Saturno

Urano

Neptuno

f (X ), X es un planeta X puede ser =

Mapeo de funciones (5)

13

Mapeo de funciones (6)

Podemos ajustar nuestras proposiciones del siguiente modo:

y = “el objeto Lucero del Alba”

f( )= “SER el planeta llamado Venus”

x = “el objeto Venus”

f (x, y) = z

“Los argumentos ‘Venus’ y ‘Lucero del Alba’ cumplen con la

función del predicado ‘SER Venus’”

14

Composicionalidad semántica (1)

Un fenómeno que ha interesado mucho a los lingüistas teóricos y

computaciones derivado de lo anterior es uno que se conoce como

composicionalidad. Brevemente, una lingüista norteamericana,

Barbara Partee (1940), da la siguiente definición:

Barbara Partee

(1940)

http://people.umass.edu/partee/

Un ejemplo sencillo de esto es el verbo en inglés to bake (esp.

“hornear”. Considerando el significado de este verbo, ¿cuál es la

diferencia entre estas dos oraciones?

1. Todas las palabras de una lengua cuentan con un significado

específico asociado a un concepto.

2. Tales significados tienden a adecuarse a un contexto de uso dado, en

concreto el contexto de una oración, párrafo o discurso dado.

Cuando hablamos de composición en semántica, lo que queremos

decir es que:

a. John baked the potato.

b. John baked the cake.

Composicionalidad semántica (2)

Lo cual quiere decir:

Y la respuesta es:

Son

transformadas

en:

Composicionalidad semántica (3)

En contraparte, la oración:

Quiere decir:Producen:

Composicionalidad semántica (4)

2. El satélite barrió la superficie de Terranova

hoy por la mañana

Y otra cosa muy diferente es el significado de:

Veamos otro ejemplo: una cosa es el significado de la oración:

1. Las señoras barrieron el parque hoy por

la mañana

Composicionalidad semántica (5)

19

La forma en como se ha estudiado hasta el momento la

composicionalidad ha sido, sobre todo, desde un enfoque teórico-

descriptivo, ponderando sobre todo el uso de modelos formales para

explicar su funcionamiento.

De hecho, el terreno más fértil

para estudiarla ha sido la

interfaz sintaxis/semántica.

Digamos que cuando

analizamos el significado de

una oración, percibimos mejor

cómo opera la

composicionalidad.

Composicionalidad semántica (6)

20

La visión distributiva del lenguaje (1)

En los años 50, la lingüística norteamericana estaba asumiendo una

visión matemática sobre el funcionamiento del lenguaje humano. El

principal representante de esta corriente en ese momento era Zellig

Harris.

Zellig Harris

(1909-1992)

Harris fue uno de los primeros lingüistas que puso

atención en cómo las lenguas operaban de manera

similar a un sistema matemático, de tal suerte que:

1. Sus unidades de construcción se pueden

agrupar en dos conjuntos: simples y complejas

2. Sus procesos recursivos, los cuales dan lugar a

su capacidad combinatoria

3. Esta combinatoria da lugar a la identificación de

patrones regulares, los cuales muestran

frecuencias de uso claras y medibles

21

La visión distributiva del lenguaje (2)

Veamos un ejemplo sobre cómo entendía Harris todo esto.

Pensemos en la co-ocurrencia de palabras como cat y dog, según la

siguiente tabla:

22

La visión distributiva del lenguaje (3)

Dados estos valores, ¿cuáles son para ustedes las palabras que

pueden asociarse mejor? Veamos:

23

La visión distributiva del lenguaje (4)

Ahora bien, ¿qué otro grupo de palabras se pueden relacionar de

manera cercana, dada su distribución?:

24

La visión distributiva del lenguaje (5)

Si trasladamos las relaciones entre estos pares de palabras (cat/ dog

y bread/pasta) a un plano espacial, podemos modelar dos vectores,

siguiendo la explicación que nos dio Ana Bertha en clases anteriores:

25

La visión distributiva del lenguaje (6)

Harris lo que nos diría al observar estos vectores es lo siguiente:

26

Equivalencias entre semántica formal y distributiva (1)

El análisis de pares de palabras como las anteriores nos da pistas

sobre la información semántica que pueden compartir entre sí. Ahora,

¿qué pasa cuando analizamos frases y oraciones?

En breve, se puede ver que la composicionalidad puede ser vista

también como un fenómeno de distribución. P. e., consideren la

siguiente proposición:

27

A partir de una proposición como la anterior, somos capaces de sintetizar

una buena parte del contenido de información semántica que tiene el

nombre postdoc, e incluso podemos inferir que puede aparecer en el

contexto de oraciones como:

Equivalencias entre semántica formal y distributiva (2)

The article was written by the postdoctoral student yesterday

28

Contrastemos lo anterior con la siguiente idea: ¿qué pasa si encuentro

las mismas relaciones, pero esta vez en oraciones contenidas, p. e., en

los reportes de actividades que los investigadores universitarios llenan

para justificar la labor de sus postdoctorales, p.e.:

Equivalencias entre semántica formal y distributiva (4)

29

Ahora bien, proyectemos en un plano cartesiano las relaciones que

establecen las palabras postdoc, studend y wealth, y generemos sus

vectores, esto es:

Equivalencias entre semántica formal y distributiva (5)

30

¿El sentido común se puede parametrizar? (1)

Veamos otro ejemplo para comprender el sentido de la pregunta.

Supónganse que analizamos un corpus, y hacemos una identificación de

nombres y verbos como:

Si lo pensamos un rato, todos estos

nombres y verbos describen atributos y

datos que validan (o invalidan, también es

posible) nuestro conocimiento del mundo.

31

¿El sentido común se puede parametrizar? (2)

Ahora bien, generemos de nuevo nuestro plano cartesiano y tracemos

nuestros vectores, asignando un valor a cada relación para determinar

qué palabras están más cercanas o alejadas:

32

¿El sentido común se puede parametrizar? (3)

Si diseñamos una matriz de distribución con nuestras palabras, tenemos

algo como lo siguiente:

33

¿El sentido común se puede parametrizar? (4)

Ahora bien, una forma de establecer una similitud semántica entre estas

palabras es empleando una fórmula geométrica como el cálculo de

coseno, esto es:

34

¿El sentido común se puede parametrizar? (5)

Con estos datos ya podemos inferir varias relaciones semánticas, p.

e.:

35

¿El sentido común se puede parametrizar? (5)

Lo que advierte aquí es lo siguiente:

36

¿El sentido común se puede parametrizar? (6)

Y considerando lo anterior, digamos que nuestro sistema de análisis

semántico computacional está haciendo inferencias usando un tipo de

sentido común artificial, esto es:

37

¿El sentido común se puede parametrizar? (6)

Tales inferencias no tienen por qué estar desligadas de los modelos

tradicionales de semántica formal; de hecho, se pueden combinar y

generar métodos híbridos, p. e.:

38

La composicionalidad es un fenómeno probabilístico (1)

Una vez planteado lo anterior, volvamos al fenómeno de la

composicionalidad semántica, y pensemos cómo esta puede ser

modelada en un espacio vectorial.

Partamos entonces recordando la definición dada por Barbara Partee:

39

La composicionalidad es un fenómeno probabilístico (2)

Algo que sale a la luz es lo siguiente:

40

La composicionalidad es un fenómeno probabilístico (3)

Esto lo podemos ejemplificar con experimentos que hemos hecho Olga

Acosta y yo para detectar términos hipónimos e hiperónimos en el área

de medicina, considerando la identificación de frases nominales que

contengan adjetivos relacionales, p. e.:

41

La composicionalidad es un fenómeno probabilístico (4)

De hecho, el significado de estos términos es composicional: si se

modifica el adjetivo relacional asociado al nombre (o sustantivo)

enfermedad, cambia completamente el significado. Veamos:

42

La composicionalidad es un fenómeno probabilístico (5)

Volvamos al ejemplo de old dog, ¿qué información debemos tomar en

cuenta para considerar que esta frase representa un fenómeno de

composicionalidad?:

43

La composicionalidad es un fenómeno probabilístico (5)

En conclusión:

Blog del curso:

http://cesaraguilar.weebly.com/curso-de-

procesamiento-del-lenguaje-natural.html

Gracias por su atención