PLN Generación1 Generación proceso de construcción deliberada de un texto en LN para alcanzar...

40
PLN Generación 1 Generación proceso de construcción deliberada de un texto en LN para alcanzar determinados objetivos comunicativos (Mann,82)

Transcript of PLN Generación1 Generación proceso de construcción deliberada de un texto en LN para alcanzar...

Page 1: PLN Generación1 Generación proceso de construcción deliberada de un texto en LN para alcanzar determinados objetivos comunicativos (Mann,82)

PLN Generación 1

Generación

• proceso de construcción deliberada de un texto en LN para alcanzar determinados objetivos comunicativos (Mann,82)

Page 2: PLN Generación1 Generación proceso de construcción deliberada de un texto en LN para alcanzar determinados objetivos comunicativos (Mann,82)

PLN Generación 2

Generación

• Introducción• Arquitecturas de los sistemas de generación• Generación estratégica• Ejemplos: TEXT, Uso de la RST,• Generación táctica• Generación en los sistemas de diálogo• Generación estocástica

Page 3: PLN Generación1 Generación proceso de construcción deliberada de un texto en LN para alcanzar determinados objetivos comunicativos (Mann,82)

PLN Generación 3

Aplicaciones

• ¿Qué sistemas requieren generación en LN?• Los sistemas sofisticados de pregunta/respuesta,

especialmente los tutores inteligentes o las interfaces a aplicaciones complejas como los Sistemas Expertos.

• Los sistemas abiertos de consulta de información (ej. información telefónica)

• Los sistemas de generación de explicaciones.

• Los sistemas de búsqueda de la respuesta (QA).

• Los generadores de informes, cartas personalizadas, ...

• Los sistemas de Traducción Automática.

Page 4: PLN Generación1 Generación proceso de construcción deliberada de un texto en LN para alcanzar determinados objetivos comunicativos (Mann,82)

PLN Generación 4

Qué leer

• Reiter, Dale, 1995• Reports del proyecto RAGS• M. Walker, O. Rambow, S. Bangalore, ...• A. Oh, A. Rudnicky, 2002

Page 5: PLN Generación1 Generación proceso de construcción deliberada de un texto en LN para alcanzar determinados objetivos comunicativos (Mann,82)

PLN Generación 5

Tareas de PLN relacionadas

• Resumen automático• Generación y detección de paráfrasis• Simplificación de textos• ...

Page 6: PLN Generación1 Generación proceso de construcción deliberada de un texto en LN para alcanzar determinados objetivos comunicativos (Mann,82)

PLN Generación 6

Arquitectura de los Sistemas de Generación

componente estratégica(generación profunda) “what to say”

componente táctica(generación superficial) “how to say”

Page 7: PLN Generación1 Generación proceso de construcción deliberada de un texto en LN para alcanzar determinados objetivos comunicativos (Mann,82)

PLN Generación 7

generación estratégica

• determinación del contenido. Es decir, la identificación de los objetivos que se persiguen con la conversación, concretamente, ¿qué necesitan conocer los otros participantes en la conversación?

• La organización del texto. Es decir, cómo se consiguen los objetivos propuestos a través de las acciones de tipo locutivo.

• Características del interlocutor

• Terminología a emplear

• Grado de explicitud

• Cantidad de información

Page 8: PLN Generación1 Generación proceso de construcción deliberada de un texto en LN para alcanzar determinados objetivos comunicativos (Mann,82)

PLN Generación 8

generación táctica

• (componente lingüística) trata de la realización en LN de los contenidos y forma de presentarlos que se produjeron en la fase estratégica. • orden de presentación• estructura subyacente (párrafo, frase, etc...)• punto de vista• realización léxica de los conceptos.

Page 9: PLN Generación1 Generación proceso de construcción deliberada de un texto en LN para alcanzar determinados objetivos comunicativos (Mann,82)

PLN Generación 9

Arquitectura (Reiter, Dale)

Text Planner

Sentence Planner

Linguistic Realiser

Goal

Surface Text

Page 10: PLN Generación1 Generación proceso de construcción deliberada de un texto en LN para alcanzar determinados objetivos comunicativos (Mann,82)

PLN Generación 10

Arquitectura Genérica (RAGS)

• RAGS:• Reference Architecture for Generation Systems

• Universidad de Brighton• Cahill, Doran, Evans, Mellish, Paiva, Reape, Scott,

Tipper

• Modelo de Datos:• Conceptual

• Semántico

• Retórico

• Documento

• Sintáctico

Page 11: PLN Generación1 Generación proceso de construcción deliberada de un texto en LN para alcanzar determinados objetivos comunicativos (Mann,82)

PLN Generación 11

Tareas (RAGS)

• Tareas aplicables a cada uno de los 3 módulos:• Lexicalización

• Agregación

• estructura retórica

• generación de expresiones referenciales

• orden

• segmentación

• centering/salience/theme

Page 12: PLN Generación1 Generación proceso de construcción deliberada de un texto en LN para alcanzar determinados objetivos comunicativos (Mann,82)

PLN Generación 12

Generación Estratégica

• Fuertemente imbricada en la aplicación informática de la que el módulo de Generación forma parte.

• Implica un análisis de requisitos y una especificación.• Corpus-based approach

• PLANDOC system:• fragmentos fijos de texto• información obtenible directamente• información elaborable• información no obtenible

Page 13: PLN Generación1 Generación proceso de construcción deliberada de un texto en LN para alcanzar determinados objetivos comunicativos (Mann,82)

PLN Generación 13

Determinación del contenido

• Qué información se debe comunicar• Creación de una serie de mensajes creados a partir de la

entrada o de las fuentes de información• Filtrado, resumen y/o elaboración de la información• Lenguaje (más o menos) formal• La información de entrada al sistema puede provenir de:

• una base de datos o de conocimiento o una aplicación informática externa.

• directamente del usuario.

• de información creada por el propio sistema.

Page 14: PLN Generación1 Generación proceso de construcción deliberada de un texto en LN para alcanzar determinados objetivos comunicativos (Mann,82)

PLN Generación 14

Modelo de Usuario (MU)

• el contenido y la forma de las intervenciones del sistema deben adaptarse al modelo

• contenido• Lo que el usuario conoce

• Lo que el usuario pretende.

• La actitud que el usuario toma ante el diálogo.

• dos posibles estrategias• Filtrar las intervenciones del sistema de forma que sólo se

comunique al usuario lo que éste ignore

• Planificar las intervenciones partiendo ya de este conocimiento.

Page 15: PLN Generación1 Generación proceso de construcción deliberada de un texto en LN para alcanzar determinados objetivos comunicativos (Mann,82)

PLN Generación 15

Adquisición del MU

• Tipos de modelo• estático (calificación previa del usuario) • dinámico (cambios que el modelo sufre a medida que se

desarrolla el diálogo)

• Walster y Kobsa:• Razonamiento por defecto a partir de estereotipos.• Modelos iniciales a partir de sesiones anteriores.• Inferencias directas a partir de las expresiones del usuario.• Inferencias indirectas a partir de las expresiones del usuario.• Intervenciones del Sistema.

Page 16: PLN Generación1 Generación proceso de construcción deliberada de un texto en LN para alcanzar determinados objetivos comunicativos (Mann,82)

PLN Generación 16

Ejemplos de contenidos a comunicar

implicit-confirm(orig-city: NEWARK)implicit-confirm(dest-city: DALLAS)implicit-confirm(month: 9)implicit-confirm(day-number: 1)request(depart-time)

plan textual (Rambow)

message-id: msg01relation: IDENTITYarguments:

arg1: NEXT-TRAINarg2: CALEDONIAN-EXPRESS

mensaje (Reiter, Dale)

Page 17: PLN Generación1 Generación proceso de construcción deliberada de un texto en LN para alcanzar determinados objetivos comunicativos (Mann,82)

PLN Generación 17

Criterios de generación (A.Casey)

• cohesión: conectivos superficiales, pronombres, repeticiones, conjunciones

• coherencia: foco, rts

• intencionalidad: e.intencional

• aceptabilidad: oyente

• informatividad: conocimientos del oyente (MU)

• situacionalidad: contexto

• intertextualidad: tipos de texto, textos que actúan como contextos de otros textos

• interactividad: interrupciones, comprobaciones, iniciativa mixta

• acciones gráficas

Page 18: PLN Generación1 Generación proceso de construcción deliberada de un texto en LN para alcanzar determinados objetivos comunicativos (Mann,82)

PLN Generación 18

Estrategias de estructuración del texto 1

• Dos aproximaciones:• Basadas en planificación

• Basadas en el uso de plantillas (Schema-based)

Page 19: PLN Generación1 Generación proceso de construcción deliberada de un texto en LN para alcanzar determinados objetivos comunicativos (Mann,82)

PLN Generación 19

Estrategias de estructuración del texto 2

• Schema-based Discourse Planning• Un esquema es un patrón que especifica cómo un plan

textual puede construirse a partir de esquemas más pequeños o mensajes atómicos y qué tipo de relaciones existen entre esos constituyentes

Inform-Next-Train-Schema Sequence( Message:NUMBER-OF-TRAINS-IN-PERIOD,

Next-Train-Information-Schema)

Next-Train-Information-Schema Elaboration( Message:IDENTITY,

Message:DEPARTURE)

Page 20: PLN Generación1 Generación proceso de construcción deliberada de un texto en LN para alcanzar determinados objetivos comunicativos (Mann,82)

PLN Generación 20

Estrategias de estructuración del texto 2

• Sistemas basados en planificación• El decidir qué acciones, locutivas o no, debe realizar el

sistema está directamente relacionado con la E. Intencional que éste posea.

• Una manera bastante natural de tomar esta decisión es mediante un sistema de planificación.

• diferentes sistemas de planificación• Discourse planning, Sentence planning

• Litman: sistema organizado en torno a dos planificadores, uno del dominio y otro del discurso

Page 21: PLN Generación1 Generación proceso de construcción deliberada de un texto en LN para alcanzar determinados objetivos comunicativos (Mann,82)

PLN Generación 21

Estrategias de estructuración del texto 3

Discourse PlanningEstructura y orden de los mensajes a comunicarEjemplo de Discourse Structure Tree (Reiter, Dale)

Root

NextTrainInformation

NUMBER_OF_TRAINS_IN_PERIOD IDENTITY DEPARTURE

SEQUENCE

ELABORATION

Page 22: PLN Generación1 Generación proceso de construcción deliberada de un texto en LN para alcanzar determinados objetivos comunicativos (Mann,82)

PLN Generación 22

Estrategias de estructuración del texto 4

• Sentence Aggregation• Agrupar los mensajes en oraciones, párrafos,

pasajes, etc.• Posibles estrategias:

• No agregar: cada mensaje se expresa con una oración.

• Combinar dos mensajes con una oración de relativo.

• Combinar dos mensajes con una conjunción.

• Formas variadas.

Page 23: PLN Generación1 Generación proceso de construcción deliberada de un texto en LN para alcanzar determinados objetivos comunicativos (Mann,82)

PLN Generación 23

Estrategias de estructuración del texto 5

LexicalizationElección de los content words que deben aparecer en el texto generado. No confundir con la selección léxica (lexical choice) de la generación táctica)

Sentence AggregationAgrupar los mensajes en oraciones, párrafos, pasajes, etc.

Expresiones referencialesSe trata de una tarea discriminante: el sistema debe comunicar la información suficiente para distinguir entre ellas las entidades del dominio pero no más.

Page 24: PLN Generación1 Generación proceso de construcción deliberada de un texto en LN para alcanzar determinados objetivos comunicativos (Mann,82)

PLN Generación 24

Estrategias de estructuración del texto 6

Orden linealdistinción si es preciso entre orden intra-oracional e inter-oracional.

SegmentaciónDivisión de la información en oraciones, párrafos, pasajes, turnos, ...

Centering:Referencia hacia adelante o hacia atrás a los focos de interés.Efecto en la pronominalizaciónEl <Topic> de una oración está relacionado con el <Theme> del texto completo. La <Salience> viene determinada por esta relación

Page 25: PLN Generación1 Generación proceso de construcción deliberada de un texto en LN para alcanzar determinados objetivos comunicativos (Mann,82)

PLN Generación 25

Estrategias de estructuración del texto 7

• Dos ejemplos de aproximaciones en las que la organización del texto a producir viene determinada por el modelo discursivo que se utilice• TEXT (K. McKeown)

• Teoría de la Estructura Retórica (RST).

Page 26: PLN Generación1 Generación proceso de construcción deliberada de un texto en LN para alcanzar determinados objetivos comunicativos (Mann,82)

PLN Generación 26

TEXT 1

La estructura del texto a generar se puede derivar de laestructura de textos previos a través de una colección de estrategiasque son aplicables en cada caso.

ESTRUCTURA DERIVADA DE TEXTOS PREVIOS

objetivos del discurso

definir un concepto,describir la información del mismocomparar dos conceptos

Cualquier objetivo estratégico deberá expresarse en términos deestos objetivos elementales

Page 27: PLN Generación1 Generación proceso de construcción deliberada de un texto en LN para alcanzar determinados objetivos comunicativos (Mann,82)

PLN Generación 27

TEXT 2

información relevante

objetivos del discurso

En función del tipo de objetivo el sistema es capaz de aplicar alguna de las estrategias que posee para construir una estructura de texto (e incluir en ella la información relevante) que satisfaga dicho objetivo

P.semánticos

P.estructurales

determinación de la relevancia

selección de la estrategia discursiva

estrategias discursivas aplicables:constituiridentificaratribuircomparar

Page 28: PLN Generación1 Generación proceso de construcción deliberada de un texto en LN para alcanzar determinados objetivos comunicativos (Mann,82)

PLN Generación 28

TEXT 3

• ejemplo: estrategia de constitución• Identificar el objeto como miembro de una clase

genérica (definir) o presentar información atributiva (describir).

• Presentar las componentes del objeto. • Presentar las características de cada componente. • Presentar la información atributiva o de analogía

sobre el objeto.

Page 29: PLN Generación1 Generación proceso de construcción deliberada de un texto en LN para alcanzar determinados objetivos comunicativos (Mann,82)

PLN Generación 29

TEXT 4

• Por supuesto para conseguir un objetivo se pueden emplear varias estrategias (lo que dará una mayor riqueza y variedad en los textos generados).

• así un objetivo (p.ej. definir) se puede alcanzar empleando varias estrategias (identificar, constituir)

• Las estrategias pueden presentar alternativas y, a través de activaciones recursivas de las mismas, producir textos complejos.

Page 30: PLN Generación1 Generación proceso de construcción deliberada de un texto en LN para alcanzar determinados objetivos comunicativos (Mann,82)

PLN Generación 30

RST 1 (Mann, Mathiessen y Thomson)

La propuesta indica que los elementos que forman el texto están relacionados por una serie de relaciones retóricas que le dan soporte. La idea básica es que el texto se puede organizar en unidades ("text spans"), que responden a los objetivos de los hablantes y que se ligan por dichas relaciones retóricas.

núcleosatélite

relación retórica

su misión es apoyar al núcleo

establece cómo se produce el apoyo

responde a un objetivo

25 relaciones retóricasesquemas mucho más pequeños que los de TEXT =>mayor variedad en la generación de los textos.

Page 31: PLN Generación1 Generación proceso de construcción deliberada de un texto en LN para alcanzar determinados objetivos comunicativos (Mann,82)

PLN Generación 31

RST 2

evidencia

afirmación

provocar

petición

capacitar

restricciones sobre el núcleo (afirmación): el oyente posiblemente no cree la afirmación

restricciones sobre el satélite (evidencia): el oyente cree la evidenciarestricciones sobre la combinación: comprendiendo la evidencia aumentará la creencia del oyente en la afirmaciónefecto: la creencia del oyente sobre la afirmación aumenta

Page 32: PLN Generación1 Generación proceso de construcción deliberada de un texto en LN para alcanzar determinados objetivos comunicativos (Mann,82)

PLN Generación 32

La Generación Táctica 1

• traducir a LN las estructuras producto de la generación estratégica.

• Aproximaciones• TEMPLATE-BASED

• NLG

• Híbridos

Page 33: PLN Generación1 Generación proceso de construcción deliberada de un texto en LN para alcanzar determinados objetivos comunicativos (Mann,82)

PLN Generación 33

La Generación Táctica 2

• tareas• La selección léxica (qué palabras utilizar)

• La selección sintáctica (cómo construir las frases, utilizando dichas palabras, de forma que se satisfagan las condiciones de la generación estratégica).

• factores:• El interlocutor

• El contexto

• La información pragmática

Page 34: PLN Generación1 Generación proceso de construcción deliberada de un texto en LN para alcanzar determinados objetivos comunicativos (Mann,82)

PLN Generación 34

Perkins, 89 Clasificación de los atributos

• patrones para preguntas, afirmaciones, negaciones y desconocimiento:• what is the length of block A in meters

• the length of block A is 27 meters

• the length of block A is not 27 meters

• the length of block A is unknown

• 16 tipos de atributos• of, who_of, of_value, is, is_value, is_verb_value, does,

who_does, what_does, has, has_value, object, who_object, split, can, how_well_can

Page 35: PLN Generación1 Generación proceso de construcción deliberada de un texto en LN para alcanzar determinados objetivos comunicativos (Mann,82)

PLN Generación 35

NLG en sistemas de diálogo

DialogManager

TextPlanner

SentencePlanner

RealiserProsodyAssigner

NLG

NLU

TTS

ASR

Rambow et al, 2002

Page 36: PLN Generación1 Generación proceso de construcción deliberada de un texto en LN para alcanzar determinados objetivos comunicativos (Mann,82)

PLN Generación 36

métodos estadísticos en generación

• Introducción de métodos estadísticos en varias tareas de NLG.

• Ejemplos:• SPoT, ATT sentence planner

• FERGUS surface realizer

• NLG1, NLG2, NLG3, NLG4, Ratnaparkhi, surface realizer

• CMU Communicator

Page 37: PLN Generación1 Generación proceso de construcción deliberada de un texto en LN para alcanzar determinados objetivos comunicativos (Mann,82)

PLN Generación 37

NLG estocástico

DialogManager

Generation ScoringSlot

Filling

Oh, Rudnicky, 2002

Candidateutterances

Bestutterance

Input Frame

TaggedCorpora

LanguageModel

Completeutterance

TTS

Page 38: PLN Generación1 Generación proceso de construcción deliberada de un texto en LN para alcanzar determinados objetivos comunicativos (Mann,82)

PLN Generación 38

SPoT sentence planner

• Entrada: text plan• Dos componentes:

• SPG y SPR

• SPG (Sentence Plan Generator) genera 12-20 sentence plans• generación aleatoria a partir de distribuciones de

probabilidad.

• SPR (Sentence Plan Ranker) los ordena• Uso de RankBoost

• Features dependientes e independientes del dominio

Page 39: PLN Generación1 Generación proceso de construcción deliberada de un texto en LN para alcanzar determinados objetivos comunicativos (Mann,82)

PLN Generación 39

FERGUS surface realizer 1

• Entrada: árbol de dependencia infraespecificado.

• Salida: la mejor realización superficial de acuerdo al modelo estadístico usado.

• 3 componentes• Tree Chooser

• Unraveler

• Linear Precedence Chooser

Page 40: PLN Generación1 Generación proceso de construcción deliberada de un texto en LN para alcanzar determinados objetivos comunicativos (Mann,82)

PLN Generación 40

FERGUS surface realizer 2

• Tree Chooser• usa un Stochastic Tree Model para asociar a cada nodo

del árbol de entrada un supertag (procedente de un TAG).

• Unraveler• crea un retículo de palabras correspondientes a todas las

ordenaciones posibles consistentes con el árbol decorado.

• Linear Precedence Chooser• obtiene el mejor camino asociado al retículo usando

como fuente de conocimiento un modelo de trigrama.