PLN Generación1 Generación proceso de construcción deliberada de un texto en LN para alcanzar...
-
Upload
marita-ferrera -
Category
Documents
-
view
216 -
download
0
Transcript of PLN Generación1 Generación proceso de construcción deliberada de un texto en LN para alcanzar...
PLN Generación 1
Generación
• proceso de construcción deliberada de un texto en LN para alcanzar determinados objetivos comunicativos (Mann,82)
PLN Generación 2
Generación
• Introducción• Arquitecturas de los sistemas de generación• Generación estratégica• Ejemplos: TEXT, Uso de la RST,• Generación táctica• Generación en los sistemas de diálogo• Generación estocástica
PLN Generación 3
Aplicaciones
• ¿Qué sistemas requieren generación en LN?• Los sistemas sofisticados de pregunta/respuesta,
especialmente los tutores inteligentes o las interfaces a aplicaciones complejas como los Sistemas Expertos.
• Los sistemas abiertos de consulta de información (ej. información telefónica)
• Los sistemas de generación de explicaciones.
• Los sistemas de búsqueda de la respuesta (QA).
• Los generadores de informes, cartas personalizadas, ...
• Los sistemas de Traducción Automática.
PLN Generación 4
Qué leer
• Reiter, Dale, 1995• Reports del proyecto RAGS• M. Walker, O. Rambow, S. Bangalore, ...• A. Oh, A. Rudnicky, 2002
PLN Generación 5
Tareas de PLN relacionadas
• Resumen automático• Generación y detección de paráfrasis• Simplificación de textos• ...
PLN Generación 6
Arquitectura de los Sistemas de Generación
componente estratégica(generación profunda) “what to say”
componente táctica(generación superficial) “how to say”
PLN Generación 7
generación estratégica
• determinación del contenido. Es decir, la identificación de los objetivos que se persiguen con la conversación, concretamente, ¿qué necesitan conocer los otros participantes en la conversación?
• La organización del texto. Es decir, cómo se consiguen los objetivos propuestos a través de las acciones de tipo locutivo.
• Características del interlocutor
• Terminología a emplear
• Grado de explicitud
• Cantidad de información
PLN Generación 8
generación táctica
• (componente lingüística) trata de la realización en LN de los contenidos y forma de presentarlos que se produjeron en la fase estratégica. • orden de presentación• estructura subyacente (párrafo, frase, etc...)• punto de vista• realización léxica de los conceptos.
PLN Generación 9
Arquitectura (Reiter, Dale)
Text Planner
Sentence Planner
Linguistic Realiser
Goal
Surface Text
PLN Generación 10
Arquitectura Genérica (RAGS)
• RAGS:• Reference Architecture for Generation Systems
• Universidad de Brighton• Cahill, Doran, Evans, Mellish, Paiva, Reape, Scott,
Tipper
• Modelo de Datos:• Conceptual
• Semántico
• Retórico
• Documento
• Sintáctico
PLN Generación 11
Tareas (RAGS)
• Tareas aplicables a cada uno de los 3 módulos:• Lexicalización
• Agregación
• estructura retórica
• generación de expresiones referenciales
• orden
• segmentación
• centering/salience/theme
PLN Generación 12
Generación Estratégica
• Fuertemente imbricada en la aplicación informática de la que el módulo de Generación forma parte.
• Implica un análisis de requisitos y una especificación.• Corpus-based approach
• PLANDOC system:• fragmentos fijos de texto• información obtenible directamente• información elaborable• información no obtenible
PLN Generación 13
Determinación del contenido
• Qué información se debe comunicar• Creación de una serie de mensajes creados a partir de la
entrada o de las fuentes de información• Filtrado, resumen y/o elaboración de la información• Lenguaje (más o menos) formal• La información de entrada al sistema puede provenir de:
• una base de datos o de conocimiento o una aplicación informática externa.
• directamente del usuario.
• de información creada por el propio sistema.
PLN Generación 14
Modelo de Usuario (MU)
• el contenido y la forma de las intervenciones del sistema deben adaptarse al modelo
• contenido• Lo que el usuario conoce
• Lo que el usuario pretende.
• La actitud que el usuario toma ante el diálogo.
• dos posibles estrategias• Filtrar las intervenciones del sistema de forma que sólo se
comunique al usuario lo que éste ignore
• Planificar las intervenciones partiendo ya de este conocimiento.
PLN Generación 15
Adquisición del MU
• Tipos de modelo• estático (calificación previa del usuario) • dinámico (cambios que el modelo sufre a medida que se
desarrolla el diálogo)
• Walster y Kobsa:• Razonamiento por defecto a partir de estereotipos.• Modelos iniciales a partir de sesiones anteriores.• Inferencias directas a partir de las expresiones del usuario.• Inferencias indirectas a partir de las expresiones del usuario.• Intervenciones del Sistema.
PLN Generación 16
Ejemplos de contenidos a comunicar
implicit-confirm(orig-city: NEWARK)implicit-confirm(dest-city: DALLAS)implicit-confirm(month: 9)implicit-confirm(day-number: 1)request(depart-time)
plan textual (Rambow)
message-id: msg01relation: IDENTITYarguments:
arg1: NEXT-TRAINarg2: CALEDONIAN-EXPRESS
mensaje (Reiter, Dale)
PLN Generación 17
Criterios de generación (A.Casey)
• cohesión: conectivos superficiales, pronombres, repeticiones, conjunciones
• coherencia: foco, rts
• intencionalidad: e.intencional
• aceptabilidad: oyente
• informatividad: conocimientos del oyente (MU)
• situacionalidad: contexto
• intertextualidad: tipos de texto, textos que actúan como contextos de otros textos
• interactividad: interrupciones, comprobaciones, iniciativa mixta
• acciones gráficas
PLN Generación 18
Estrategias de estructuración del texto 1
• Dos aproximaciones:• Basadas en planificación
• Basadas en el uso de plantillas (Schema-based)
PLN Generación 19
Estrategias de estructuración del texto 2
• Schema-based Discourse Planning• Un esquema es un patrón que especifica cómo un plan
textual puede construirse a partir de esquemas más pequeños o mensajes atómicos y qué tipo de relaciones existen entre esos constituyentes
Inform-Next-Train-Schema Sequence( Message:NUMBER-OF-TRAINS-IN-PERIOD,
Next-Train-Information-Schema)
Next-Train-Information-Schema Elaboration( Message:IDENTITY,
Message:DEPARTURE)
PLN Generación 20
Estrategias de estructuración del texto 2
• Sistemas basados en planificación• El decidir qué acciones, locutivas o no, debe realizar el
sistema está directamente relacionado con la E. Intencional que éste posea.
• Una manera bastante natural de tomar esta decisión es mediante un sistema de planificación.
• diferentes sistemas de planificación• Discourse planning, Sentence planning
• Litman: sistema organizado en torno a dos planificadores, uno del dominio y otro del discurso
PLN Generación 21
Estrategias de estructuración del texto 3
Discourse PlanningEstructura y orden de los mensajes a comunicarEjemplo de Discourse Structure Tree (Reiter, Dale)
Root
NextTrainInformation
NUMBER_OF_TRAINS_IN_PERIOD IDENTITY DEPARTURE
SEQUENCE
ELABORATION
PLN Generación 22
Estrategias de estructuración del texto 4
• Sentence Aggregation• Agrupar los mensajes en oraciones, párrafos,
pasajes, etc.• Posibles estrategias:
• No agregar: cada mensaje se expresa con una oración.
• Combinar dos mensajes con una oración de relativo.
• Combinar dos mensajes con una conjunción.
• Formas variadas.
PLN Generación 23
Estrategias de estructuración del texto 5
LexicalizationElección de los content words que deben aparecer en el texto generado. No confundir con la selección léxica (lexical choice) de la generación táctica)
Sentence AggregationAgrupar los mensajes en oraciones, párrafos, pasajes, etc.
Expresiones referencialesSe trata de una tarea discriminante: el sistema debe comunicar la información suficiente para distinguir entre ellas las entidades del dominio pero no más.
PLN Generación 24
Estrategias de estructuración del texto 6
Orden linealdistinción si es preciso entre orden intra-oracional e inter-oracional.
SegmentaciónDivisión de la información en oraciones, párrafos, pasajes, turnos, ...
Centering:Referencia hacia adelante o hacia atrás a los focos de interés.Efecto en la pronominalizaciónEl <Topic> de una oración está relacionado con el <Theme> del texto completo. La <Salience> viene determinada por esta relación
PLN Generación 25
Estrategias de estructuración del texto 7
• Dos ejemplos de aproximaciones en las que la organización del texto a producir viene determinada por el modelo discursivo que se utilice• TEXT (K. McKeown)
• Teoría de la Estructura Retórica (RST).
PLN Generación 26
TEXT 1
La estructura del texto a generar se puede derivar de laestructura de textos previos a través de una colección de estrategiasque son aplicables en cada caso.
ESTRUCTURA DERIVADA DE TEXTOS PREVIOS
objetivos del discurso
definir un concepto,describir la información del mismocomparar dos conceptos
Cualquier objetivo estratégico deberá expresarse en términos deestos objetivos elementales
PLN Generación 27
TEXT 2
información relevante
objetivos del discurso
En función del tipo de objetivo el sistema es capaz de aplicar alguna de las estrategias que posee para construir una estructura de texto (e incluir en ella la información relevante) que satisfaga dicho objetivo
P.semánticos
P.estructurales
determinación de la relevancia
selección de la estrategia discursiva
estrategias discursivas aplicables:constituiridentificaratribuircomparar
PLN Generación 28
TEXT 3
• ejemplo: estrategia de constitución• Identificar el objeto como miembro de una clase
genérica (definir) o presentar información atributiva (describir).
• Presentar las componentes del objeto. • Presentar las características de cada componente. • Presentar la información atributiva o de analogía
sobre el objeto.
PLN Generación 29
TEXT 4
• Por supuesto para conseguir un objetivo se pueden emplear varias estrategias (lo que dará una mayor riqueza y variedad en los textos generados).
• así un objetivo (p.ej. definir) se puede alcanzar empleando varias estrategias (identificar, constituir)
• Las estrategias pueden presentar alternativas y, a través de activaciones recursivas de las mismas, producir textos complejos.
PLN Generación 30
RST 1 (Mann, Mathiessen y Thomson)
La propuesta indica que los elementos que forman el texto están relacionados por una serie de relaciones retóricas que le dan soporte. La idea básica es que el texto se puede organizar en unidades ("text spans"), que responden a los objetivos de los hablantes y que se ligan por dichas relaciones retóricas.
núcleosatélite
relación retórica
su misión es apoyar al núcleo
establece cómo se produce el apoyo
responde a un objetivo
25 relaciones retóricasesquemas mucho más pequeños que los de TEXT =>mayor variedad en la generación de los textos.
PLN Generación 31
RST 2
evidencia
afirmación
provocar
petición
capacitar
restricciones sobre el núcleo (afirmación): el oyente posiblemente no cree la afirmación
restricciones sobre el satélite (evidencia): el oyente cree la evidenciarestricciones sobre la combinación: comprendiendo la evidencia aumentará la creencia del oyente en la afirmaciónefecto: la creencia del oyente sobre la afirmación aumenta
PLN Generación 32
La Generación Táctica 1
• traducir a LN las estructuras producto de la generación estratégica.
• Aproximaciones• TEMPLATE-BASED
• NLG
• Híbridos
PLN Generación 33
La Generación Táctica 2
• tareas• La selección léxica (qué palabras utilizar)
• La selección sintáctica (cómo construir las frases, utilizando dichas palabras, de forma que se satisfagan las condiciones de la generación estratégica).
• factores:• El interlocutor
• El contexto
• La información pragmática
PLN Generación 34
Perkins, 89 Clasificación de los atributos
• patrones para preguntas, afirmaciones, negaciones y desconocimiento:• what is the length of block A in meters
• the length of block A is 27 meters
• the length of block A is not 27 meters
• the length of block A is unknown
• 16 tipos de atributos• of, who_of, of_value, is, is_value, is_verb_value, does,
who_does, what_does, has, has_value, object, who_object, split, can, how_well_can
PLN Generación 35
NLG en sistemas de diálogo
DialogManager
TextPlanner
SentencePlanner
RealiserProsodyAssigner
NLG
NLU
TTS
ASR
Rambow et al, 2002
PLN Generación 36
métodos estadísticos en generación
• Introducción de métodos estadísticos en varias tareas de NLG.
• Ejemplos:• SPoT, ATT sentence planner
• FERGUS surface realizer
• NLG1, NLG2, NLG3, NLG4, Ratnaparkhi, surface realizer
• CMU Communicator
PLN Generación 37
NLG estocástico
DialogManager
Generation ScoringSlot
Filling
Oh, Rudnicky, 2002
Candidateutterances
Bestutterance
Input Frame
TaggedCorpora
LanguageModel
Completeutterance
TTS
PLN Generación 38
SPoT sentence planner
• Entrada: text plan• Dos componentes:
• SPG y SPR
• SPG (Sentence Plan Generator) genera 12-20 sentence plans• generación aleatoria a partir de distribuciones de
probabilidad.
• SPR (Sentence Plan Ranker) los ordena• Uso de RankBoost
• Features dependientes e independientes del dominio
PLN Generación 39
FERGUS surface realizer 1
• Entrada: árbol de dependencia infraespecificado.
• Salida: la mejor realización superficial de acuerdo al modelo estadístico usado.
• 3 componentes• Tree Chooser
• Unraveler
• Linear Precedence Chooser
PLN Generación 40
FERGUS surface realizer 2
• Tree Chooser• usa un Stochastic Tree Model para asociar a cada nodo
del árbol de entrada un supertag (procedente de un TAG).
• Unraveler• crea un retículo de palabras correspondientes a todas las
ordenaciones posibles consistentes con el árbol decorado.
• Linear Precedence Chooser• obtiene el mejor camino asociado al retículo usando
como fuente de conocimiento un modelo de trigrama.