Un sistema de diàleg per accedir a la web en diferents llengües Marta Gatius
-
Upload
autumn-koch -
Category
Documents
-
view
26 -
download
0
description
Transcript of Un sistema de diàleg per accedir a la web en diferents llengües Marta Gatius
Un sistema de diàleg per accedir a la web en diferents llengüesMarta GatiusCentre de Recerca TALP, UPC
· Els grans reptes que presenta la web
· Comunicació en llenguatge natural
· Integració d’ontologies i tecnologies del llenguatge
· Conclusions
INDEX
· Documents heterogenis Llenguatges diferents Formats diferents Diferents representacions semàntiques
Diferents formes d’accés
· Dissenyat per a ser utilitzat per persones
· Canvis freqüents
ELS PROBLEMES PRINCIPALS QUE PRESENTA LA WEB
· L’usuari necessita ser guiat - per fer la consulta - per entendre la informació resultant· Assistents virtuals· Sistemes adaptatius
· Avantatges - Fàcil i amistós - Es poden fer consultes complexes - Es poden fer referències a altres entitas· Inconvenients - Ambigüitat - Poca eficiència - Elevat cost· Apropiat per usuaris ocasionals i per expressar operacions complexes en dominis restringits
COMUNICACIÓ EN LLENGUAGE NATURAL
· Avantatges - Fàcil i amistós - No és necessari utilitzar les mans - Petits aparells, aplicacions mòbils, discapacitats · Inconvenients - Problemes de reconeixement - Ambigüitat - Poca eficiència - Elevat cost· Apropiat per expressar operacions simples en dominis restringits
COMUNICACIÓ PER VEU
· Comunicació textual - Formularis - Menús - Pregunta/Resposta - Diàleg
· Domini restringit/obert· Multilingualitat· Multimodalitat
COMUNICACIÓ EN LLENGUAGE NATURAL
·Morfologia: Components de les paraules amb significat
portes és plural · Sintaxi: Relacions estructurals entre paraules
Una frase és una pregunta o una declaració
· Semàntica: Significat de les paraules i com es combinen obre la porta
· Pragmàtica: Com s’utilitza el llenguatge segons l’objectiu per ser educat
· Discurs: Com s’estructuren frases simples - Obre la porta - Ho sento, però no puc
CONEIXEMENT NECESSARI PER PROCESSAR LA INTERVENCIÓ DE L’USUARI
Interfície
Parser
Controlador de diàleg
GramàticaLèxic
Usuari
Ontologies
GIWEB:Generador de interfícies per accedir a la web
Wrapper1 Wrappern
Document1
Wrapper2
Document1 Documentn
Internet
· La majoria de sistemes de comunicació utilitzen recursos de domini restringit · Són més eficients
· S’han de desenvolupar per cada domini/aplicació
- Difícils de reutilitzar - Costosos de desenvolupar
RECURSOS DE DOMINI RESTRINGIT VERSUS RECURSOS GENERALS
EXPANSIÓ DE LA COBERTURA LINGÜÍSTICA
Templetes adaptades a tasques
Bona Pobre Difícil
Eficiència Cobertura Reusabilitat
Recursos general daptables a diferents aplicacions
Bona Rica Fàcil
Recursos generals Pobre Rica Fàcil
· Millora l’obtenció dels recursos més apropiats per dominis específics (o serveis)
· Facilita l’ús de més de una llengua
· Facilita la reusabilitat
ORGANIZACIÓ CORRECTE DEL CONEIXEMENT IMPLICAT EN LA COMUNICACIÓ
· Coneixement conceptual : Ontologies · Coneixement de domini· Coneixement de diàleg · Regles de diàleg controlant la iteracció· Coneixement lingüístic · Estructures lingüístiques expressant les tasques de comunicació
ELS DIFERENTS TIPUS DE CONEIXEMENT IMPLICATS EN LA COMUNICACIÓ
· Proporcionen un marc general per representar els conceptes de diferents serveis i pàgines de la web
· Xarxa semàntica (Semantic web)· Llenguatges estàndard per la representació de coneixement i per raonar
ONTOLOGIES PER A LA INTEGRACIÓ DE LA INFORMACIÓ DE DIFFERENTS PÀGINES WEB
· La informació que l’usuari necessita de l’aplicació· La informació que l’aplicació necessita de l’usuari· Conceptes descrits per un conjunt d’atributs · La comunicació consisteix en preguntar/donar a l’usuari els valors dels atributs dels conceptes
Diàlegs dirigits per l’aplicació
ONTOLOGIES PER DISSENYAR DIÀLEGS
AplicacióRecollida d’objectes
Informació Recollida
Objecte:Adreça:Telèfon:
Cancel.lació
ONTOLOGIES PER DISSENYAR DIÀLEGS
· Es generen a partir dels atributs dels conceptes a l’ontologia
· Els atributs descrivint conceptes es classifiquen segons una taxonomia sintàctico-semàntica d’atributs
OBTENCIÓ DELS MISSATGES DEL SISTEMA I DE LES GRAMÀTIQUES
· Generalització de les relacions entre
· Coneixement del domini a les ontologies i distincions lingüístiques· Cada classe es relaciona amb les estructures lingüístiques que expressen les operacions de consultar i omplir el valor dels atributs que pertanyen a la classe
LA TAXONOMIA SINTÀCTICO-SEMÀNTICA D’ATRIBUTS
· HOPS és un projecte de tres anys centrat en el desenvolupament d’una plataforma pública de veu i text que permeti l’accés dels ciutadans europeus a les seves administracions públiques més properes
· HOPS: Enabling an Intelligent Natural Language Based Hub for the Deployment of Advanced Semantically Enriched Multi-channel Mass-scale Online Public Services
EL PROJECTE HOPS
Tecnologies: Processament del llenguatge natural, portals Voice XML, Xarxa Semàntica Llenguatges: Anglès, Castellà, Català i Italià
EL PROJECTE HOPS
· Desenvolupament de sistemes de diàleg de veu fàcil i ràpid · Abstracció dels detalls de baix nivell
· Accés fàcil a dades i serveis d’internet
VOICEXML: UN ESTÀNDARD PER DIÀLEGS DE VEU
· Multilingualitat· Utilització de més d’un llenguatge en un diàleg
· Català i Castellà en una mateixa intervenció
· Per donar adreces: Plaza “Francesc Macià”
AVANTATGES DE VOICEXML
· Reutilització· Entre serveis
· Reutilització de subdiàlegs Noms, Adreces, Telèfons
· Entre llenguatgesEs fàcil adaptar el diàleg d’una llengua a una altre
AVANTATGES DE VOICEXML
· Una organització separada i reutilitzable dels diferents tipus de coneixement implicat en la comunicació millora · El procés de desenvolupament del sistema · La funcionalitat del sistema resultant
CONCLUSIONS
· La utilització d’ontologies facilita la obtenció dels recursos lingüístics més apropiats per un domini específic (o servei) en diferents llenguatges
· Els lexicons i les gramàtiques per expressar els conceptes de domini en diferents llenguatges
CONCLUSIONS
· La utilització d’ontologies proporciona un marc unificador · per processar text i/o veu en llenguatges diferents · per integrar informació de diferents documents web
CONCLUSIONS