Privada del Relox No. 16 “A” piso 5, Col. Chimalistac, Deleg. Álvaro Obregón, México D.F. 01070 Tel. (55) 50 04 21 22
MANUAL DE PRAAT
Preparado por: Ling. Héctor Hugo Rodríguez Toledo
Revisado por: Mtra. Rosa María Rojas Torres
Primera versión Enero 2013
Índice de contenido
Privada del Relox No. 16 “A” piso 5, Col. Chimalistac, Deleg. Álvaro Obregón, México D.F. 01070 Tel. (55) 50 04 21 22
I. Introducción……………………………………………………………….. 1
II. Instalación………………………………………………………………… 2
III. Abrir Praat………………………………………………………………….. 4
IV. Leer un sonido……………………………………………………………… 5
V. Abrir archivo extenso de audio……………………………………….. …. 6
VI. La segmentación Parte 1……………………………………………….. 7
VII. La segmentación Parte 2……………………………………………….. 10
VIII. La transcripción…………………………………………………………… 14
IX. Insertar símbolos fonéticos……………………………………………….. 15
X. ¿Dónde escuchar los sonidos del AFI? …………………………………. 18
Privada del Relox No. 16 “A” piso 5, Col. Chimalistac, Deleg. Álvaro Obregón, México D.F. 01070 Tel. (55) 50 04 21 22
XI. Guardar TextGrid………………………………………………………………. 20
XII. Extracción de audio con script……………………………………………… 22
ANEXO I. Etiquetas……………………………………………………………. 25
ANEXO II. Uso de Lenz…………………………………………………. 25
XIII. Dividir pistas extensas……………………………………………………. 12
XIV. Exportar selección…………………………………………………………. 15
1
MANUAL SINTETIZADO DE PRAAT
Praat (del holandés "hablar") es un software gratuito para el análisis acústico del
habla. Es un software libre, de código abierto, multiplataforma y gratuito. Fue
desarrollado en la Universidad de Amsterdam por Paul Boersma y David Weenink
a partir del año 1992.
I. INTRODUCCIÓN
Se trata de un software de amplios propósitos; en efecto, permite hacer análisis
acústico, síntesis articulatoria, procesamiento estadístico de los datos, edición y
manipulación de señales de audio, y un largo etcétera. Otra cualidad
interesantísima es que el usuario puede crear sus propias rutinas e incluso
añadirlas a los menús del programa.
Por tratarse de un programa especializado, no es la amabilidad de las interfaces
una de sus características; más bien, requiere un cierto adiestramiento y, mucha
información teórica. Por esta razón se ha escrito este manual orientado a facilitar
su uso a los investigadores que apoyan las labores de Documentación lingüística
del Instituto Nacional de Lenguas de Lenguas Indígenas (INALI), a través de la
Dirección de Investigación (DI) y del Archivo de Lenguas Indígenas Nacionales
(ALIN).
2
Este es un manual básico, en el que se presenta cómo hacer la instalación del
programa, abrir archivos de audio, crear textgrids, segmentar audio, crear
intervalos de transcripción en los distintos tiers, ingresar texto común y corriente
en los intervalos, ingresar símbolos Alfabeto Fonético Internacional (AFI) a los
intervalos utilizando Lenz, y guardar audio por ítem.
II. INSTALACIÓN
Praat, puede ser instalado en varios sistemas operativos, incluyendo Unix, Mac y
Microsoft Windows (en todas sus versiones).
1. Para hacerlo, tenemos que dirigirnos a la siguiente dirección
electrónica: http://www.fon.hum.uva.nl/praat/ o en su defecto podemos
dirigirnos al buscador de Google y escribir: Praat phonetics.
2. Una vez que nos encontramos en la página principal, encontraremos
una sección de Descarga/Download. Elegimos la versión para
Windows o podemos teclear en la barra de búsqueda la siguiente
dirección web que les llevara al enlace de descarga automáticamente
para el sistema operativo Windows:
http://www.fon.hum.uva.nl/praat/download_win.html
3
3. Una vez que estamos en la página web de Descarga/Download,
elegimos bajar el archivo comprimido que contiene el programa Praat
en su versión ejecutable con extensión (.exe). Recordemos que por ser
Windows la plataforma más difundida hemos optado por mostrar cómo se
realiza la instalación de esta forma.
4. Como vemos en la imagen, la última versión revisada en Enero de 2013, es
la 5.3.39, y existen para sistemas de 32 y 64-bits, (aquí no nos
detendremos a dar mayor detalle, únicamente mencionamos que tiene que
ver con el hardware de su computadora y la memoria RAM). Elegimos la
versión de 32-bits titulada: praat5339_win32.zip (que sirve para
cualquier computadora estándar actual). Al dar clic, elegimos la
opción de Guardar archivo y damos clic en Aceptar.
4
5. Abrimos el archivo encriptado con extensión (.zip) y extraemos el
contenido en una ubicación deseada, que pude ser por ejemplo, el
Escritorio.
III. ABRIR PRAAT
Damos doble clic sobre el icono de Praat que es la imagen que simula a
una boca y una oreja debajo. Inmediatamente nos desplegara un par de
pantallas llamadas “Praat Objects y “Praat Picture”, y si logramos verlas en
nuestra pantalla, enhorabuena, podemos empezar a usar el programa.
5
IV. LEER UN SONIDO
Nota: Antes de ver los pasos para abrir un sonido, podemos cerrar la pantalla de
Praat Picture, ya que no la necesitaremos.
1. Usted puede leer un archivo de sonido existente desde su disco duro.
Con Read from file desde el menú Open. Praat le brinda la posibilidad
de leer extensiones estándares de sonido como, por ejemplo, la
extensión (.wav). A continuación, se abre una ventana que permite
navegar por el disco duro de su computadora y seleccionar el
fichero/carpeta que contiene el audio que desee.
2. A continuación, el archivo seleccionado se mostrará como un objeto
en la ventana administrativa (Object window). Para estos efectos, si
usted abre el archivo ejemplo.wav, un objeto denominado “Sound
ejemplo” se asignará en la lista.
6
Nota: Nosotros abrimos un sonido denominado: abeja_esa_bizu_ca que en Object
window aparece como Sound abeja_esa_bizu_ca. Esto lo puede ver en la imagen
siguiente:
Ejemplo de audio listo para usarse en Praat
V. ABRIR ARCHIVO EXTENSO DE AUDIO
1. Si el audio con el que se desea trabajar tiene una duración demasiado
elevada y Praat no puede almacenarlo en la memoria temporal, puede
abrirse con la opción Open long sound file... en el menú Read.
7
Nota: Debe tenerse en cuenta que el tamaño máximo de un fichero que puede
abrirse con Praat es de 2 Gigabytes.
VI. LA SEGMENTACIÓN PARTE I
1. Crearemos un archivo (.TextGrid), con la finalidad de segmentar y
después transcribir en distintos niveles el texto que deseamos.
Entonces, una vez abierto el fichero que se desea etiquetar, se
selecciona este fichero en la ventana Objects y se elige el menú
Annotate y se da clic en la opción To TextGrid….
2. Aparecerá el recuadro correspondiente a All tier names donde se
escriben los nombres de los niveles en que desee transcribir el
corpus.
8
3. Substituya el texto “Mary John bell” que aparece por defecto.
Utilisaremos cuatro lineas de transcripción correspondientes a la
Transcripción fonética (TF), Transcripción ortográfica (TO), Glosa
español (GE) y Etiquetado (ET). Así escribiremos las abreviaturas
propuesta, es importante que cuando las escribia no use comas sólo
espacios en blanco como se muestra en imagen y borre el contenido
del recuadro Which of these are point tiers?, que por el momento no
usaremos.
4. A continuación, se selecciona conjuntamente el elemento Sound que
contiene el sonido con el objeto TextGrid y se elige la opción View &
Edit en el menú de la derecha.
9
5. Si realizamos los pasos anteriores correctamente, nos aparecerá una
ventana, con los niveles de transcripción definidos antes, en los
cuales podemos segmentar y anotar texto.
Nota: Para reproducir la grabación, damos un clic donde dice Visible part (esto
quiere decir que se escuchara la parte visible del oscilograma), lo que haremos
enseguida es mostrar cómo se hace un zoom para poder inicar los intervalos a
anotar, es decir, la segmentación del audio. Recordemos que debemos identificar
emisiones completas. Por ejemplo en el oscilograma, el inicio del audio es una
línea recta al igual que donde existe una ausencia de sonido, es sencillo identificar
palabras completas ya que al oir y ver la imagen de ondas distinguimos las
pausas.
10
Para visualizar mejor, damos clic en “in”, icono ubicado en la parte inferior
izquierda de la pantalla, ajustando con “out”, hasta que ajustemos la imagen como
deseamos, tomando encuenta las cuestiones anteriores. Además no es de
preocuparse que en algunas computadoras se visualice mejor que en otras, esto
es debido a la resolución de su pantalla.
Vemos que la parte visible ya no es la de la duración total del audio, y para
desplazarnos, usamos justamente la “barra de desplazamiento”.
VII. LA SEGMENTACIÓN PARTE II
1. Primero debe poner el cursor en el nivel/línea donde se desea marcar
el segmento, esta se activara en un color amarillo.
En este ejemplo se activo la línea 2 correspondiente a la Transcripción
ortográfica y se visualiza el icono de mano señalándola.
11
2. Posiciona el cursor sobre la secuencia de sonido, al situar el cursor en
el lugar donde se desea segmentar, aparece una línea vertical gris y
unos puntos, en cada uno de los niveles de etiquetado.
3. Dar un clic sobre el punto, y así se fija la primera frontera del
segmento que se desea, que aparece en color rojo.
12
4. Aún estando activados los puntos en cada una de los niveles, continúe
marcándolos hasta que se haga una solo línea de color azul, esto nos srive
para que cada nivel este alineado al sonido y podamos ingresar texto en el
mismo segmento.
5. Con el mismo procedimiento se introducen las marcas de
segmentación del fin de la emisión que se deseen en cada nivel.
IMPORTATE: De las emisiones que responda su colaborador, debe
seleccionar “la mejor” de ellas.
En la imagen de abajo, note que ahora nos podemos posicionar dentro del
corte y que la emisión corresponde a una sola palabra (puede hacerlo al ver
el oscilograma que aparece de inicio con una línea recta, seguido de ondas,
y termina con línea).
13
Nota: Puede desplazarse entre los segmentos seleccionándolos, usando menú
Interval y Boundary (con los que puede editarlos) Y usando las teclas Alt +
Flechas del cursos (adelante, atrás, arriba, abajo). Si se equivoca y es necesario
eliminar un segmento marcado, debe ir a Boundary>Remove, o con la
combinación de las teclas Alt y Retroceso (Alt+←).
14
VIII. LA TRANSCRIPCIÓN
Si hemos terminado con los pasos anteriores, podemos proceder a introducir
texto, es decir, a transcribir. Para ello, sigamos los pasos siguientes:
1. Seleccione el corte/segmento que desea transcribir, al hacerlo se
activara con un color amarillo entre dos marcas de segmentación y
podrá introducir el texto en la ventana superior, se percatara que el
cursor comienza a parpadear. (También se muestra el texto, en la
línea).
Nota: Para introducir símbolos fonéticos debe tenerse instalada la fuente Charis
SIL que puede obtenerse desde la página de descarga de Praat:
http://www.fon.hum.uva.nl/praat/CharisSIL-4.110.zip o desde la página de SIL
International: http://scripts.sil.org/CharisSILfont. Los links son directos y una vez
que se descargue debe ejecutar el archivo y dar clic en instalar.
15
En la primera línea usted usara, el Alfabeto Fonético Internacional (AFI), en la
segunda línea o nivel, el Alfabeto Practico de su lengua, en la tercera, la glosa en
español (traducción) y en la cuarta la etiqueta (que les proporcionará el equipo que
coordina el proyecto). Para mayor información sobre la etiqueta vea el Anexo I.
IX. INSERTAR SÍMBOLOS FONÉTICOS
Mostraremos como deben utilizarse las convenciones descritas en los apartados
“Phonetic symbols: consonants”, “Phonetic symbols: vowels” y “Phonetic symbols:
diacritics” del manual de ayuda que se encuentra en el menú Help. Además en el
Anexo II se muestra el uso de un remapeador del teclado para fuentes AFI
llamado Lenz.
1. Nos dirigimos a la derecha de la ventana donde aparece el menú Help,
en el se encuentra un acceso directo a las tablas de símbolos
fonéticos dentro del menú Phonetic symbols.
2. Una vez que dimos clic, se abre la página correspondiente del manual
y se puede seleccionar una de las tres tablas de símbolos: “Phonetic
symbols: consonants”, “Phonetic symbols: vowels” o “Phonetic
symbols: diacritics”, correspondientes a consonantes, vocales y
diacríticos.
16
3. Al elegir lo que deseamos, aparecerán tablas con la combinación que
debe teclearse para obtener el símbolo fonético deseado.
Nota: Podemos imprimir el contenido de las tablas o guardarlas en un formato
Html (pagina web) para visualizarlos más rápido, esto se hace en el menú File.
17
4. Como vimos, debemos ir a la ventana superior para ingresar el texto y
teclear como aparece en las tablas. Por ejemplo, si tecleamos la
combinación \zh, se obtiene el símbolo correspondiente a la fricativa
postalveolar sonora [ʒ].
5. Ahora, y una vez que se inserto la transcripción en las dos primeras
líneas, ahora iremos a la línea tres e introduciremos la Glosa en
español, es decir la traducción.
18
6. En la siguiente línea (la cuarta), se debe escribir la etiqueta que se le
asignará a ese ítem. En este ejemplo, es hipotético (debe ver el Anexo I,
para poder tener un panorama más amplio, además de la información que
les dará el equipo del INALI).
X. ¿DONDE ESCUCHAR LOS SONIDOS DEL AFI?
El Alfabeto Fonético Internacional (AFI), es un sistema de anotación fonética
creado por lingüistas. Su propósito es otorgar en forma regularizada, precisa y
única la representación de los sonidos de cualquier lenguaje oral.
Debido a que existen diversos sonidos distintos al español en las lenguas
indígenas y a que no todo mundo está entrenado en fonética, hemos pensado que
es importante tener a la mano el audio para poder familiarizarnos con los sonidos
de cada grafía que se representa en el AFI.
19
A continuación ponernos algunas ligas donde puede hacerlo, estando conectado a
internet:
http://www.phonetics.ucla.edu/course/chapter1/consonants1.html
http://web.uvic.ca/ling/resources/ipa/charts/IPAlab/IPAlab.htm
Además les mostramos como poder bajar la aplicación titulada IPA Help, para ser
instalada en su computadora y podrán recurrir a esta cuando deseen.
1. Dirigirse a esta página web:
http://www.sil.org/computing/ipahelp/ipahelp_download.htm
20
2. Cuando se encuentre en ella, dirigirse a la sección Download y de clic en el
link IPA Help que está en azul.
3. Al terminar de bajar SIL_IPA_2_1.exe, sólo de doble clic e instale.
4. Una vez descargado, diríjase a la carpeta donde lo guardó y de doble clic.
5. Se creara una carpeta llamada SIL_IPA_2_1, dentro esta un archivo
llamado Setup, ejecútelo (dando doble clic) y siga los pasos de instalación.
6. Al terminar, se creara un acceso directo del programa en el Escritorio
, ábralo y usted ya podrá escuchar y ver la grafías del AFI.
21
XI. GUARDAR TEXTGRID
1. Terminando la anotación
cerramos la ventana, y nos
dirigimos a la ventana de
objetos (Praat Objects), se
selecciona únicamente el
TextGrid y se guarda dando
clic en Save, después Save
as text file...
2. Al aparecer la ventana, tendremos que elegir la ruta donde queremos
guardar el archivo, que de preferencia será en la misma carpeta donde se
encuentra nuestro archivo de audio. Después sólo damos clic en guardar,
y el archivo se salva con una extensión (.TextGrid) que después podemos
abrir en Praat. (El programa no tiene la función de autoguardado, por eso
es importante hacerlo manualmente).
22
XII. EXTRACCIÓN DE AUDIO CON SCRIPT
EL script que les proporcianamos, se llama: extraer_audio_en_wav.praat y es el
mismo que “Save intervals to small WAV sound files”, realizado por Mietta Lennes
© 8.3.2002.
Básicamente, le permite realizar una tarea rutinaria que consiste en extraer el
audio de los segmentos anotados con las etiquetas de sus ítems usando la
formula que les proporciona el Archivo Nacional de Lenguas Indígenas del Instituto
Nacional de Lenguas Indígenas a través de la Dirección de Investigación.
Los archivos automáticamente llevaran el nombre de la etiqueta y se guardaran en
formato (.wav) y se guardan en la siguiente ruta: C/audios/.
Nota: Debe abrir el archivo de sonido (.wav) como Long Sound File desde el menú
Open. Además el LongSound y el archivo Sound, debe tener el mismo nombre
(idéntico).
1. Debe crear una carpeta en el disco duro de su computadora desde la
unidad C, y nombrarla “audios”.
2.- Abra su audio como Long Sound File…, (vea el apartado V)
3. Abra su TextGrid previamente guardado (para más detalle vea el apartado
XI).
23
4. Selecciones ambos elementos en la pantalla de Objetos. Y después vaya a
Praat, Open Praat script:
6. De preferencia guarde el archivo del script en el Escritorio, entonces,
vaya ahí y Selecciónelo.
24
7. Una vez abierto, vera esta pantalla.
8. Presione Ctrl+R o vaya a Run>Run. Cuando aparezca esta pantalla,
solo de clic en OK y se hará la tarea automáticamente, después vaya a
la carpeta C:/audios en su disco duro y ahí estarán sus audios
cortados.
25
ANEXO I. ETIQUETAS La fórmula que usaremos funciona de esta forma: Código CLIN- Numero de Entidad Federativa-Número de Comunidad Estudiada -
Sexo del Hablante-Siglas del Investigador –Abreviatura de Lista _Número de dato
(ítem, narración, etc.).
Ejemplo en náhuatl:
Y05-21-2-H-HHRT-Y-001
En este caso Y05, corresponde al código propuesto el Centro de Documentación del INALI como política de Catalogación, adaptada del sistema de Dewey Decimal. Y= Familia lingüística (Yuto-nahua) 05= Agrupación lingüística (náhuatl) Después el numero 21, corresponde al estado de Puebla Seguido del guión, el 2, es el numero de la comunidad que estudia el investigador, en este caso es la segunda. H= Hombre, M=Mujer, en general se piden datos de dos hombres y dos mujeres, se pide nombrar H1 y H2 o M1 y M2, según sea el caso HHRT= Siglas de Héctor Hugo Rodríguez Toledo La Y, corresponde a la lista (cedula) que uso, en este caso es la de Yolanda Lastra. 001, corresponde a el numero de ítem, que es agua, porque en la lista es la primera palabra a elicitar. Esta etiqueta nos servirá para poder identificar cada segmento y poder extraerlo como un audio único, y nos quedara algo así: Y05-21-2-H-HHRT-Y-001.wav.
26
ANEXO II. USO DE LENZ
Lenz es una aplicación que únicamente se puede ejecutar en un ambiente
Windows, es gratuita y fue desarrollada por el Dr. Scott Sadowsky, de la
Universidad de La Frontera-Temuco, Chile. La aplicación es compatible con
cualquier otro que soporte el estándar de escritura virtual Unicode, entre ellos
Praat, y también la paquetería de Office, ELAN y muchos más. Se puede utilizar
casi con cualquier otro software que use el sistema operativo Windows.
1. Para usar la aplicación, es necesario tener instalada la fuente Charis
SIL y/o Doulos SIL. Para utilizar Lenz, sólo hay que bajar el archivo
(.zip) de la siguiente dirección: http://sadowsky.cl/files/lenz/1.3/Lenz-
Esp.zip, guardarlo, descomprimirlo.
2. Una vez que extraemos el contenido vemos que hay tres archivos, uno
es la aplicación, y los otros son las tablas con las combinaciones que
debemos usar para insertar el símbolo del AFI.
27
3. Ejecutamos (dando doble clic) el archivo “Lenz-Esp.exe” que contiene
la capeta. Aparecerá un ícono verde en la barra de íconos de
Windows; esto señala que el programa está funcionando, y permite, a
través de un clic del botón derecho, suspenderlo o cerrarlo en
cualquier momento. Al mismo tiempo se nos desplegara en pantalla el
siguiente mensaje:
Como se indica, presionando las teclas +H puede ver el mapa del teclado.
En la imagen de abajo, se muestra que Lenz está funcionando, y para usar el
teclado común, debe cerrarlo dando clic derecho e indicar Exit.
Cuando Lenz está cargado, las teclas normales producen los caracteres de
siempre. Las teclas modificadoras CTRL, ALT, CTRL+ALT, CTRL+SHIFT y
ALT+SHIFT, en combinación con las normales, generan los símbolos AFI. El
gráfico que figura al final de esta página indica dónde en el teclado se encuentran
los distintos símbolos fonéticos. Así, por ejemplo, schwa [ə] se produce con la
28
combinación CTRL+e, esh [ʃ] se produce con ALT+s y el símbolo de aspirado [ʰ]
se genera con la combinación ALT+SHIFT+h.
Nota: El programa está diseñado para el teclado español en el cual @ se produce
con AltGr+2 y las llaves {} se encuentran en la misma fila que ASDF. Funciona con
otros teclados, pero no todos los símbolos se producen con las mismas teclas. La
imagen muestra la función de teclas.
Además, recomendamos imprimir la imagen y que esta sea a color, tenerla a la
mano para que sea más sencillo poder escribir los símbolos.
En el mismo ejemplo, que usamos anteriormente, ahora en lugar de tener que ir al
menú Help y seguir los pasos descritos, únicamente presionamos la combinación
de teclas: Alt+d, lo que nos como resultado /ʤ/. (No necesitamos recurrir a la
combinación \zh).
29