Busca:   en:
Inicio > Revista

Caracterización fonética del bilingüismo, análisis acústico del habla espontánea y evaluación de sistemas de síntesis del habla.(Parte 2/3)

Las líneas de investigación en fonética experimental que actualmente se desarrollan en el Departamento de Filología Española de la Universidad Autónoma de Barcelona, en el marco del Laboratorio de Fonética de la misma universidad, pueden encuadrarse en los siguientes ámbitos : la caracterización fonética del bilingüismo, el análisis acústico del habla espontánea y la evaluación fonética de los sistemas de síntesis del habla.
Joaquim Llisterri | 30/06/2002
2. Análisis acústico del habla espontánea


El análisis y descripción del habla contínua no es una línea de investigación nueva dentro de la fonética, pues hace ya algunos años se vienen publicando trabajos que estudian aspectos tales como la influencia de la velocidad de elocución sobre la duración de los sonidos, la naturaleza y función de las pausas en el habla, lo que se podría denominar las "unidades de procesamiento"de la información, etc. Lo que sí supone una novedad y una aportación es el estudio sistemático de los fenómenos que se producen en el habla espontánea y su reducción a una serie de reglas que permitan predecir la variabilidad.

Ha sido desde el punto de vista de las aplicaciones, y en concreto de la síntesis y el reconocimiento del habla, desde donde se ha planteado la necesidad de un nuevo enfoque descriptivo: un sistema de reconocimiento, por ejemplo, debiera ser capaz de identificar como pertenecientes a la misma categoría las diversas ondas sonoras que corresponden a distintas realizaciones de un mismo sonido y que sabemos son diferentes. En muchos casos, los sistemas de reconocimiento no consiguen establecer esta identidad con lo que su rendimiento se ve disminuido. El problema de base es cómo relacionar una serie de entidades o unidades fonológicas (que utilizamos para caracterizar los sonidos del habla y su estructura) con los datos que nos proporcionan los análisis de los movimientos articulatorios, las ondas sonoras o el comportamiento de la percepción. Las entidades fonológicas suponen la existencia de elementos invariantes y en cambio los datos "físicos" nos indican la existencia de un alto grado de variación.

Ahora bien, el hecho de que la comunicación se produzca nos indica que debe existir una estrecha relación entre ambos aspectos. En un intento de determinar por qué no se ha resuelto hasta ahora el problema de la invariación, Lindblom (1987) se pregunta dónde se ha buscado hasta ahora, es decir, qué tipo de material se ha estudiado para determinar los elementos invariables del acto de comunicación. A partir del vaciado de los artículos contenidos en una serie de las más importantes revistas de fonética experimental (como JASA o Journal of Phonetics) se pone de manifiesto que para la descripción del habla se ha utilizado únicamente material "de laboratorio", es decir, sílabas, palabras aisladas o palabras contenidas en "frases marco". Este tipo de habla permite controlar buena parte de los factores que intervienen en un experimento, mientras que establecer un protocolo experimental que permita controlar el habla real presenta mayores dificultades; por otra parte, algunos fonetistas defienden que el estudio del material "de laboratorio"es el primer paso en la solución del problema de la invariación siendo el caso del habla espontánea tan sólo un tipo más complejo de habla.

El estudio del acto de comunicación pone claramente de manifiesto que en el habla se dan diversos estilos y que todos los hablantes somos capaces de cambiar nuestro "modo de hablar"y de flexibilizar al máximo nuestras realizaciones en función del contexto, de los interlocutores, de las reglas sociales, etc. Estas "modificaciones" se efectúan, por supuesto, sobre la señal sonora y ejercen fuertes influencias sobre el modo de considerar la cuestión de la invariación. Lindblom (1984) formula teóricamente estos problemas al demostrar que el proceso del habla es de naturaleza teleológica: tiene una finalidad (que la comunicación efectivamente se produzca), es plástico (las realizaciones de los distintos sonidos se adaptan a las diversas situaciones de comunicación) y es económico (se tiende a realizar siempre el mínimo esfuerzo posible). Para este autor, la finalidad, entendida como el hecho de que la comunicación se produzca o no, es lo que determina las características de las ondas sonoras realizadas (con sus reducciones, modificaciones, adaptaciones, etc.), así como los movimientos articulatorios necesarios para su producción. De esto se desprende, por tanto, que los factores "independientes"de la señal (sociales, situacionales, etc.) tienen tanta importancia en el estudio del habla como los "dependientes"de la señal (los movimientos articulatorios o las ondas sonoras). Lo más importante, pues, en todo acto de comunicación es la interacción entre hablante y oyente, pues el hablante es capaz de variar su output en función de distintos factores (Lindblom 1990).

El habla "de laboratorio" encaja difícilmente en este esquema, pues en ella los factores "independientes de la señal"no son suficientemente tomados en consideración, es decir, se los toma en cuenta para aislarlos pero no como un elemento que intervenga decisivamente en el proceso de comunicación. Por ello, los resultados obtenidos de su análisis no corresponden totalmente al análisis del habla espontánea y las aplicaciones tecnológicas sobre habla real plantean problemas a la hora de utilizarlas con bases de datos proporcionados por habla "de laboratorio".

Si se acepta la hipótesis de Lindblom como "estrategia"de comunicación, es posible resolver el problema de la invariación: no existe una invariación absoluta sino que se trata de un problema ecológico: lo invariante es distinto cada vez y se adapta (= ecología) a la situación (= entorno). Lindblom (1987) propone el concepto de variabilidad adaptativa para referirse a esta cuestión. Esta concepción explica, además, por qué hasta ahora no se ha llegado a resultados definitivos en la búsqueda de la invariación: tomada en sentido estricto la concepción tradicional de invariación contiene una idea del habla como no-adaptativa a las diferentes situaciones.

Se puede así hablar de diversos "estilos de habla" capaces de hacer variar las características de los sonidos cuyos valores de frecuencias y duraciones se ven modificados según el tipo de corpus utilizado para el análisis. La descripción del habla, vista desde esta perspectiva, se plantea, por tanto, la descripción de las transformaciones fonéticas y fonológicas que se producen sistemáticamente en función de los diversos "estilos"de modo que se pueda llegar a la formulación de un algoritmo que permita aplicar, a partir de la especificación acústica de una palabra de referencia, las transformaciones necesarias requeridas por cada contexto concreto. Los datos obtenidos en la descripción servirán, como se desprende de lo expuesto hasta ahora, para mejorar las aplicaciones tecnológicas.

De entre los trabajos realizados en el Departamento de Filología Española de la UAB en esta perspectiva de análisis, cabe destacar el estudio de la coarticulación en las consonantes oclusivas comparando habla "de laboratorio" y habla espontánea (Poch et al. 1989). El corpus de habla espontánea procede de una conversación informal y el de habla "de laboratorio" está constituido por las mismas palabras analizadas en habla espontánea pero leídas, esta vez, en forma de lista por el mismo informante. Como procedimiento de comparación se ha utilizado la "ecuación del locus"(Krull 1987) que permite relacionar los valores de frecuencias del inicio y el centro de los formantes, en este caso del F2 de las vocales situadas junto a consonantes oclusivas. Los resultados ponen de manifiesto que el grado de coarticulación es mucho mayor en habla espontánea que en habla de laboratorio, es decir, que la diferencia entre el inicio y el centro del segundo formante es considerablemente menor en habla espontánea que en habla de laboratorio.

El análisis de vocales iguales en contacto (Benesey y Machuca 1989) extraídas de una conversación espontánea ha permitido poner de manifiesto tres tipos básicos de comportamiento de estos sonidos: la reducción a una sola vocal cuya duración es similar a la de las vocales que no han sufrido este proceso; la reducción "parcial", es decir, la presencia de una vocal alargada y el mantenimiento de dos vocales iguales. La aparición de cada uno de estos comportamientos está condicionada por las necesidades comunicativas y se han establecido una serie de reglas que predicen el grado de reducción.

Igualmente se ha estudiado el comportamiento de vocales diferentes en contacto (Aguilar 1991a) comparando esta vez las extraídas de una conversación informal con las obtenidas a partir de la lectura de un texto. También en este caso se detectan distintos grados de reducción y mantenimiento de diferencias entre las vocales en contacto y también un comportamiento diferente según el tipo de corpus del que se han extraído.

La comparación entre las consonantes nasales en habla espontánea y en habla "de laboratorio" (Machuca 1991), de las vibrantes (de la Mota 1991) y de las aproximantes (Aguilar y Andreu 1991) en las mismas condiciones ha puesto asimismo de manifiesto las modificaciones sufridas por estas clases de sonidos en función del estilo de habla.
Finalmente, el estudio del sistema vocálico del español también en habla espontánea y en habla "de laboratorio"(Harmegnies y Poch 1991) a partir del análisis acústico de quinientas vocales de cada uno de los dos estilos, muestra una importante "desorganización" del espacio vocálico en habla espontánea. La modificación afecta los valores de frecuencia de los formantes que son más centralizados en el habla espontánea, así como más variables, de tal forma que las áreas de dispersión son mucho menos claras en habla espontánea que en habla de laboratorio. Estas modificaciones en la organización del sistema vocálico pueden ser consideradas como diferentes grados de entropía que presenta dicho sistema en función del estilo de habla considerado conservando, no obstante, los rasgos imprescindibles para facilitar la identificación de las distintas unidades pues si la entropía llegara a un punto en que se confundieran los elementos el sistema como tal dejaría de existir.

Este artículo consta de tres partes
Caracterización fonética del bilingüismo Análisis acústico del habla espontáneaLa evaluación de los sistemas de síntesis del habla

 

Referencias

CARAMAZZA, A.- YENI-KOMSHIAN,G.- ZURIFF, E.- CARBONE, E. (1973) "The Acquisition of a New Phonological Contrast: The Case of Stop Consonants in French-English Bilinguals", Journal of the Acoustical Society of America 54, 2: 421-428.
CARBONELL, J.F. (1991) Adaptación castellana del Fast Diagnostic Test (FDT). Universidad Autónoma de Barcelona, Departamento de Filología Española. ms no publicado.
CARLSON, R.- GRANSTRÖM, B. (1990) "An environment for multilingual text-to-speech development ", Proceedings of the ESCA Tutorial Day and Research Workshop on Speech Synthesis. Autrans, France, 25-28 September 1990. pp. 73-82.
CONEJO, J.M.- VAN COILE, B. (1991) : Desarrollo de un conversor de texto a voz en español dentro de una arquitectura multilingüe", Comunicación presentada en el VII Congreso de la SEPLN, Valencia, 3-4 de octubre de 1991.
CHAMOT, A.U. (1973) "Phonological Problems in Learning English as a Third Language", International Review of Applied Linguistics IRAL 11, 3: 243-250.
DE LA MOTA, C. (1991) "A study of [r] and [] in spontaneous speech", Actes du XIIème Congrès International des Sciences Phonétiques. 19-24 août 1991, Aix-en-Provence, France. Aix-en-Provence: Université de Provence, Service des Publications. Vol 4. pp. 386-389.
EGAN, J.P. (1948) "Articulation Testing Methods", Laryngoscope 58: 955-991 ESCA (1989) Proceedings of the ESCA Tutorial Day and Workshop on Speech Input/Output Assessment and Speech Databases. Noordwijkerhout, the Netherlands, 20-23 September 1989.
FAIRBANKS, G. (1958) "Test of Phonemic Differentiation: The Rhyme Test ", Journal of the Acoustical Society of America 30,7: 596-600.
FLEGE, J.E. (1987 a) "The Instrumental Study of L2 Speech Production : Some Methodological Considerations", Language Learning 37,2: 285-296.
FLEGE, J.E. (1987 b) "The production of 'new' and 'similar' phones in a foreign language: evidence for the effect of equivalence classification", Journal of Phonetics 15: 47-65.
FLEGE, J.E.- BOHN, O, (1989) "An Instrumental Study of Vowel Reduction and Stress Placement in Spanish-Accented English ", Studies in Second Language Acquisition 11,1: 35-62.
FLEGE, J.E.- EEFTING, W. (1987) "Production and perception of English stops by native Spanish speakers", Journal of Phonetics 15: 67-83.
GERWEN, R.P.M.W. van - VIEREGGE, W.H.- KERKHOF, M.P.A.M. (1989) "Evaluation of an automatic text-to-speech conversion system for Spanish ", Proceedings of the ESCA Tutorial Day and Workshop on Speech Input/Output Assessment and Speech Databases. Noordwijkerhout, the Netherlands, 20-23 September 1989. pp. 3.5.1.- 3.5.4.
GRANSTRÖM, B. - NORD, L. (1991) "Ways of exploring speaker characteristics and speaking styles ", Actes du XIIème Congrès International des Sciences Phonétiques. 19-24 août 1991, Aix-en-Provence, France. Aix-en-Provence: Université de Provence, Service des Publications. Vol 4. pp. 278-281.
HARLAND,G. - FOURCIN, A.- BARRY, W.J. - GRICE, M. (Comps) (1989) Esprit Project 1541 (SAM) Multilingual Speech Input/Output: Assessment, Methodology and Standardisation. Extension Phase. Final Report. London: University College London.
HARMEGNIES, B. (1988) Contribution à la caractérisation de la qualité vocale: analyses plurielles de spectres moyens à long terme de parole. Thèse de doctorat. Mons: Université de Mons.
HARMEGNIES, B.- BRUYNINCKX, M.- LLISTERRI, J.;- POCH, D. (1989) "Effects of language change on voice quality. An experimental contribution to the study of the Catalan-Castilian case", in TUBACH, J.P.- MARIANI, J.J. (Eds) Eurospeech 89. European Conference on Speech Communication and Technology, Paris, September 1989. Edinburgh: CEP Consultants Ltd., 1989. vol 2 pp. 489-492.
HARMEGNIES, B.- LANDERCY, A. (1985) "Language features in the long-term average spectrum", Revue de Phonétique Appliquée 73-75:69-80.
HARMEGNIES, B.- LANDERCY, A,- BRUYNINCKX, M. (1987) "An experiment in inter-languages speaker recognition using the SDDD index ", Proceedings of the XIth ICPhS. The Eleventh International Congress of Phonetic Sciences. Estonia: Academy of Sciences of the Estonian SSR, 1987. Vol 2. pp. 241-244.
HARMEGNIES, B. - POCH, D. (1991) "Some aspects of vowel reduction in Spanish spontaneous speech", Proceedings of the ESCA Workshop on ' Phonetics and Phonology of Speaking Styles'. Barcelona, 30 September - 2 October 1991.
HOUSE, A.S.- WILLIAMS, C.E.- HECKER, M.H.L.- KRYTER, K.D. (1965) "Articulation-Testing Methods: Consonantal Differentiation with a Closed-Response Set", Journal of the Acoustical Society of America 37,1: 158-166.
KRULL, D. (1987) "Second formant locus patterns as a measure of consonant-vowel coarticulation", PERILUS 5:43-61.
LINDBLOM, B. (1984) "On the teleological nature of speech processes", Speech Communication 2, 2/3: 155-158.
LINDBLOM, B. (1987) "Phonetic invariance an the adaptive nature of speech", Conferencia presentada en el simposio 'Working Models of Human Perception', Instituut voor Perceptie Onderzoek, Einhoven, August 26-28, 1987. ms no publicado.
LINDBLOM, B. (1990) "Explaining phonetic variation: A sketch of the H and H theory ", in HARDCASTLE, W.J.- MARCHAL, A. (Eds) Speech Production and Speech Modelling. Dordrecht: Kluwer Academic Publishers (NATO ASI Series, Behavioural and Social Sciences, 55) pp. 403-440.
LOMAN, H.- VAN BEZOOIJEN, R. (1988) "Evaluation of Dutch rule synthesis consonants by means of a fast diagnostic test ", AFN - Proceedings, University of Nijmegen 12 : 57-72.
LLISTERRI, J.- MARTINEZ DAUDÉN, G. (1990) "Phonetic interference in bilingual speakers learning a third language: the production of lateral consonants "Comunicación presentada en el 9th World Congress of Applied Linguistics, Tesalónica, Grecia, 12-21 de abril de 1990.
LLISTERRI, J.- MARTíNEZ DAUDÉN, G. (1991) "Lateral consonant production in bilingual speakers learning a third language", Actes du XIIème Congrès International des Sciences Phonétiques. 19-24 août 1991, Aix-en-Provence, France. Aix-en-Provence: Université de Provence, Service des Publications. Vol 2 . pp. 318-321.
LLISTERRI, J.- POCH, D. (1986) "Influence de la L1 (catalan) et de la L2 (castillan) sur l'apprentissage du système phonologique d'une troisième langue (français)", Actas de las IX Jornadas Pedagógicas sobre la enseñanza del francés en España. Barcelona: Institut de Ciències de l'Educació, Universitat Autònoma de Barcelona. pp. 153-167.
LLISTERRI, J.- POCH, D. (1987a) "Les réalisations sonores dans l'apprentissage d'une troisième langue par des bilingues", Revue de Phonétique Appliquée 82-83-84:209-219.
LLISTERRI, J.- POCH, D. (1987b) "Phonetic Interference in Bilingual's Learning of a Third Language", Proceedings of the XIth ICPhS. The Eleventh International Congress of Phonetic Sciences. Estonia: Academy of Sciences of the Estonian SSR, 1987. Volume 5. pp.134-137.
LLISTERRI, J.- POCH, D. (1987c) "Phonetic Aspects of Third Language Learning in Bilingual Students", Sisenes Jornades Pedagógiques per a l' Ensenyament de l' Anglès, Barcelona, 4-7 de marzo de 1987, Instituto de Ciencias de la Educación de la Universidad Autónoma de Barcelona.

Compartir en:

compartir FaceBook

Síguenos en: Síguenos en Twiter | Síguenos en Facebook | Instagram | pinterest

Enlaces rápidos a temas de interés

BOLETÍN

RSS | XHTML | CSS
Mapa Web | Registro | Contacta
© Majo Producciones 2001-2022 - Prohibida la reproducción parcial o total de la información mostrada