Un Método para la Identificación Automática de Lenguas Basado en la Transformada Wavelet

Vargas Martinez, Jose Manuel.

Repositorio Institucional del Tecnológico Nacional de México (RI - TecNM)

Tesis de Posgrado

Tamaulipas

Instituto Tecnológico de Ciudad Madero

Tesis - Tec. Madero - O

Tesis de Maestría

Maestría en Ciencias de la Computación

Por favor, use este identificador para citar o enlazar este ítem: https://rinacional.tecnm.mx/jspui/handle/TecNM/3213

Título :	Un Método para la Identificación Automática de Lenguas Basado en la Transformada Wavelet
Autor :	Vargas Martinez, Jose Manuel.
Fecha de publicación :	2008-12-01
Editorial :	Tecnológico Nacional de México
metadata.dc.publisher.tecnm:	Instituto Tecnológico de Ciudad Madero
Descripción :	La identificación automática de lenguas habladas (LID) es aquella que tiene como objetivo el determinar qué lengua habla un hablante cualquiera utilizando una muestra de voz, todo esto mediante computadora. LID está relacionada con el reconocimiento del habla, con la diferencia de que no busca entender el mensaje hablado, solo en qué lengua fue expresado. Sus aplicaciones son variadas: a) como procesamiento previo a sistemas de traducción multilingüe, o para la canalización de los hablantes con el personal adecuado (en llamadas telefónicas de soporte y emergencia), b) también en uso de interfaces de voz que eligen el idioma más adecuado para el usuario, c) la interacción multilingüe en la que se busca que dos hablantes se comuniquen usando su lengua nativa, mediante un traductor de tiempo real. Su importancia se ha incrementado hoy en día debido a la globalización. En la actualidad los sistemas LID más exitosos son aquellos que utilizan información fonotáctica, los cuales, utilizan información fonética y acústica para obtener características más finas de las lenguas desde el punto de vista lingüístico, pero implica un coste computacional y lingüístico alto. Por otro lado existen los trabajos del tipo acústico que evitan estos costes con el fin de aplicarse a casi cualquier lengua incluso aquellas que tienen pocos recursos lingüísticos, como las lenguas indígenas, en particular las de México, pero este enfoque posee niveles de identificación menores, y por lo tanto, es una línea de investigación abierta. El presente trabajo utiliza el enfoque acústico, basado como muchos trabajos en el ritmo de los lenguajes hablados, el método propuesto utiliza como técnica de procesamiento de las señales acústicas la Transformada Wavelet Db2, y enfatiza el uso de muestras cortas de habla como su principal ventaja, puede manejar como mínimo 4 segundos de habla, y un número de atributos menor a 200 por clasificador, con buenos resultados arriba de 90% de clasificación correcta, lo que indica la posibilidad de aplicar este método en la construcción de un sistema real de identificación de lenguas en un futuro no muy lejano.
metadata.dc.type:	info:eu-repo/semantics/masterThesis
Aparece en las colecciones:	Maestría en Ciencias de la Computación

Ficheros en este ítem:

Fichero	Descripción	Tamaño	Formato
G00070864_donacion_tesis_bib.pdf		3.54 MB	Adobe PDF	Visualizar/Abrir

Este ítem está protegido por copyright original

Visualizar la licencia

Mostrar el registro Dublin Core completo del ítem

Este ítem está sujeto a una licencia Creative Commons Licencia Creative Commons

Repositorio Institucional del Tecnológico Nacional de México (RI - TecNM) Tesis de Posgrado Tamaulipas Instituto Tecnológico de Ciudad Madero Tesis - Tec. Madero - O Tesis de Maestría Maestría en Ciencias de la Computación

Repositorio Institucional del Tecnológico Nacional de México (RI - TecNM)

Tesis de Posgrado

Tamaulipas

Instituto Tecnológico de Ciudad Madero

Tesis - Tec. Madero - O

Tesis de Maestría

Maestría en Ciencias de la Computación