Veuillez utiliser cette adresse pour citer ce document : https://rinacional.tecnm.mx/jspui/handle/TecNM/7714
Titre: Detección del estado emocional mediante la voz en español de México
Auteur(s): Hernandez Tamayo, Roberto%555595
Date de publication: 2016-06-30
Editeur: Tecnológico Nacional de México
metadata.dc.publisher.tecnm: Centro Nacional de Investigación y Desarrollo Tecnológico
Description: Durante los últimos años el interés por el reconocimiento de emociones en la voz se ha incrementado de manera notable. Diversos investigadores estudian los problemas y desafíos que implica el reconocimiento de emociones en la voz. Estos desafíos se dividen en tres etapas principales 1) generación y adquisición de datos; 2) extracción y selección de características acústicas; 3) clasificación y métodos de regresión. Estos tres elementos pueden cambiar de acuerdo con varios factores, por ejemplo, el lenguaje, el ruido en la grabación, las emociones para reconocerse, diversidad de oradores, entre otros. Así mismo, se proponen métodos para acercarse a la solución de estos desafíos en diversos contextos. Hoy en día algunos estudios proponen la creación de bases de datos utilizando oradores en diferentes idiomas; la extracción de conjuntos de características de la voz; y la experimentación con clasificación automática. En la investigación que aquí se reporta se estudian las particularidades del reconocimiento de emociones en la voz en el español hablado en México. La metodología que se propone en esta investigación se divide en dos etapas principales: extracción y clasificación. En el módulo de extracción se realiza el proceso de extracción de características. Se toman muestras de dos bases de datos emocionales: Emo_voz.mx1 y EmoWisconsin: se realiza el proceso de ventaneo a cada una de las muestras de los corpus. Este proceso lleva a cabo tres tareas: primero se realizan cortes a la señal de audio; se aplica la función de ventaneo y se realizan saltos del 50% de la longitud de cada corte. Posteriormente se extraen 45 características a cada corte. A un conjunto de características se les aplica la función Delta y Delta-Delta y a otro conjunto no. A estos conjuntos se les aplican 24 funciones estadísticas. Por último, se utilizan algoritmos para realizar el proceso de selección de mejores características en el cual se obtienen subconjuntos. En la etapa de clasificación se utilizan cuatro algoritmos de clasificación para realizar el proceso de entrenamiento y posteriormente su evaluación con cada uno de los subconjuntos. Los resultados muestran que las características con mejor rendimiento en ambos corpus son la energía, volumen y los MFCCs. En conjunto con la función de ventaneo Blackman y el algoritmo clasificador SMO el cual está basado en las Máquinas Vectores de Soporte. El resultado utilizando la medida F como referencia para Emo_voz.mx1 fue de 0.758 y para EmoWiscosin de 0.451
metadata.dc.type: info:eu-repo/semantics/masterThesis
Collection(s) :Tesis de Maestría en Computación

Fichier(s) constituant ce document :
Fichier Description TailleFormat 
MC_Roberto_Hernandez_Tamayo_2016.pdfTesis4.59 MBAdobe PDFVoir/Ouvrir
MC_Roberto_Hernandez_Tamayo_2016_c.pdf
  Accès limité
Cesión de derechos237.19 kBAdobe PDFVoir/Ouvrir    Demander une copie


Ce document est protégé par copyright



Ce document est autorisé sous une licence de type Licence Creative Commons Creative Commons