Por favor, use este identificador para citar o enlazar este ítem: https://rinacional.tecnm.mx/jspui/handle/TecNM/4165
Título : Exploración para la identificación automática de palabras con polaridad
Autor : Alvarez Vazquez, Carlos Alberto%523223
Fecha de publicación : 2020-07-31
Editorial : Tecnológico Nacional de México
metadata.dc.publisher.tecnm: Centro Nacional de Investigación y Desarrollo Tecnológico
Descripción : El presente trabajo se centra en la identificación automática de palabras con polaridad en textos; esta es una de las actividades que aparece con frecuencia en métodos del análisis de sentimientos. Este campo de estudio analiza opiniones, sentimientos, actitudes y emociones de las personas hacia entidades tales como productos, servicios, organizaciones, individuos, problemas, entre otros. Para ello se requiere contar con listas de palabras, también denominadas Léxicos afectivos, que se encuentran asociadas a emociones positivas o negativas. Por lo regular, estas listas de palabras con polaridad se recopilan manualmente y ello conlleva la utilización de recursos económicos, competencias lingüísticas, así como tiempo. Además, los métodos existentes que realizan esta tarea están dirigidos a un idioma en específico, otros enfocados en un dominio en particular o usan algún recurso como base. En este trabajo se propone la utilización de métodos computacionales que logren minimizar la intervención manual en la construcción y/o enriquecimiento de léxicos afectivos. Se proponen diversos experimentos que muestran cómo el contexto en el que se presentan las palabras con polaridad, conformado por información lingüística, puede ser usado para identificar de manera automática vocablos con propiedades afectivas. El método que se propone se apoya de un pequeño número de palabras que expresan polaridad (palabras denominadas “semillas”) para obtener un conjunto de modelos que representan la estructura a nivel sintáctico de estas, los cuales se usan para buscar en un texto vocablos que se encuentren en un contexto similar. El método se apoya en la similitud coseno entre los vectores de los contextos de las semillas y de las palabras del texto para determinar el grado de vinculación entre los mismos. La evaluación del método utiliza un léxico afectivo para obtener la cantidad de palabras presentes en un corpus y se obtiene una línea tope, es decir, la cantidad máxima de palabras con polaridad que debe extraer el sistema. Los resultados obtenidos muestran variaciones en precisión y cobertura, logrando en algunos casos identificar palabras con polaridad con una precisión de hasta 0.98 y cobertura de 0.18. Aunque no se logran cubrir la cantidad de palabras, el método puede ser mejorado y superar lo obtenido hasta este punto. El método propuesto en este trabajo tiene varios campos de aplicación; por mencionar algunos, puede ser utilizado para generar o enriquecer léxicos afectivos en idiomas que no cuentan con ellos (por ejemplo, idiomas indígenas), así como las diversas tareas que busca resolver el análisis de sentimientos.
metadata.dc.type: info:eu-repo/semantics/masterThesis
Aparece en las colecciones: Tesis de Maestría en Computación

Ficheros en este ítem:
Fichero Descripción Tamaño Formato  
MC_Carlos_Alberto_Alvarez_Vazquez_2020.pdfTesis8.3 MBAdobe PDFVisualizar/Abrir
MC_Carlos_Alberto_Alvarez_Vazquez_2020.pdf
  Restricted Access
Cesión de derechos141.95 kBAdobe PDFVisualizar/Abrir  Request a copy


Este ítem está protegido por copyright original



Este ítem está sujeto a una licencia Creative Commons Licencia Creative Commons Creative Commons