Veuillez utiliser cette adresse pour citer ce document : https://rinacional.tecnm.mx/jspui/handle/TecNM/5851
Titre: Desarrollo de un sistema de resumen y traducción multi-documentos a través de un algoritmo de resumen automático basado en entidades nombradas
Auteur(s): Gomez Flores, Arturo Michel%699977
Date de publication: 2018-02-02
Editeur: Tecnológico Nacional de México
metadata.dc.publisher.tecnm: Centro Nacional de Investigación y Desarrollo Tecnológico
Description: En esta tesis se creó una herramienta que permite procesar una gran cantidad de documentos para generar un resumen automático basado en entidades nombradas y traducirlo a otro idioma, este idioma puede ser en español, inglés o francés. Este trabajo se inició con el estudio del estado del arte de sistemas para la generación de resumen automático, con ello se identificó el que presenta mejores resultados y se utilizó como referencia para la evaluación de 3 algoritmos creados en esta tesis. Estos algoritmos generan resumen basándose en entidades nombradas, el primero se basa en nombres propios (NP), el segundo en verbos (V) y el tercero en ambos, dichas evaluaciones se realizaron mediante la métrica Fresa y con un corpus conformado por 500 documentos en formato de texto plano, también se realizaron pruebas con textos cortos de 50, 40 y 30 líneas. Una vez que se obtuvieron los 3 mejores algoritmos, se realizó una combinación de ellos obteniendo un algoritmo híbrido. Se realizó una evaluación final mediante la cual se determinó el mejor sistema de resumen para ser utilizado en la herramienta creada en esta tesis, el cual fue Stonv (Summary Text based on prOper Nouns and Verbs). Los resultados fueron los siguientes: Stonv 0.40874, Híbrido 0.40313, Nasve 0.39328, Artex 0.38298 y Nason 0.33042. Por otro lado, se investigaron sistemas de traducción automática y se evaluaron mediante la métrica Fresa, el sistema de traducción mejor evaluado se utilizó para combinarlo con el algoritmo Stonv. Finalmente se realizaron evaluaciones a la combinación de estos dos sistemas para obtener la forma más conveniente de unirlos y así implementar un sistema web como una sola herramienta que realiza resumen y traducción teniendo 3 idiomas como alternativas a elegir, resultando ser un sistema multi-documentos y multi-idiomas. El objetivo de evaluar resumen y traducción es el de obtener un texto con la menor cantidad de errores posibles.
metadata.dc.type: info:eu-repo/semantics/masterThesis
Collection(s) :Tesis de Maestría en Computación

Fichier(s) constituant ce document :
Fichier Description TailleFormat 
MC_Arturo_Michel_Gomez_Flores_2018.pdfTesis4.45 MBAdobe PDFVoir/Ouvrir
MC_Arturo_Michel_Gomez_Flores_2018-c.pdf
  Accès limité
Cesión de Derechos137.95 kBAdobe PDFVoir/Ouvrir    Demander une copie


Ce document est protégé par copyright



Ce document est autorisé sous une licence de type Licence Creative Commons Creative Commons