Please use this identifier to cite or link to this item: https://rinacional.tecnm.mx/jspui/handle/TecNM/5851
Title: Desarrollo de un sistema de resumen y traducción multi-documentos a través de un algoritmo de resumen automático basado en entidades nombradas
Authors: Gomez Flores, Arturo Michel%699977
Issue Date: 2018-02-02
Publisher: Tecnológico Nacional de México
metadata.dc.publisher.tecnm: Centro Nacional de Investigación y Desarrollo Tecnológico
Description: En esta tesis se creó una herramienta que permite procesar una gran cantidad de documentos para generar un resumen automático basado en entidades nombradas y traducirlo a otro idioma, este idioma puede ser en español, inglés o francés. Este trabajo se inició con el estudio del estado del arte de sistemas para la generación de resumen automático, con ello se identificó el que presenta mejores resultados y se utilizó como referencia para la evaluación de 3 algoritmos creados en esta tesis. Estos algoritmos generan resumen basándose en entidades nombradas, el primero se basa en nombres propios (NP), el segundo en verbos (V) y el tercero en ambos, dichas evaluaciones se realizaron mediante la métrica Fresa y con un corpus conformado por 500 documentos en formato de texto plano, también se realizaron pruebas con textos cortos de 50, 40 y 30 líneas. Una vez que se obtuvieron los 3 mejores algoritmos, se realizó una combinación de ellos obteniendo un algoritmo híbrido. Se realizó una evaluación final mediante la cual se determinó el mejor sistema de resumen para ser utilizado en la herramienta creada en esta tesis, el cual fue Stonv (Summary Text based on prOper Nouns and Verbs). Los resultados fueron los siguientes: Stonv 0.40874, Híbrido 0.40313, Nasve 0.39328, Artex 0.38298 y Nason 0.33042. Por otro lado, se investigaron sistemas de traducción automática y se evaluaron mediante la métrica Fresa, el sistema de traducción mejor evaluado se utilizó para combinarlo con el algoritmo Stonv. Finalmente se realizaron evaluaciones a la combinación de estos dos sistemas para obtener la forma más conveniente de unirlos y así implementar un sistema web como una sola herramienta que realiza resumen y traducción teniendo 3 idiomas como alternativas a elegir, resultando ser un sistema multi-documentos y multi-idiomas. El objetivo de evaluar resumen y traducción es el de obtener un texto con la menor cantidad de errores posibles.
metadata.dc.type: info:eu-repo/semantics/masterThesis
Appears in Collections:Tesis de Maestría en Computación

Files in This Item:
File Description SizeFormat 
MC_Arturo_Michel_Gomez_Flores_2018.pdfTesis4.45 MBAdobe PDFView/Open
MC_Arturo_Michel_Gomez_Flores_2018-c.pdf
  Restricted Access
Cesión de Derechos137.95 kBAdobe PDFView/Open Request a copy


This item is protected by original copyright



This item is licensed under a Creative Commons License Creative Commons