Please use this identifier to cite or link to this item: https://rinacional.tecnm.mx/jspui/handle/TecNM/4155
Title: Análisis comparativo de lenguajes de programación para el desarrollo de aplicaciones en Ciencia de Datos
Authors: Lopez Perez, Ricardo Gudiel%857530
Issue Date: 2020-02-06
Publisher: Tecnológico Nacional de México
metadata.dc.publisher.tecnm: Centro Nacional de Investigación y Desarrollo Tecnológico
Description: En esta investigación se aborda el problema de seleccionar los lenguajes de programación más apropiados para el desarrollo de aplicaciones en Ciencia de Datos. Esto es un problema debido a que en la actualidad existen muchos lenguajes de programación utilizados en varios ámbitos y en distintas aplicaciones, por ello, es necesario identificar los lenguajes que tengan las características más favorables que permitan el desarrollo de aplicaciones en el área de Ciencia de Datos. Para resolver esta problemática, se siguió un enfoque de solución que se desarrolló en cuatro etapas. En la primera, se seleccionaron dentro de un conjunto de lenguajes de programación, los más utilizados en esta área de conocimiento. En la segunda etapa, se caracterizaron los lenguajes elegidos, los cuales fueron Python y R, en esta etapa, se conocieron los rasgos distintivos de cada lenguaje. En la tercera etapa, se estudiaron de manera teórica y práctica. En la última etapa, se desarrolló un conjunto de casos de prueba para comparar los resultados de la función K-means, que se trata de un algoritmo utilizado en la técnica del agrupamiento de datos, asimismo, este último es utilizado en el ámbito de Ciencia de Datos. Al experimentar con 10 bases de datos y 30 muestras tomadas de una de las bases de datos llamada 3D_spatial_network se observó que R presentó un promedio en tiempo de ejecución 1.373487697 segundos y Python 1.737771034 segundos, lo que muestra que R en esta experimentación resultó 1.26 veces más veloz que Python, R mostró una tendencia de ser más veloz que Python, esto se observó debido a que en 38 ejecuciones de 40, obtuvo ventaja en velocidad. En calidad de agrupamiento, para esta experimentación, Python logró en 18 ocasiones mejor calidad y R en 22 ocasiones. En promedio Python obtuvo una pérdida de calidad de 0.208982961 % y R 1.124429758 %. Dos conclusiones relevantes son las siguientes: el lenguaje Python cuenta con una representación de resultados numéricos más precisos que R. Ambos lenguajes tienen funciones para importar archivos de datos de cualquier tamaño, siendo su limitante el tamaño de la memoria virtual del sistema operativo.
metadata.dc.type: info:eu-repo/semantics/masterThesis
Appears in Collections:Tesis de Maestría en Computación

Files in This Item:
File Description SizeFormat 
MC_Ricardo_Gudiel_Lopez_Perez_2020.pdfTesis1.72 MBAdobe PDFView/Open
MC_Ricardo_Gudiel_Lopez_Perez_2020.pdf
  Restricted Access
Cesión de derechos96.89 kBAdobe PDFView/Open Request a copy


This item is protected by original copyright



This item is licensed under a Creative Commons License Creative Commons