Veuillez utiliser cette adresse pour citer ce document : https://rinacional.tecnm.mx/jspui/handle/TecNM/4155
Titre: Análisis comparativo de lenguajes de programación para el desarrollo de aplicaciones en Ciencia de Datos
Auteur(s): Lopez Perez, Ricardo Gudiel%857530
Date de publication: 2020-02-06
Editeur: Tecnológico Nacional de México
metadata.dc.publisher.tecnm: Centro Nacional de Investigación y Desarrollo Tecnológico
Description: En esta investigación se aborda el problema de seleccionar los lenguajes de programación más apropiados para el desarrollo de aplicaciones en Ciencia de Datos. Esto es un problema debido a que en la actualidad existen muchos lenguajes de programación utilizados en varios ámbitos y en distintas aplicaciones, por ello, es necesario identificar los lenguajes que tengan las características más favorables que permitan el desarrollo de aplicaciones en el área de Ciencia de Datos. Para resolver esta problemática, se siguió un enfoque de solución que se desarrolló en cuatro etapas. En la primera, se seleccionaron dentro de un conjunto de lenguajes de programación, los más utilizados en esta área de conocimiento. En la segunda etapa, se caracterizaron los lenguajes elegidos, los cuales fueron Python y R, en esta etapa, se conocieron los rasgos distintivos de cada lenguaje. En la tercera etapa, se estudiaron de manera teórica y práctica. En la última etapa, se desarrolló un conjunto de casos de prueba para comparar los resultados de la función K-means, que se trata de un algoritmo utilizado en la técnica del agrupamiento de datos, asimismo, este último es utilizado en el ámbito de Ciencia de Datos. Al experimentar con 10 bases de datos y 30 muestras tomadas de una de las bases de datos llamada 3D_spatial_network se observó que R presentó un promedio en tiempo de ejecución 1.373487697 segundos y Python 1.737771034 segundos, lo que muestra que R en esta experimentación resultó 1.26 veces más veloz que Python, R mostró una tendencia de ser más veloz que Python, esto se observó debido a que en 38 ejecuciones de 40, obtuvo ventaja en velocidad. En calidad de agrupamiento, para esta experimentación, Python logró en 18 ocasiones mejor calidad y R en 22 ocasiones. En promedio Python obtuvo una pérdida de calidad de 0.208982961 % y R 1.124429758 %. Dos conclusiones relevantes son las siguientes: el lenguaje Python cuenta con una representación de resultados numéricos más precisos que R. Ambos lenguajes tienen funciones para importar archivos de datos de cualquier tamaño, siendo su limitante el tamaño de la memoria virtual del sistema operativo.
metadata.dc.type: info:eu-repo/semantics/masterThesis
Collection(s) :Tesis de Maestría en Computación

Fichier(s) constituant ce document :
Fichier Description TailleFormat 
MC_Ricardo_Gudiel_Lopez_Perez_2020.pdfTesis1.72 MBAdobe PDFVoir/Ouvrir
MC_Ricardo_Gudiel_Lopez_Perez_2020.pdf
  Accès limité
Cesión de derechos96.89 kBAdobe PDFVoir/Ouvrir    Demander une copie


Ce document est protégé par copyright



Ce document est autorisé sous une licence de type Licence Creative Commons Creative Commons