Utilize este identificador para referenciar este registo: https://rinacional.tecnm.mx/jspui/handle/TecNM/4155
Título: Análisis comparativo de lenguajes de programación para el desarrollo de aplicaciones en Ciencia de Datos
Autor: Lopez Perez, Ricardo Gudiel%857530
Data: 2020-02-06
Editora: Tecnológico Nacional de México
metadata.dc.publisher.tecnm: Centro Nacional de Investigación y Desarrollo Tecnológico
Descrição: En esta investigación se aborda el problema de seleccionar los lenguajes de programación más apropiados para el desarrollo de aplicaciones en Ciencia de Datos. Esto es un problema debido a que en la actualidad existen muchos lenguajes de programación utilizados en varios ámbitos y en distintas aplicaciones, por ello, es necesario identificar los lenguajes que tengan las características más favorables que permitan el desarrollo de aplicaciones en el área de Ciencia de Datos. Para resolver esta problemática, se siguió un enfoque de solución que se desarrolló en cuatro etapas. En la primera, se seleccionaron dentro de un conjunto de lenguajes de programación, los más utilizados en esta área de conocimiento. En la segunda etapa, se caracterizaron los lenguajes elegidos, los cuales fueron Python y R, en esta etapa, se conocieron los rasgos distintivos de cada lenguaje. En la tercera etapa, se estudiaron de manera teórica y práctica. En la última etapa, se desarrolló un conjunto de casos de prueba para comparar los resultados de la función K-means, que se trata de un algoritmo utilizado en la técnica del agrupamiento de datos, asimismo, este último es utilizado en el ámbito de Ciencia de Datos. Al experimentar con 10 bases de datos y 30 muestras tomadas de una de las bases de datos llamada 3D_spatial_network se observó que R presentó un promedio en tiempo de ejecución 1.373487697 segundos y Python 1.737771034 segundos, lo que muestra que R en esta experimentación resultó 1.26 veces más veloz que Python, R mostró una tendencia de ser más veloz que Python, esto se observó debido a que en 38 ejecuciones de 40, obtuvo ventaja en velocidad. En calidad de agrupamiento, para esta experimentación, Python logró en 18 ocasiones mejor calidad y R en 22 ocasiones. En promedio Python obtuvo una pérdida de calidad de 0.208982961 % y R 1.124429758 %. Dos conclusiones relevantes son las siguientes: el lenguaje Python cuenta con una representación de resultados numéricos más precisos que R. Ambos lenguajes tienen funciones para importar archivos de datos de cualquier tamaño, siendo su limitante el tamaño de la memoria virtual del sistema operativo.
metadata.dc.type: info:eu-repo/semantics/masterThesis
Aparece nas colecções:Tesis de Maestría en Computación

Ficheiros deste registo:
Ficheiro Descrição TamanhoFormato 
MC_Ricardo_Gudiel_Lopez_Perez_2020.pdfTesis1.72 MBAdobe PDFVer/Abrir
MC_Ricardo_Gudiel_Lopez_Perez_2020.pdf
  Restricted Access
Cesión de derechos96.89 kBAdobe PDFVer/Abrir Request a copy


Este registo está protegido por copyright original.



Este registo está protegido por Licença Creative Commons Creative Commons