
Please use this identifier to cite or link to this item:
https://rinacional.tecnm.mx/jspui/handle/TecNM/9773
Title: | DESARROLLO DE UN ESQUEMA DE CONTROL PARA UNA CADENA DE SUMINISTRO (SC) DE UNA EMPRESA PRODUCTORA DE LECHE USANDO INTELIGENCIA ARTIFICIAL (IA) |
Authors: | ARELLANO CRUZ, ERIKA+P. |
metadata.dc.subject.other: | aprendizaje reforzado, aprendizaje profundo, cadena de suministro, control de inventario. |
Issue Date: | 2024-10-18 |
Publisher: | Tecnológico Nacional de México |
metadata.dc.publisher.tecnm: | Instituto Tecnológico de Orizaba |
Description: | Entre la amplia gama de problemas de la cadena de suministro (CS) entendida también como red de abastecimiento, la gestión de inventario sigue siendo uno de los principales desafíos. En esta tesis, nuestro objetivo es proponer algoritmos de aprendizaje por refuerzo no paramétrico impulsado por datos para estos alcanzar estos objetivos en contradicción en entornos donde no existe un servicio de almacenamiento de datos compartidos entre todos los eslabones de la cadena. La literatura sobre modelos de inventarios de niveles múltiples es bastante rica, aunque se basa principalmente en la suposición de conocer la demanda anticipadamente. La distribución de la demanda puede ser aproximada, pero, aun así, en algunos casos no se dispone de un modelo globalmente óptimo. El juego de la cerveza es una CS en adelante la llamaremos “Red de abastecimiento de una compañía productora de lácteos” con la abreviatura RACPL en serie con cuatro agentes, es decir, minorista, mayorista, distribuidor y fabricante, en la que cada agente reabastece sus existencias al pedir cerveza a su predecesor. El minorista satisface la demanda de clientes externos y el fabricante ordena a proveedores externos. Cada uno de los agentes debe decidir su propia cantidad de pedido para disminuir la totalización de los costos de almacenamiento y falta de inventario del sistema, mientras que no se les permite compartir ninguna información con otros agentes. Para esta configuración, una política de existencias base es óptima, solo si conoce la demanda con antelación y sigue una distribución de demanda conocida. Fuera de esta estrecha condición, no existe una política óptima conocida para este juego. Además, el juego de la cerveza se puede modelar como un problema cooperativo multi-agente descentralizado con observabilidad parcial. En la presente tesis, se analiza el rendimiento de los diferentes métodos de aprendizaje por refuerzo (RL) bajo dos tipos de distribución de la demanda. Este modelo de RL solo considera un agente en la RACPL debido a que, en la práctica, incluso ahora con el Internet de las cosas (IoT), a veces no es factible tener acceso a la información de los otros escalones de la RACPL. Los resultados de las simulaciones muestran que el método Dueling DQN funciona mejor que las políticas basadas en nivel de inventario incluso cuando la demanda es desconocida. |
metadata.dc.type: | info:eu-repo/semantics/doctoralThesis |
Appears in Collections: | Doctorado en Ciencias de la Ingeniería |
Files in This Item:
File | Description | Size | Format | |
---|---|---|---|---|
Tesis_Doctorado_ErikaPaulinaArellanoCruz_TecNM_oct2024.pdf | 2.03 MB | Adobe PDF | View/Open | |
ARELLANO CRUZ ERIKA PAULINA-LICENCIA.pdf | 170.4 kB | Adobe PDF | View/Open |
This item is protected by original copyright |
This item is licensed under a Creative Commons License