Identifiering av problematiska leveransplaner med maskininlärning
2021 (Swedish)Independent thesis Advanced level (professional degree), 20 credits / 30 HE credits
Student thesis
Abstract [sv]
Introduktion: Denna studie behandlar förändringar i leveransplaner inom försörjningskedjan. Huvudmän skickar många nya leveransplaner på grund av osäker efterfrågan vilket ställer till problem för leverantören i form av ökade kostnader av bland annat lager, transport, material och resurser. När en leveransplan uppdateras för nära i tid kan leverantören behöva ställa om sin produktion och risken att leveranser blir försenade uppkommer.
Syftet: Syftet med den här studien är att med hjälp av maskininlärning identifiera dessa problematiska leveransplaner för att hjälpa leverantörerna ställa om sin organisation i tid och därmed minimera onödiga kostnader.
Metod: I denna studie har tillvägagångssättet bestått av övervakad och icke-övervakad inlärning. Övervakad inlärning har utförts genom att skapa en varningsvariabel som markerar om ett avrop (efterfrågad kvantitet och efterfrågat leveransdatum) utgör en varning. Slumpmässig skog, k-närmaste grannar, stödvektormaskin och naiva bayes har använts för att skapa en modell som avgör ifall ett avrop är en varning eller ej varning. En utvärdering av algoritmernas prestanda har gjorts genom användningen av en förvirringsmatris där noggrannhet, felprocent, precision och täckning beräknats. Icke-övervakad inlärning har utförts genom att man skapar en pivottabell som visar alla förändringar mellan leveransplaner. Denna pivottabell har gjorts på dagsnivå, veckonivå och månadsnivå. Eftersom förändringar i närtid är mer problematiska än förändringar längre fram har de efterfrågade kvantiteterna viktats. Summan av absolutbeloppet av alla kvantitetsförändringar mellan leveransplanerna har beräknats som sedan använts som indata till att klustra. Klustring har använts med hjälp av k-medelkluster, gaussisk blandningsmodell och birch för att avgöra om en leveransplan avviker och därmed utgör en varning. Icke-övervakad inlärning har utvärderats med hjälp av siluettpoäng (och tröghet för k-medelkluster) samt en manuell verifikation där korrekt verifikation, felaktig verifikation, precision och täckning beräknats.
Resultat: Resultatet visar att för övervakad inlärning får slumpmässig skog bäst noggrannhet och precision på 56,79% och 60,82%. Naiva bayes får högst täckning på 64,38%. Resultatet för icke-övervakad inlärning visar att algoritmen birch ger det bästa resultatet vid oviktad veckonivå för korrekt verifikation på 86,27%. Gaussisk blandningsmodell får bäst resultat för kombinerad precision och täckning på 82,14% och 88,46% vid viktad veckonivå. Birch uppnådde tillsammans med k-medelkluster det högsta värdet för siluettpoäng på 0,9667 vid oviktad månadsnivå.
Slutsats: Slutsatsen blir att tillvägagångssättet i denna studie för övervakad inlärning inte lämpar sig på problemet medan tillvägagångssättet för icke-övervakad inlärning har en potential att lösa problemet.
Abstract [en]
Introduction: This study focuses on changes in delivery schedules between original equipment manufacturers (OEM) and suppliers in a supply chain. OEM frequently updates the delivery schedules sent to the suppliers due to uncertainty in demand which causes problems for suppliers in terms of increased costs in, for example, inventory, transportation, materials and resources. When a delivery schedule is updated close to its due date it could require the supplier to readjust their production plan which increases the risk of late deliveries.
Purpose: The purpose of this study is to identify problematic delivery schedules using machine learning in order to help the supplier readjust their organisation well in advance to minimize unnecessary costs.
Method: The approaches to solving the problem in this study are supervised and unsupervised learning. Supervised learning has been applied by creating a warning column which labels whether a suborder (planned quantity and planned delivery date) constitutes a warning. Random forest, k-nearest neighbours, support vector machine and naive bayes have been used to create a model that determines whether a suborder constitutes a warning or a non-warning. The supervised learning algorithms have been evaluated using a confusion matrix where accuracy, error rate, precision and recall have been calculated. The unsupervised learning approach has been applied by creating a pivot table showcasing all changes in quantity between the delivery schedules. The pivot table has been created showcasing the quantities daily, weekly and monthly. Due to changes in the delivery schedule closer to their due date being more problematic, the pivot table has been weighted. The sum of the absolute values of the changes between delivery schedules has been calculated and used as input to the algorithms. The algorithms k-means, gaussian mixture model and birch have been used to cluster the data into two clusters, warning and non-warning. The unsupervised learning approach has been evaluated using silhouette score (and inertia for k-means) as well as a manual verification in which correct verification, wrong verification, precision and recall have been calculated.
Results: The results for supervised learning show that random forest achieves the highest accuracy (56,79%) and precision (60,82%). Naive bayes achieves the highest recall at 64,38%. The results for unsupervised learning show that birch achieves the highest results in terms of correct verification (86,27%) when unweighted weekly summarized quantities are applied. Gaussian mixture model achieves the best combined precision and recall at 82,14% and 88,46% when weighted weekly summarization is applied. The highest value of silhouette score is achieved by birch and k-means at 0,9667 when unweighted monthly summarization is applied.
Conclusion: The conclusions drawn in this study are that the approach for supervised learning is not a suitable solution to the problem while the approach for unsupervised learning has a potential to be a suitable solution to the problem.
Place, publisher, year, edition, pages
2021. , p. 61
Keywords [en]
Delivery schedules, machine learning, EDI, supplier, supply chain
Keywords [sv]
Leveransplaner, maskininlärning, EDI, leverantör, försörjningskedja
National Category
Computer Sciences
Identifiers
URN: urn:nbn:se:bth-21918OAI: oai:DiVA.org:bth-21918DiVA, id: diva2:1576639
External cooperation
PipeChain Group AB
Subject / course
Degree Project in Master of Science in Engineering 30,0 hp
Educational program
IEACI Master of Science in Industrial Management and Engineering
Supervisors
Examiners
2021-07-012021-07-012022-05-12Bibliographically approved