Multivariate Resource Usage Forecasting and Temporal Accuracy in Private Cloud Systems
2025 (English)Independent thesis Advanced level (professional degree), 20 credits / 30 HE credits
Student thesis
Abstract [en]
Background: Accurate resource forecasting is crucial for optimizing performance,cost, and energy in private clouds. However, predicting dynamic workloads like CPUusage and quantifying forecast uncertainty remain challenging.Objectives: This thesis compares diverse forecasting models (classical, ensemble,deep learning) for private cloud CPU prediction. It assesses the value of multivariateinputs (CPU and memory data), analyzes accuracy degradation over forecast horizons, and evaluates non-Bayesian uncertainty quantification (UQ) methods (QuantileRegression - QR, Conformal Prediction - CP, Conformalized QR - CQR).Methods: Using historical private cloud hypervisor data and engineered temporal features, a naïve persistence baseline (predicting the next value equals the lastobserved value) and six advanced models (ARIMA, LR, RF, XGB, MLP, Transformer) were evaluated via chronological splits. Experiments compared univariatevs. multivariate inputs, examined performance across horizons (1-20 steps) usingdirect forecasting, and assessed 80% nominal prediction intervals from QR, CP, andCQR based on empirical coverage and width.Results: All advanced forecasting models significantly outperformed the naïve persistence baseline, demonstrating their utility. CPU history was the dominant predictor; tree ensembles (RF, XGB) performed slightly better than other ML models.Adding memory data offered marginal accuracy gains but slightly reduced underprediction risk (MUE/MCU). Point accuracy remained relatively stable across horizons with direct forecasting. Standard CP yielded conservative intervals (often >90%coverage), while QR/CQR achieved empirical coverage closer to the 80% target withcompetitive widths.Conclusions: For private cloud CPU forecasting, resource history is key, and treeensembles are effective, offering substantial improvements over simple baselines. Direct forecasting manages medium-term horizon errors well. Reliable uncertaintyquantification is vital; QR/CQR offer a practical alternative to potentially overconservative standard CP, presenting a trade-off between theoretical guarantees andempirical interval tightness
Abstract [sv]
Bakgrund: Korrekt prognostisering av resursförbrukning är avgörande för att optimera prestanda, kostnader och energiförbrukning i privata molnsystem. Att förutsäga dynamiska CPU-belastningar och kvantifiera prognososäkerhet utgör dock betydande utmaningar.Syfte: Denna avhandling jämför prognosmodeller (klassiska, ensemble, djupinlärning) för CPU-prediktering i privata moln. Studien utvärderar multivariata indata(CPU/minne), analyserar försämring av noggrannhet över tidshorisonter samt undersöker icke-Bayesianska metoder för osäkerhetskvantifiering: kvantilregression (QR),konform prediktion (CP) och konformiserad QR (CQR).Metod: Med historiska hypervisordata och konstruerade temporala egenskaper utvärderades en naiv persistensbaslinje samt sex avancerade modeller (ARIMA, LR, RF,XGB, MLP, Transformer) via kronologiska datadelningar. Experimenten jämfördeunivariata och multivariata indata, undersökte prestanda över 1–20 stegs horisontermed direktprognostisering och utvärderade 80%-prediktionsintervall från QR, CPoch CQR baserat på empirisk täckning och intervallbredd.Resultat: Alla avancerade modeller överträffade signifikant persistensbaslinjen. CPUhistorik var den dominerande prediktorn; trädbaserade ensemblemodeller (RF, XGB)presterade bäst. Minnesdata gav marginella noggrannhetsvinster men minskaderisken för underskattning. Noggrannheten i punktprognoser förblev relativt stabilöver horisonter med direktprognostisering. Standard-CP gav konservativa intervall(>90% täckning), medan QR/CQR uppnådde närmare 80%-målet med konkurrenskraftig intervallbredd.Slutsatser: För CPU-prognostisering i privata moln är historiska data avgörande,och trädbaserade ensemblemodeller erbjuder betydande förbättringar jämfört medenkla baslinjer. Direktprognostisering hanterar fel över medellånga horisonter väl.Tillförlitlig osäkerhetskvantifiering är essentiell; QR och CQR utgör praktiska alternativ till den överkonservativa standard-CP genom att balansera teoretiska garantiermot snävare empiriska intervall.
Place, publisher, year, edition, pages
2025. , p. 56
Keywords [en]
Resource Usage Forecasting, Private Cloud Systems, Time Series Forecasting, Machine Learning, Uncertainty Quantification
National Category
Computer Sciences
Identifiers
URN: urn:nbn:se:bth-27969OAI: oai:DiVA.org:bth-27969DiVA, id: diva2:1962674
External cooperation
Cleura
Subject / course
Degree Project in Master of Science in Engineering 30,0 hp
Educational program
DVAMI Master of Science in Engineering: AI and Machine Learning 300 hp
Supervisors
Examiners
2025-07-032025-06-022025-09-30Bibliographically approved