Data-driven forecasting (i.e., regression, machine learning, artificial intelligence, etc.) has become a popular and very useful alternative to physically-based and conceptual forecasting approaches in the water resources domain since such methods solely rely on statistical relationships between explanatory variables and the target process, require no explicit physical knowledge of the processes under study, are rapid to develop, have low-costs, and are easy to implement in real-time. However, similar to physicallybased and conceptual forecasting approaches, the nonlinear, multiscale, and uncertain nature of water resources provide challenges in the development of accurate and reliable data-driven forecasts.
To address the nonlinear, multiscale, and uncertain nature of water resources this research develops an innovative ensemble wavelet-based stochastic data-driven forecasting framework (EW-SDDFF) that results in forecasts of a target process in the form of a probability density function. EW-SDDFF is developed, tested, and applied to a real-world daily urban water demand forecasting experiment in Montreal, Quebec where it is shown to produce accurate and reliable forecasts at multiple lead times, outperforming numerous benchmarks, and performing especially well during the July, 2010 heatwave that affected Montreal (and many other parts of Quebec).
EW-SDDFF addresses the nonlinear, multiscale, and uncertain nature of water resources in three main ways: 1) it uses nonlinear information-theoretic input variable selection and nonlinear data-driven forecasting methods; 2) it uses wavelet transforms to address multiscale changes in explanatory variables and the target process; and 3) it adopts stochastics for the uncertainty assessment of input data, input variable selection, parameters, and model output. The end result of EW-SDDFF is a stochastic forecast that holistically addresses nonlinearity, multiscale change, and uncertainty.
The main innovations behind the EW-SDDFF are contained in its development which takes place in four key stages: 1) new computationally efficient, non-parametric, nonlinear information-theoretic input variable selection methods are developed to provide the most important input variables to nonlinear data-driven methods to forecast the target process; 2) a set of best (correct) practices are developed for using wavelet transforms correctly in wavelet-based forecasting models and formed into a new waveletbased forecasting framework (WDDFF) that can be used with multiple wavelet transforms, different input variable selection methods, and data-driven forecasting models and that may be applied for the correct development of wavelet-based forecasting models for real-world applications; 3) uncertainty assessment is included in WDDFF by adopting a stochastic framework, resulting in a new stochastic wavelet-based forecasting framework (SWDDFF); and 4) to take advantage of the strengths of multiple wavelet transforms, different input variable selection methods and data-driven models, the single-wavelet SWDDFF is transformed into an ensemble multi-wavelet stochastic data-driven forecasting framework (EW-SDDFF) by using multiple WDDFF forecasts as input data, improving forecast accuracy and reliability when compared to its single-wavelet counterparts (SWDDFF). EW-SDDFF includes both ensemble member selection and weighting uncertainties, using input variable selection and data-driven modeling, respectively, and also accounts for input data and ensemble model output uncertainties. Both SWDDFF and EW-SDDFF represent the most advanced single- and multi-wavelet data-driven forecasting frameworks in the literature.
Since EW-SDDFF quantifies forecast uncertainty (in the form of a probability density function), it may serve as a useful tool for operational, planning, and management tasks faced by water resources managers, especially during decision-making stages.
Devenue, dans le domaine des ressources en eau, une alternative à la fois populaire et utile aux approches prévisionnelles conceptuelles ou fondées sur des critères physiques, les prévisions axées sur les données (c.à.d. régression, apprentissage machine, intelligence artificielle, etc.) sont privilégiées parce qu’elles reposent uniquement sur les relations statistiques entre les variables explicatives et le processus cible, n’exigent aucune connaissance physique explicite du processus étudié, sont rapidement élaborés, de faible coût, et faciles à mettre en œuvre en temps réel. Cependant, tout comme avec les approches prévisionnelles conceptuelles ou fondées sur des critères physiques, le caractère non-linéaire, multi- échelle et incertain des ressources hydriques pose un défi au développement de prévisions axées sur les données qui soient à la fois précises et fiables.
Afin de s’adresser au caractère non-linéaire, multi-échelle et incertain des ressources hydriques, la présente étude visa à élaborer un innovant ensemble prévisionnel stochastique axé sur les données invoquant l’utilisation d’ondelettes (EW-SDDFF), permettant ainsi de prévoir un processus cible sous forme de fonction de densité de probabilité. Élaboré, mis à l'épreuve et mis en pratique dans une situation réelle de prévision de la demande urbaine d'eau quotidienne de la ville de Montréal (Québec), le EW- SDDFF offrit des prévisions précises et fiables sous différents délais, surpassant plusieurs indices de référence, et s’avérant particulièrement performant lors de la canicule de juillet 2010 qui frappa Montréal et plusieurs autres régions du Québec.
L’EW-SDDFF aborde le caractère non-linéaire, multi-échelle et incertain des ressources hydriques de trois manières innovant, il emploi (i) un critère puisé de la théorie de l'information pour choisir les variables d'entrée, ainsi que des méthodes de prévision non-linéaires axées sur les données, (ii) une transformée en ondelettes pour s’adresser aux variations multi-échelles des variables explicatives et du processus cible, et (iii) la stochastique pour évaluer l’incertitude dans les données d’entrée, la sélection des données d’entrée, des paramètres et données de sortie des modèles. En fin de compte, l’EW-SDDFF offre une prévision stochastique qui s’adresse globalement à la non-linéarité, les variations multi-échelle et incertitude.
L’élaboration de l’EW-SDDFF s’opéra en quatre étapes principales: (i) élaborer de nouvelles méthodes de modélisation dont le traitement informatique est efficace, non-linéaire et non-paramétrique, et qui permettent de sélectionner de données d’entrée pertinentes à la prévision du processus cible par un modèle non-linéaire axé sur les données, selon des critères puisés dans théorie de l'information; (ii) élaborer à la fois un ensemble de pratiques visant le bon usage des transformées en ondelettes dans les modèles prévisionnels à base d’ondelettes, et un réseau prévisionnel à base d’ondelettes (WDDFF) permettant de mettre en œuvre et comparer plusieurs types de transformées en ondelettes, différentes méthodes de sélection des données d’entrée, et différents modèles prévisionnels axées sur les données, tout cela pour créer de tels modèles pouvant être appliqués en situation réelle; (iii) en adoptant un cadre stochastique, une évaluation de l’incertitude est incluse dans le WDDFF, donnant lieu a un réseau prévisionnel à base d’ondelettes stochastique (SWDDFF); et (iv) en vue de tirer parti de la puissance des transformées en ondelettes multiples, des différentes méthodes de sélection des données d’entrée, et des modèles axées sur les données, un SWDDFF mono-ondelette fut transformé en un cadre stochastique multi-ondelettes d’ensemble axée sur les données (EW-SDDFF) et puisant sur de multiples prévisions WDDFF comme données d’entrée. En comparaison à son homologue mono-ondelette (SWDDFF), le EW- SDDFF améliora la précision et la fiabilité des prévisions. Le EW-SDDFF inclus à la fois une sélection d’ensemble des membres et une pondération d’incertitudes, de manière qu’un choix entre données d’entrée variables et une modélisation axée sur les données sont, respectivement, mis en œuvre. Cette approche tient également compte des incertitudes des données d’entrée et des données de sortie des modèles d’ensemble. Ensemble, SWDDFF et EW-SDDFF représentent les réseaux de prévision axées sur les données mono- et multi-ondelette les plus avancés rapportés dans la littérature.
Comme l’EW-SDDFF quantifie l’incertitude des prévisions (sous forme de fonction de densité de probabilité), il peut représenter un important outil pour les tâches opérationnelles, de planification et de gestion auxquels sont confrontés — particulièrement lors d’étapes décisionnelles — les gestionnaires des ressources en eau.