Valkuil hoogfrequente tijdreeksmodellering

Modellering van relatief hoog frequente metingen met een eenvoudig ruismodel

Door de introductie van automatische loggers kunnen op uurbasis al grondwaterstanden gemeten worden. We zien veelal dat tijdreeksanalyse wordt uitgevoerd op grondwaterstanden, neerslag- en verdampinggegevens op dagbasis. We beschouwen de tijdreeksmodellering van grondwaterstanden op een relatief kleine tijdsbasis in vergelijking met het grondwaterproces. Bij relatief hoog frequente  grondwaterstandmetingen in vergelijking met de processnelheid is er sprake van een hoge autocorrelatie van bijna één. In het onderstaande bespreken we het fenomeen ‘unit-root’, de valkuil bij hoogfrequente tijdreeksmodellering met een eenvoudig ruismodel.

In de softwarepakketten Pastas en Menyanthes voor het uitvoeren van de continue tijdreeksanalyse volgens de methode Pirfict wordt het volgende algemene model toegepast:

(1)   \begin{equation*}\begin{align} Z(t) = detmodel(t;p)+N(t) \\N(t) = \phi(\Delta t).N(t-\Delta t)+ a(t) \end{align}\end{equation*}

in Pastas en Menyanthes geldt voor de ruisfactor \phi als functie van \Delta t en \alpha:

(2)   \begin{equation*} \phi(\Delta t) = exp(-\frac 1\alpha.\Delta t )\end{equation*}

waarin Z(t) de grondwaterstand is op tijdstip t , model(t;p) het hydrologische deterministische model, N(t) het ruismodel, a(t) de innovatie en \Delta t het meetinterval tussen opeenvolgende metingen op tijdstip t-1 en t. Het deterministische model is een superpositie van transferfuncties van variabelen, zoals de neerslag, verdamping en onttrekking.    

 ‘Unit root’-probleem

Bij een modellering van grondwaterstanden op een kleine tijdsbasis, met een autocorrelatie van bijna één is bij de Pirfict-modellering de (afgeleide) modelparameter \phi(\Delta t) ook bijna één. Als we stellen dat \phi(dt) gelijk is aan één dan geldt voor bovenstaande vergelijking [1]:

(3)   \begin{equation*}\begin{align} Z(t) = detmodel(t;p)+N(t)  \\N(t) = N(t-\Delta t)+ a(t) \end{align}\end{equation*}

Dan geldt:

(4)   \begin{equation*}\begin{align} Z(t) = detmodel(t;p)+\sum _{i=1}^{t}  {a(i)}\end{align}\end{equation*}

We mogen veronderstellen dat de innovaties a(t) voor verschillende waarden voor t niet negatief gecorreleerd zijn en dan geldt: 

(5)   \begin{equation*}\begin{align} var(\sum_{i=1}^{t}{a(i)}) >= \sum _{i=1}^{t} {var(a(i))} = t.var(a)\end{align}\end{equation*}

Dit soort modellen hebben een oneindig grote variantie voor t naar oneindig en genereren dus niet-stationaire voorspellingen. Het is een bekend fenomeen in de tijdreeksanalyse en wordt het ‘unit root’-probleem genoemd en men spreekt daarbij over random-walk modellen. Vanwege de autocorrelatie van de innovaties (het ‘>=’-teken in vergelijking [5]) speelt ook bij een ruisfactor van bijna één het ‘unit-root’-probleem.   

Figuur 1: Voorbeeld van een random-walk proces met 10 simulatie met een tijdreeksmodel voor GWS met neerslag (N) en verdamping (V), beide op dagbasis en met een ruisfactor van bijna één

De ruis is gecorreleerd met de grondwaterstanden

Bij grote autocorrelatie van de grondwaterstanden en een ruisfactor \phi(\Delta t) van bijna 1 is de ruis N(t) gecorreleerd met de grondwaterstanden Z(t). De ruis beschrijft dan voornamelijk het hoogfrequente grondwaterproces en het deterministische model beschrijft een onderliggend grondwaterproces. Dit betekent dat de deterministische modelkeuze bepalend is voor de uitkomsten van de tijdreeksmodellering. Relaties tussen de grondwaterstanden en de invoervariabelen worden bepaald door de modelvorm met daarin voorgedefinieerde transferfuncties voor de relaties. De modelfit wordt voornamelijk bepaald door het ruismodel, het model lijkt daarmee plausibel, maar het is zeer de vraag of het model bruikbaar is voor het doel van de modellering.

Figuur 2: Voorbeeld van hetzelfde tijdreeksmodel als in figuur 1. De tijdreeks van de ruis lijkt op die van de grondwaterstanden met een correlatie van 0.8. Het ogenschijnlijk plausibele model kan sterk verbeterd worden
Figuur 3: Bijbehorende decompositie van de effecten van de neerslag en de verdamping van het model.

Samenvattend

Bij hoogfrequente tijdreeksmodellering met een eenvoudig ruismodel met een ruisfactor van bijna één speelt het ‘unit root’-probleem en is de ruis gecorreleerd met de uitvoervariabele. De modelresultaten lijken plausibel, maar ze geven een beschrijving van de werkelijkheid die bepaald wordt door de deterministische modelkeuze. Een voorbeeld van een Pastas-modellering waar een unit-root probleem speelt, is issue152. Tevens wordt aangetoond dat bij een modellering op dagbasis met een noise_alpha>=10 er al sprake is van onzuivere schattingen.

Vanwege de grootte van de correlatie van de ruis met de grondwaterstanden voldoen de modelresiduen of innovaties niet aan de voorwaarden van witte ruis en daarmee kunnen met deze hoogfrequente tijdreeksmodellen geen betrouwbaarheden van de parameters en relaties en onzekerheden van voorspellingen goed geschat worden.

Ons advies is kies een uitgebreid ruismodel of een tijdsbasis in de tijdreeksmodellen die past bij de processnelheid en voer modelverificatie uit op innovaties en ruis (met toetsen op normaliteit en autocorrelatie), zie de voorgestelde werkprocedure voor het verbeteren van de zeggingskracht van de hydrologische tijdreeksanalyse.

Dit bericht is geplaatst in Tijdreeksanalist. Bookmark de permalink.