Naar betere tijdreeksmodellering met Pastas

Bij de toepassing van hydrologische tijdreeksanalyse, in softwarepakketten zoals Pastas en Menyanthes, worden in toenemende mate resultaten gegeven met gekwantificeerde betrouwbaarheden van modelparameters, statistische significanties van de relaties tussen de grondwaterstand en invloedsfactoren en toekomstige grondwaterstanden. Dergelijke statistische toepassingen zijn in principe pas te verantwoorden als er ook aan een aantal randvoorwaarden wordt voldaan, zoals de innovaties zijn op te vatten als onafhankelijke trekkingen uit dezelfde normale kansverdeling (aangeduid als witte ruis). Aangezien er doorgaans wordt gemodelleerd met hoogfrequente meetreeksen van grondwaterstanden is er veelal sprake van een dusdanige autocorrelatie dat er niet aan deze voorwaarden wordt voldaan.

De onderstaande voorgestelde werkprocedure geeft de stappen om te verzorgen dat hydrologische tijdreeksanalyse ook daadwerkelijk statistisch verantwoorde tijdreeksanalyse wordt.


Stroomschema voorgestelde werkprocedure om met Pastas te modelleren

Het verifiëren van een tijdreeksmodel is een belangrijk onderdeel van de werkprocedure. Voor Pastas hebben we een verificatie-module ontwikkeld om ook voor Pastas-gebruikers de gewenste statistische toetsen (zoals een normaliteitstoets en de Portmanteau-toets), die ook toepasbaar zijn op niet-equidistante tijdreeksen, beschikbaar te stellen om de voorgestelde werkprocedure uit te kunnen voeren:

Test of innovationsTest (confidence)ResultDetail
D’Agostino-K2    normality    (99%)Yes p=0.29
Portmanteau      no autocorr. (95%)Yes 15.35<23.68
Engle            homosced.    (95%)Yes p=0.61

Naast onze verificatie-module hebben we ook een simulatie-module ontwikkeld om allerlei testen op Pastas-modellen zonder en met een ruismodel uit te voeren. Uit ons onderzoek, zie ons rapport Naar betere tijdreeksmodellering met Pastas, blijkt overigens dat de onzuiverheid van geschatte grootheden, zoals de evenwichtsrelatie, flink kan oplopen als een relatievorm aan Pastas wordt aangeboden die enigszins afwijkt van waar Pastas van uitgaat. Die onzuiverheid neemt toe bij toepassingen van het ruismodel én naarmate de ruisfactor/noise_alpha groter wordt, zie bijvoorbeeld issue 235 (met schattingsfouten van de werkelijke evenwichtsrelatie van meer dan 50%!). Die onzuiverheid wordt veroorzaakt door verkeerde keuzes in de parameterschattingsmethodes van Pastas.

Zie ook Tijdreeksanalist, onze standalone applicatie met Box-Jenkins en modelleringen op basis van verdelingsfuncties, met ARMA-ruismodellering en met uitgebreide identificatie-, verificatie- en modelanalysemogelijkheden.

Dit bericht is geplaatst in Tijdreeksanalist. Bookmark de permalink.