Naar betere tijdreeksmodellering met Pastas

Bij de toepassing van hydrologische tijdreeksanalyse, in softwarepakketten zoals Pastas en Menyanthes, worden in toenemende mate resultaten gegeven met gekwantificeerde betrouwbaarheden van modelparameters, statistische significanties van de relaties tussen de grondwaterstand en invloedsfactoren en toekomstige grondwaterstanden. Dergelijke statistische toepassingen zijn in principe pas te verantwoorden als er ook aan een aantal randvoorwaarden wordt voldaan, zoals de innovaties zijn op te vatten als onafhankelijke trekkingen uit dezelfde normale kansverdeling (aangeduid als witte ruis). Aangezien er doorgaans wordt gemodelleerd met hoogfrequente meetreeksen van grondwaterstanden is er veelal sprake van een dusdanige autocorrelatie dat er niet aan deze voorwaarde wordt voldaan.

De onderstaande voorgestelde werkprocedure geeft de stappen om te verzorgen dat hydrologische tijdreeksanalyse ook daadwerkelijk statistisch verantwoorde tijdreeksanalyse wordt.


Stroomschema voorgestelde werkprocedure om met Pastas te modelleren

Het verifiëren van een tijdreeksmodel is een belangrijk onderdeel van de werkprocedure. Voor Pastas hebben we een verificatie-module ontwikkeld om ook voor Pastas-gebruikers de gewenste statistische toetsen (zoals een normaliteitstoets en de Portmanteau-toets), die ook toepasbaar zijn op niet-equidistante tijdreeksen, beschikbaar te stellen om de voorgestelde werkprocedure uit te kunnen voeren:

Test of innovationsTest (confidence)ResultDetail
D’Agostino-K2    normality    (99%)Yes p=0.29
Portmanteau      no autocorr. (95%)Yes 15.35<23.68
Engle            homosced.    (95%)Yes p=0.61

Uit ons onderzoek, zie ons rapport Naar betere tijdreeksmodellering met Pastas, blijkt tevens dat de onzuiverheid van geschatte grootheden, zoals de evenwichtsrelatie, flink kan oplopen zodra een gesimuleerde werkelijkheid iets verschilt met een verdelingsfunctie (gamma, exponentieel, ..), waar Pastas van uit gaat. Die onzuiverheid neemt toe bij toepassingen van het ruismodel én naarmate de ruisfactor/noise_alpha groter wordt, zie bijvoorbeeld issue 235 (met schattingsfouten van de werkelijke evenwichtsrelatie van meer dan 50%!).

In een vervolgonderzoek is naar voren gekomen dat die onzuiverheid wordt veroorzaakt door bugs in de parameterschattingsmethode van Pastas. Deze bugs veroorzaken ook dat toepassing van het ruismodel van Pastas schade oplevert voor de pasvorm of modelfit en de EVP (de verklaarde variantie van het deterministische model). De parameterschattingen van de modelleringen van Pastas met een ruismodel zijn niet optimaal en dit is een eerste randvoorwaarde, waar nog niet aan is voldaan.

Zie ook Tijdreeksanalist, onze applicatie met Box-Jenkins en modelleringen op basis van verdelingsfuncties, met ARMA-ruismodellering en met uitgebreide identificatie-, verificatie- en modelanalysemogelijkheden.

Dit bericht is geplaatst in Tijdreeksanalist. Bookmark de permalink.