Naar betere tijdreeksmodellering met Pastas

Bij de toepassing van ‘de Pirfict-tijdreeksanalyse worden in toenemende mate resultaten gegeven met gekwantificeerde betrouwbaarheden van modelparameters, statistische significanties van de relaties tussen de grondwaterstand en invloedsfactoren en toekomstige grondwaterstanden. Dergelijke statistische toepassingen zijn in principe pas te verantwoorden als er ook aan een aantal randvoorwaarden wordt voldaan, zoals de innovaties zijn op te vatten als onafhankelijke trekkingen uit dezelfde normale kansverdeling (aangeduid als witte ruis). Aangezien er doorgaans wordt gemodelleerd met hoogfrequente meetreeksen van grondwaterstanden is er veelal sprake van een dusdanige autocorrelatie dat er niet aan deze voorwaarden wordt voldaan.

De onderstaande voorgestelde werkprocedure geeft de stappen om te verzorgen dat Pirfict-tijdreeksanalyse ook daadwerkelijk statistisch verantwoorde tijdreeksanalyse wordt.


Stroomschema voorgestelde werkprocedure om met Pastas te modelleren

Het verifiëren van een tijdreeksmodel is een belangrijk onderdeel van de werkprocedure. Voor de Pirfict-tijdreeksanalyse met Pastas hebben we een verificatie-module ontwikkeld om ook voor Pastas-gebruikers de gewenste statistische toetsen (zoals een normaliteitstoets en de Portmanteau-toets), die ook toepasbaar zijn op niet-equidistante tijdreeksen, beschikbaar te stellen om de voorgestelde werkprocedure uit te kunnen voeren:

Test of innovationsTest (confidence)ResultDetail
D’Agostino-K2    normality    (99%)Yes p=0.29
Portmanteau      no autocorr. (95%)Yes 15.35<23.68
Engle            homosced.    (95%)Yes p=0.61

Uit ons onderzoek, zie ons rapport Naar betere tijdreeksmodellering met Pastas, blijkt tevens dat de onzuiverheid van geschatte grootheden, zoals de evenwichtsrelatie, flink kan oplopen zodra een gesimuleerde werkelijkheid iets verschilt met een verdelingsfunctie (gamma, exponentieel, ..), waar Pastas van uit gaat. Die onzuiverheid neemt toe bij toepassingen van het ruismodel én naarmate de ruisfactor/noise_alpha groter wordt, zie bijvoorbeeld issue 235 (met schattingsfouten van de werkelijke evenwichtsrelatie van meer dan 50%!). In een recent vervolgonderzoek is naar voren gekomen dat die onzuiverheid wordt veroorzaakt door verkeerde keuzes in de parameterschattingsmethode van Pastas.

Als een vervolg op ons onderzoek hebben we een notebook in Python ontwikkeld. In de notebook worden PASTAS-tijdreeksmodellen zonder en met een ruismodel met elkaar vergeleken in het schatten van een gesimuleerde werkelijkheid. De modellen worden getest op zuiverheid en de dekkingsgraad wordt bepaald. De notebook bevat de verificatiemodule voor het toetsen of de modellen voldoen aan de randvoorwaarden, zoals geen autocorrelatie, van een goed onderbouwd model. Zie ook De wezenlijke verschillen tussen de Pirfict en BJTR-tijdreeksmodellering en Hoezo plausibel?.

Zie ook Tijdreeksanalist, onze applicatie met Box-Jenkins en modelleringen op basis van verdelingsfuncties, met ARMA-ruismodellering en met uitgebreide identificatie-, verificatie- en modelanalysemogelijkheden. In Tijdreeksanalist is een optimale parameterschattingsmethode geïmplementeerd voor optimale tijdreeksmodellen voor het beschrijven en voorspellen ven processen.

Dit bericht is geplaatst in Tijdreeksanalist. Bookmark de permalink.