In de STOWA handleiding tijdreeksanalyse is de BJTR-tijdreeksmodellering (Tijdreeksanalyse volgens de Box-Jenkins methode) beschreven door Paul Baggelaar. Het onderstaande was zijn powerpoint-presentatie.
Tijdreeksanalist (TRG) heeft een uitgebreide toolbox om een scala van mogelijke tijdreeksmodellen te analyseren om het beste model te kunnen selecteren uit de klasse van Box-Jenkins en ‘hydrologische’ modellen. Belangrijke vragen die bij een goed tijdreeksmodel gesteld moeten worden zijn:
Hoe beschrijft het tijdreeksmodel de meetwaarden
Zijn de modelparameters en hun onzekerheden optimaal geschat
Zijn alle invloedsfactoren in de modellering meegenomen
Is de te onderzoeken invloedsfactor voldoende veranderd
Zijn de invloedsfactoren voldoende niet onderling gecorreleerd
Wat is de bijdrage van de afzonderlijke invloedsfactoren in de modellering
Is de bijdrage van het ruismodel niet te groot
Is gekozen voor een passende tijdsbasis van de modellering
Is er geen correlatie van de ruis met het deterministische deel van het model
Is er geen correlatie van de ruis met de invloedsfactoren
Zijn de residuen\innovaties normaal verdeeld
Is er geen autocorrelatie tussen de residuen
Is er geen correlatie tussen de residuen en het deterministische modeldeel
Is er geen correlatie tussen de ruis en het deterministische modeldeel
Is er geen correlatie tussen de residuen en de invloedsfactoren
Is er geen heteroscedasticiteit
Wat zijn de onzekerheden van de modelparameters
Zijn de modelparameters significant
Hoe goed zijn de modelsimulaties en wat is de onzekerheid
Wat zijn de verschillen tussen de verschillende mogelijke tijdreeksmodellen in het beschrijven van de meetwaarden
Hoe goed zijn de modelvoorspellingen en wat is de onzekerheid
Zijn de statistische relaties en zijn de modelparameters ook causaal te interpreteren
Wij vinden dat een uitgebreide toolbox nodig is en behulpzaam moet zijn om bovenstaande vragen te beantwoorden en om de onderzoeker te behoeden voor de vele valkuilen van de tijdreeksanalyse.
Een residuenanalyse, met toetsen op normaliteit en geen autocorrelatie, is onontbeerlijk om objectief statistische uitspraken te doen over de significantie van de statistische relaties. Als modelparameters niet optimaal zijn en er wordt niet voldaan aan alle randvoorwaarden dan kunnen op basis van het afgeleide tijdreeksmodel er geen goede schattingen gegeven worden van betrouwbaarheidsintervallen van modelparameters, relaties en voorspellingen. Tegenwoordig wordt er veelal op dagbasis gemodelleerd en dan is het alleen mogelijk met een uitgebreid ruismodel te voldoen aan de randvoorwaarden, zie ook hoogfrequente tijdsreeksmodellering.
Wij stellen:
De reden om tijdreeksanalyse toe te passen is om de data te laten spreken
Bij de toepassing van ‘de Pirfict-tijdreeksanalyse worden in toenemende mate resultaten gegeven met gekwantificeerde betrouwbaarheden van modelparameters, statistische significanties van de relaties tussen de grondwaterstand en invloedsfactoren en toekomstige grondwaterstanden. Dergelijke statistische toepassingen zijn in principe pas te verantwoorden als er ook aan een aantal randvoorwaarden wordt voldaan, zoals de innovaties zijn op te vatten als onafhankelijke trekkingen uit dezelfde normale kansverdeling (aangeduid als witte ruis). Aangezien er doorgaans wordt gemodelleerd met hoogfrequente meetreeksen van grondwaterstanden is er veelal sprake van een dusdanige autocorrelatie dat er niet aan deze voorwaarden wordt voldaan.
De onderstaande voorgestelde werkprocedure geeft de stappen om te verzorgen dat Pirfict-tijdreeksanalyse ook daadwerkelijk statistisch verantwoorde tijdreeksanalyse wordt.
Het verifiëren van een tijdreeksmodel is een belangrijk onderdeel van de werkprocedure. Voor de Pirfict-tijdreeksanalyse met Pastas hebben we een verificatie-module (2020) ontwikkeld om ook voor Pastas-gebruikers de gewenste statistische toetsen (zoals een normaliteitstoets en de Portmanteau-toets), die ook toepasbaar zijn op niet-equidistante tijdreeksen, beschikbaar te stellen om de voorgestelde werkprocedure uit te kunnen voeren:
Test of innovations
Test (confidence)
Result
Detail
D’Agostino-K2
normality (99%)
Yes
p=0.29
Portmanteau
no autocorr. (95%)
Yes
15.35<23.68
Engle
homosced. (95%)
Yes
p=0.61
Uit ons onderzoek, zie ons rapport Naar betere tijdreeksmodellering met Pastas (2020), blijkt tevens dat de onzuiverheid van geschatte grootheden, zoals de evenwichtsrelatie, flink kan oplopen zodra een gesimuleerde werkelijkheid iets verschilt met een verdelingsfunctie (gamma, exponentieel, ..), waar Pastas van uit gaat. Die onzuiverheid neemt toe bij toepassingen van het ruismodel én naarmate de ruisfactor/noise_alpha groter wordt, zie bijvoorbeeld issue 235 (met schattingsfouten van de werkelijke evenwichtsrelatie van meer dan 50%!). In een recent vervolgonderzoek is naar voren gekomen dat die onzuiverheid wordt veroorzaakt door verkeerde keuzes in de parameterschattingsmethode van Pastas.
Als een vervolg op ons onderzoek hebben we een notebook in Python ontwikkeld. In de notebook worden PASTAS-tijdreeksmodellen zonder en met een ruismodel met elkaar vergeleken in het schatten van een gesimuleerde werkelijkheid. De modellen worden getest op zuiverheid en de dekkingsgraad wordt bepaald. De notebook bevat de verificatiemodule voor het toetsen of de modellen voldoen aan de randvoorwaarden, zoals geen autocorrelatie, van een goed onderbouwd model. Zie ook De wezenlijke verschillen tussen de Pirfict en BJTR-tijdreeksmodellering.
Zie ook Tijdreeksanalist, onze applicatie met Box-Jenkins en modelleringen op basis van verdelingsfuncties, met ARMA-ruismodellering en met uitgebreide identificatie-, verificatie- en modelanalysemogelijkheden. In Tijdreeksanalist is een optimale parameterschattingsmethode geïmplementeerd voor optimale tijdreeksmodellen voor het beschrijven en voorspellen ven processen.
Geplaatst inTijdreeksanalist|Reacties uitgeschakeld voor Naar betere tijdreeksmodellering met Pastas??
Er is ook een batch versie van Trendanalist beschikbaar,
Trendanalistbatch.exe. Deze versie is vooral interessant voor
netwerkbeheerders die trends van parameters willen bepalen in hun
meetnet. Met slechts één aanroep van Trendanalistbatch in een
programmeeromgeving (zoals Matlab, R, Python of Access) kan van een
invoerbestand met meetreeksen van een meetnet de trends bepaald worden.
Trendanalistbatch levert resultaatbestanden die weer verder verwerkt
kunnen worden in de betreffende programmeeromgeving.
Geplaatst inDiensten|Reacties uitgeschakeld voor Trendanalistbatch
Een meetnet kan een krachtig en efficiënt instrument zijn bij het ondersteunen van de taken van een organisatie. Bij ons advieswerk hebben we inmiddels ruim ervaring opgedaan met allerlei deelaspecten van het meetnet, zoals ontwerpen en inrichten (wat, waar, wanneer en hoe meten), opstellen en beoordelen van meetprocedures, valideren en zonodig corrigeren van meetdata, verwerken van meetdata tot gewenste informatie en het rapporteren daarvan. Wij stellen daarbij vast dat de meetnetpotentie vaak niet ten volle beschikbaar is of niet volledig benut wordt. We hebben verschillende technieken ontwikkeld om een meetnet beter te stroomlijnen en beter te benutten …
Bij een samenwerkingsverband leveren we een gratis licentie van Tijdreeksanalist. U levert ons een dataset en wij leveren u de (verwerkte) dataset met de uitgevoerde tijdreeksanalyses. Met Tijdreeksanalist kunt u de tijdreeksanalyses naspelen en eventueel betere tijdreeksmodellen ontwikkelen.
Geplaatst inTijdreeksanalist|Reacties uitgeschakeld voor Samenwerkingsverband tijdreeksanalyses
Trendanalist is een softwarepakket om trendanalyses mee uit te voeren. Op de downloadpagina stellen we de standalone versie van Trendanalist ontwikkeld met de Matlab Compiler van 2022 voor Windows (64 bits) beschikbaar.
Geplaatst inTrendanalist|Reacties uitgeschakeld voor Download probeerversie Trendanalist
Trendanalist is een uniek programma, omdat het trendanalyses optimaal uitvoert en daarbij rekening houdt met de karakteristieken van de meetreeksen, zoals het niet-normaal verdeeld zijn, seizoenseffecten, autocorrelatie, ontbrekende en gecensureerde waarden
Trendanalist bevat daarvoor vier verschillende lineaire modelleringen en drie verschillende vormen van de parametervrije Mann-Kendall toets
Trendanalist kiest daarbij de optimale trendtoets met de kleinste kans op verkeerde conclusies
Trendanalist kan volledig automatisch honderden meetreeksen sequentieel analyseren
Statististische kennis is geen vereiste meer
Trendanalist kan verschillende bestandsformaten inlezen, zoals het csv-dataformaat van iBever of van Aquo-kit
Trendanalist genereert resultaten in grafische, spreadsheet en tekst-bestanden
Trendanalist presenteert de resultaten rechtstreeks in Word, Excel en Google Earth
Trendanalist levert tijds- en kostenbesparingen op met meer kwaliteit
Geen onverantwoorde trendanalyses meer (op basis van een subjectieve interpretatie of met een enkele trendtoets) die leiden tot dure maatregelen
Geen dagen, weken of soms maanden ‘ploeteren’, terwijl het met een ‘druk op de knop’ (van de automatische mode) van Trendanalist kan
Eindelijk tijd om trendanalyseresultaten te interpreteren, te verwerken en te rapporteren.
Een trendkaart is een informatieve vorm om trendanalyses te presenteren. Trendanalist bevat de onderstaande functionaliteit om trends te presenteren. Ook het trendpalet is een informatieve vorm voor het presenteren van trendanalyseresultaten.
Trendanalyses op meetpunt 00599 van waterschap Zuiderzeeland
Voorbeelden van trendkaarten (van waterkwaliteit) op Internet zijn:
Is er een trend in een tijdreeks dan is het altijd de vraag of een trendtoets die trend ook als (significante) trend detecteert. Vaak wordt er één enkele trendtoets toegepast, maar kan één enkele trendtoets onder alle omstandigheden worden toegepast?
Simulaties zijn uitgevoerd voor het bepalen van de trenddetectie van zeven trendtoetsen onder verschillende omstandigheden. De trenddetectie is daarbij het percentage gedetecteerde significante trends (met 95% betrouwbaarheid) als functie van een trend. De trenddetectie is daarbij een schatting van het onderscheidend vermogen (‘power’) van een trendtoets. De zeven trendtoetsen zijn:
LR: lineaire regressietoets
LRs: lineaire regressietoets met verdiscontering seizoenseffecten
LRa: lineaire regressietoets met verdiscontering autocorrelatie
LRsa: lineaire regressietoets met verdiscontering seizoenseffecten en autocorrelatie
MK: Mann-Kendalltoets
MKs: Mann-Kendalltoets met verdiscontering seizoenseffecten
MKsa: Mann-Kendalltoets met verdiscontering seizoenseffecten en autocorrelatie
In de onderstaande grafiek is de trenddetectie bepaald van zeven trendtoetsen bij modelsimulaties van een log-normaal proces met autocorrelatie (0.5) en seizoenseffecten, waarop lineaire trends van oplopende grootte zijn gesuperponeerd. In theorie zou bij deze omstandigheid de MKsa-trendtoets de best passende trendtoets moeten zijn.
Aangezien er geen sprake is van een normaal verdeeld proces presteren de lineaire regressietoetsen (LR*) duidelijk minder dan de verdelingsvrije Mann-Kendall toetsen. Let op dat bij geen trend (trend=0) het percentage trenddetectie niet groter dient te zijn dan 5%; we toetsen immers met 95% betrouwbaarheid. De MKs-trendtoets verdisconteerd niet de autocorrelatie en geeft bij geen trend een trenddetectie van 20%! De LR-toets geeft bij geen trend een trenddetectie van 14% en de trenddetectie is ruim kleiner dan van de MKsa-toets, de beste passende trendtoets.
Conclusie
Een belangrijke conclusie is dat het onverstandig is om trendanalyses uit te voeren met één en dezelfde trendtoets. Is er geen sprake van een normaal verdeeld proces pas dan geen lineaire regressie toe, want één van de verdelingsvrije trendtoetsen is krachtiger. Is er sprake van autocorrelatie (zoals bij relatief hoog frequente metingen van een traag proces) pas dan niet de MKs-trendtoets toe, want dan is de kans groot dat ten onrechte een trend gedetecteerd wordt. Het uitvoeren van trendanalyses verdient maatwerk, onderzoek het onderliggende proces en kies de best passende trendtoets.
Wat is onder welke omstandigheid de beste trendtoets en hoe verhoudt die trendtoets zich tot de overige trendtoetsen? Of welke rol speelt de autocorrelatie in een tijdreeks betreffende de trenddetectie als er geen sprake is van een trend? Zie ook ‘Trenddetectie van trendtoetsen onder verschillende omstandigheden’.