Tijdreeksanalyse – tijdreeksmodellen, wat is van belang?

Tijdreeksanalist (TRG) heeft een uitgebreide toolbox om een scala van mogelijke tijdreeksmodellen te analyseren om het beste model te kunnen selecteren uit de klasse van Box-Jenkins en ‘hydrologische’ modellen. Belangrijke vragen die bij een goed tijdreeksmodel gesteld moeten worden zijn:

  • Hoe beschrijft het tijdreeksmodel de meetwaarden
  • Zijn de modelparameters en hun onzekerheden optimaal geschat
  • Zijn alle invloedsfactoren in de modellering meegenomen
  • Is de te onderzoeken invloedsfactor voldoende veranderd
  • Zijn de invloedsfactoren voldoende niet onderling gecorreleerd
  • Wat is de bijdrage van de afzonderlijke invloedsfactoren in de modellering
  • Is de bijdrage van het ruismodel niet te groot
  • Is gekozen voor een passende tijdsbasis van de modellering
  • Is er geen correlatie van de ruis met het deterministische deel van het model
  • Is er geen correlatie van de ruis met de invloedsfactoren
  • Zijn de residuen\innovaties normaal verdeeld
  • Is er geen autocorrelatie tussen de residuen
  • Is er geen correlatie tussen de residuen en het deterministische modeldeel
  • Is er geen correlatie tussen de ruis en het deterministische modeldeel
  • Is er geen correlatie tussen de residuen en de invloedsfactoren
  • Is er geen heteroscedasticiteit
  • Wat zijn de onzekerheden van de modelparameters
  • Zijn de modelparameters significant
  • Hoe goed zijn de modelsimulaties en wat is de onzekerheid
  • Wat zijn de verschillen tussen de verschillende mogelijke tijdreeksmodellen in het beschrijven van de meetwaarden
  • Hoe goed zijn de modelvoorspellingen en wat is de onzekerheid
  • Zijn de statistische relaties en zijn de modelparameters ook causaal te interpreteren

Wij vinden dat een uitgebreide toolbox nodig is en behulpzaam moet zijn om bovenstaande vragen te beantwoorden en om de onderzoeker te behoeden voor de vele valkuilen van de tijdreeksanalyse.

Een residuenanalyse, met toetsen op normaliteit en geen autocorrelatie, is onontbeerlijk om objectief statistische uitspraken te doen over de significantie van de statistische relaties. Als modelparameters niet optimaal zijn en er wordt niet voldaan aan alle randvoorwaarden dan kunnen op basis van het afgeleide tijdreeksmodel er geen goede schattingen gegeven worden van betrouwbaarheidsintervallen van modelparameters, relaties en voorspellingen. Tegenwoordig wordt er veelal op dagbasis gemodelleerd en dan is het alleen mogelijk met een uitgebreid ruismodel te voldoen aan de randvoorwaarden, zie ook hoogfrequente tijdsreeksmodellering.

Wij stellen:

  1. De reden om tijdreeksanalyse toe te passen is om de data te laten spreken
  2. Houd van de data en wantrouw je modellen!

Zie verder Tijdreeksanalist (TRG)

Geplaatst in Alle categorieen, Tijdreeksanalist | Getagged | Reacties uitgeschakeld voor Tijdreeksanalyse – tijdreeksmodellen, wat is van belang?

Naar betere tijdreeksmodellering met Pastas??

Bij de toepassing van ‘de Pirfict-tijdreeksanalyse worden in toenemende mate resultaten gegeven met gekwantificeerde betrouwbaarheden van modelparameters, statistische significanties van de relaties tussen de grondwaterstand en invloedsfactoren en toekomstige grondwaterstanden. Dergelijke statistische toepassingen zijn in principe pas te verantwoorden als er ook aan een aantal randvoorwaarden wordt voldaan, zoals de innovaties zijn op te vatten als onafhankelijke trekkingen uit dezelfde normale kansverdeling (aangeduid als witte ruis). Aangezien er doorgaans wordt gemodelleerd met hoogfrequente meetreeksen van grondwaterstanden is er veelal sprake van een dusdanige autocorrelatie dat er niet aan deze voorwaarden wordt voldaan.

De onderstaande voorgestelde werkprocedure geeft de stappen om te verzorgen dat Pirfict-tijdreeksanalyse ook daadwerkelijk statistisch verantwoorde tijdreeksanalyse wordt.


Stroomschema voorgestelde werkprocedure om met Pastas te modelleren

Het verifiëren van een tijdreeksmodel is een belangrijk onderdeel van de werkprocedure. Voor de Pirfict-tijdreeksanalyse met Pastas hebben we een verificatie-module (2020) ontwikkeld om ook voor Pastas-gebruikers de gewenste statistische toetsen (zoals een normaliteitstoets en de Portmanteau-toets), die ook toepasbaar zijn op niet-equidistante tijdreeksen, beschikbaar te stellen om de voorgestelde werkprocedure uit te kunnen voeren:

Test of innovationsTest (confidence)ResultDetail
D’Agostino-K2    normality    (99%)Yes p=0.29
Portmanteau      no autocorr. (95%)Yes 15.35<23.68
Engle            homosced.    (95%)Yes p=0.61

Uit ons onderzoek, zie ons rapport Naar betere tijdreeksmodellering met Pastas (2020), blijkt tevens dat de onzuiverheid van geschatte grootheden, zoals de evenwichtsrelatie, flink kan oplopen zodra een gesimuleerde werkelijkheid iets verschilt met een verdelingsfunctie (gamma, exponentieel, ..), waar Pastas van uit gaat. Die onzuiverheid neemt toe bij toepassingen van het ruismodel én naarmate de ruisfactor/noise_alpha groter wordt, zie bijvoorbeeld issue 235 (met schattingsfouten van de werkelijke evenwichtsrelatie van meer dan 50%!). In een recent vervolgonderzoek is naar voren gekomen dat die onzuiverheid wordt veroorzaakt door verkeerde keuzes in de parameterschattingsmethode van Pastas.

Als een vervolg op ons onderzoek hebben we een notebook in Python ontwikkeld. In de notebook worden PASTAS-tijdreeksmodellen zonder en met een ruismodel met elkaar vergeleken in het schatten van een gesimuleerde werkelijkheid. De modellen worden getest op zuiverheid en de dekkingsgraad wordt bepaald. De notebook bevat de verificatiemodule voor het toetsen of de modellen voldoen aan de randvoorwaarden, zoals geen autocorrelatie, van een goed onderbouwd model. Zie ook De wezenlijke verschillen tussen de Pirfict en BJTR-tijdreeksmodellering.

Zie ook Tijdreeksanalist, onze applicatie met Box-Jenkins en modelleringen op basis van verdelingsfuncties, met ARMA-ruismodellering en met uitgebreide identificatie-, verificatie- en modelanalysemogelijkheden. In Tijdreeksanalist is een optimale parameterschattingsmethode geïmplementeerd voor optimale tijdreeksmodellen voor het beschrijven en voorspellen ven processen.

Geplaatst in Tijdreeksanalist | Reacties uitgeschakeld voor Naar betere tijdreeksmodellering met Pastas??

Trendanalistbatch

Er is ook een batch versie van Trendanalist beschikbaar, Trendanalistbatch.exe. Deze versie is vooral interessant voor netwerkbeheerders die trends van parameters willen bepalen in hun meetnet. Met slechts één aanroep van Trendanalistbatch in een programmeeromgeving  (zoals Matlab, R, Python of Access) kan van een invoerbestand met meetreeksen van een meetnet de trends bepaald worden. Trendanalistbatch levert resultaatbestanden die weer verder verwerkt kunnen worden in de betreffende programmeeromgeving.

Geplaatst in Diensten | Reacties uitgeschakeld voor Trendanalistbatch

Stroomlijnen meetnet

Een meetnet kan een krachtig en efficiënt instrument zijn bij het ondersteunen van de taken van een organisatie. Bij ons advieswerk hebben we inmiddels ruim ervaring opgedaan met allerlei deelaspecten van het meetnet, zoals ontwerpen en inrichten (wat, waar, wanneer en hoe meten), opstellen en beoordelen van meetprocedures, valideren en zonodig corrigeren van meetdata, verwerken van meetdata tot gewenste informatie en het rapporteren daarvan. Wij stellen daarbij vast dat de meetnetpotentie vaak niet ten volle beschikbaar is of niet volledig benut wordt. We hebben verschillende technieken ontwikkeld om een meetnet beter te stroomlijnen en beter te benutten …

Geplaatst in Diensten, Tijdreeksanalist, Trendanalist | Een reactie plaatsen

Samenwerkingsverband tijdreeksanalyses

Bij een samenwerkingsverband leveren we een gratis licentie van Tijdreeksanalist. U levert ons een dataset en wij leveren u de (verwerkte) dataset met de uitgevoerde tijdreeksanalyses. Met Tijdreeksanalist kunt u de tijdreeksanalyses naspelen en eventueel betere tijdreeksmodellen ontwikkelen.

Geplaatst in Tijdreeksanalist | Reacties uitgeschakeld voor Samenwerkingsverband tijdreeksanalyses

Download probeerversie Trendanalist

Download probeerversie Trendanalist (voor de toegang leveren we een wachtwoord)

Trendanalist is een softwarepakket om trendanalyses mee uit te voeren. Op de downloadpagina stellen we de standalone versie van Trendanalist ontwikkeld met de Matlab Compiler van 2022 voor Windows (64 bits) beschikbaar.

Geplaatst in Trendanalist | Reacties uitgeschakeld voor Download probeerversie Trendanalist

Waarom trendanalyses met Trendanalist

  1. Trendanalist is een uniek programma, omdat het trendanalyses optimaal uitvoert en daarbij rekening houdt met de karakteristieken van de meetreeksen, zoals het niet-normaal verdeeld zijn, seizoenseffecten, autocorrelatie, ontbrekende en gecensureerde waarden
  2. Trendanalist bevat daarvoor vier verschillende lineaire modelleringen en drie verschillende vormen van de parametervrije Mann-Kendall toets
  3. Trendanalist kiest daarbij de optimale trendtoets met de kleinste kans op verkeerde conclusies
  4. Trendanalist kan volledig automatisch honderden meetreeksen sequentieel analyseren
  5. Statististische kennis is geen vereiste meer
  6. Trendanalist kan verschillende bestandsformaten inlezen, zoals het csv-dataformaat van iBever of van Aquo-kit
  7. Trendanalist genereert resultaten in grafische, spreadsheet en tekst-bestanden
  8. Trendanalist presenteert de resultaten rechtstreeks in Word, Excel en Google Earth
  9. Trendanalist levert tijds- en kostenbesparingen op met meer kwaliteit
  10. Geen onverantwoorde trendanalyses meer (op basis van een subjectieve interpretatie of met een enkele trendtoets) die leiden tot dure maatregelen
  11. Geen dagen, weken of soms maanden ‘ploeteren’, terwijl het met een ‘druk op de knop’ (van de automatische mode) van Trendanalist kan
  12. Eindelijk tijd om trendanalyseresultaten te interpreteren, te verwerken en te rapporteren.

Zie ook Trendanalist

Geplaatst in Trendanalist | Getagged , | Reacties uitgeschakeld voor Waarom trendanalyses met Trendanalist

Trendkaarten waterkwaliteit

Een trendkaart is een informatieve vorm om trendanalyses te presenteren. Trendanalist bevat de onderstaande functionaliteit om trends te presenteren. Ook het trendpalet is een informatieve vorm voor het presenteren van trendanalyseresultaten.

Google Earth

Trendanalyses op meetpunt 00599 van waterschap Zuiderzeeland

Voorbeelden van trendkaarten (van waterkwaliteit) op Internet zijn:

Geplaatst in Trendanalist | Getagged , | Reacties uitgeschakeld voor Trendkaarten waterkwaliteit

Toepassing enkele trendtoets is dat verstandig?

Is er een trend in een tijdreeks dan is het altijd de vraag of een trendtoets die trend ook als (significante) trend detecteert. Vaak wordt er één enkele trendtoets toegepast, maar kan één enkele trendtoets onder alle omstandigheden worden toegepast?

Simulaties zijn uitgevoerd voor het bepalen van de trenddetectie van zeven trendtoetsen onder verschillende omstandigheden. De trenddetectie is daarbij het percentage gedetecteerde significante trends (met 95% betrouwbaarheid) als functie van een trend. De trenddetectie is daarbij een schatting van het onderscheidend vermogen (‘power’) van een trendtoets. De zeven trendtoetsen zijn:

  1. LR: lineaire regressietoets
  2. LRs: lineaire regressietoets met verdiscontering seizoenseffecten
  3. LRa: lineaire regressietoets met verdiscontering autocorrelatie
  4. LRsa: lineaire regressietoets met verdiscontering seizoenseffecten en autocorrelatie
  5. MK: Mann-Kendalltoets
  6. MKs: Mann-Kendalltoets met verdiscontering seizoenseffecten
  7. MKsa: Mann-Kendalltoets met verdiscontering seizoenseffecten en autocorrelatie

In de onderstaande grafiek is de trenddetectie bepaald van zeven trendtoetsen bij modelsimulaties van een log-normaal proces met autocorrelatie (0.5) en seizoenseffecten, waarop lineaire trends van oplopende grootte zijn gesuperponeerd. In theorie zou bij deze omstandigheid de MKsa-trendtoets de best passende trendtoets moeten zijn.

Aangezien er geen sprake is van een normaal verdeeld proces presteren de lineaire regressietoetsen (LR*)  duidelijk minder dan de verdelingsvrije Mann-Kendall toetsen. Let op dat bij geen trend (trend=0) het percentage trenddetectie niet groter dient te zijn dan 5%; we toetsen immers met 95% betrouwbaarheid. De MKs-trendtoets verdisconteerd niet de autocorrelatie en geeft bij geen trend een trenddetectie van 20%! De LR-toets geeft bij geen trend een trenddetectie van 14% en de trenddetectie is ruim kleiner dan van de MKsa-toets, de beste passende trendtoets.

Conclusie

Een belangrijke conclusie is dat het onverstandig is om trendanalyses uit te voeren met één en dezelfde trendtoets. Is er geen sprake van een normaal verdeeld proces pas dan geen lineaire regressie toe, want één van de verdelingsvrije trendtoetsen is krachtiger. Is er sprake van autocorrelatie (zoals bij relatief hoog frequente metingen van een traag proces) pas dan niet de MKs-trendtoets toe, want dan is de kans groot dat ten onrechte een trend gedetecteerd wordt. Het uitvoeren van trendanalyses verdient maatwerk, onderzoek het onderliggende proces en kies de best passende trendtoets.

Wat is onder welke omstandigheid de beste trendtoets en hoe verhoudt die trendtoets zich tot de overige trendtoetsen? Of welke rol speelt de autocorrelatie in een tijdreeks betreffende de trenddetectie als er geen sprake is van een trend? Zie ook  ‘Trenddetectie van trendtoetsen onder verschillende omstandigheden’.

Geplaatst in Trendanalist | Getagged , | Reacties uitgeschakeld voor Toepassing enkele trendtoets is dat verstandig?

Trendanalyse op maat

Artikel gepubliceerd in Stromingen 6 maart 2012

2012_2 Trendanalyse waterkwaliteit

Powerpoint presentatie op NHV-dag

NHV

Geplaatst in Presentaties, Trendanalist | Getagged , | Reacties uitgeschakeld voor Trendanalyse op maat