De wezenlijke verschillen tussen de PIRFICT- en de BJTR-methode

In de STOWA handleiding tijdreeksanalyse is een scheiding aangebracht tussen twee methoden van tijdreeksanalyse de PIRFICT- en de BJTR-modellering. Was die scheiding noodzakelijk?

De wezenlijke verschillen tussen de PIRFICT- en de BJTR-modellering zijn:

  • Niet-equidistante modellering versus equidistante modellering van meetreeksen. Bij niet-equidistante modellering is er geen verwerking van de meetreeksen nodig bij equidistante modellering kunnen daarentegen statistische analyses uitgevoerd worden.
  • Een indirecte schattingsroutine versus een directe schattingsroutine, zie onderstaand schema in figuur 1.
  • Verificatie op basis van ‘goodness-of-fit’ en plausibiliteit versus ‘goodness-of-use’, maten voor de pasvorm, zoals maximalisatie R2 en EVP, versus bruikbaarheid door het voldoen aan statistische randvoorwaarden, zoals witte ruis en minimalisatie modelresiduen (a(t)) .
  • Geen identificatie maar een klasse  van voorgedefinieerde functies versus modelidentificatie van een klasse passende modellen, zoals Box-Jenkins of voorgedefinieerde functies.
  • AR(1)-ruismodel versus een uitgebreid ARMA(*,*)-ruismodel om ook bij hoogfrequente tijdreeksmodellering te voldoen aan de statistische modelvoorwaarden.
  • Modellering op dagbasis versus modellering op een tijdseenheid waarbij modellen voldoen aan de statistische modelvoorwaarden.
  • Hydrologische plausibiliteit versus rekenen met onzekerheid.

Figuur 1: Stroomschema modelparameteroptimalisatie indirecte methode van PIRFICT (Hydromonitor/Menyanthes en PASTAS) en de directe methode van BJTR (Tijdreeksanalist)

Stroomschema modelparameteroptimalisatie

Bij de PIRFICT-modellering (Hydromonitor/Menyanthes en PASTAS) met toepassing van een ruismodel wordt bij een parameterset ϑ eerst de ‘residuals’ N(t|ϑ) bepaald en uit de N(t|ϑ) worden vervolgens de ‘noise’ e(t|ϑ) berekend. Bij BJTR-modellering (Tijdreeksanalist) is de ruis N(t|ϑ) een latente variabele en herschreven als een som van de residuen a(t|ϑ). De ruis is daarmee, als de residuen niet gecorreleerd zijn, niet gecorreleerd met het deterministische deel (detmodel) van het model. De ‘noise’ e(t|ϑ) en de residuen a(t|ϑ) verschillen en daarmee de schatting van de parameterset ϑ. De directe schattingsroutine van de BJTR-modellering is optimaal, de indirecte schattingsroutine van de PIRFICT-modellering geeft onzuivere schattingen.

Een veel genoemd verschil is fysisch versus statistisch. Dit is echter een synthetisch verschil. Het principe is altijd dat parameters van een tijdreeksmodel op basis van data geoptimaliseerd worden en het is altijd van belang om het tijdreeksmodel zo goed mogelijk te kiezen afhankelijk van het onderzoeksdoel. Bij het optimaliseren van een model moet er altijd voldaan worden aan wiskundige/statistische voorwaarden van een bruikbaar model. Een hydrologisch/fysisch model wordt dan ook stochastisch en daarbij past het rekenen met onzekerheid.

De EVP is een belangrijke ‘Goodness-of fit’-maat voor de modelkeuze bij PIRFICT. De EVP wordt voorgesteld als de ‘verklaarde variantie’ van het deterministische deel van het tijdreeksmodel. Deze maat gaat uit van geen correlatie tussen het deterministische deel en de ruis N(t|ϑ). Vooral bij hoogfrequente tijdreeksanalyse is er bij PIRFICT veelal sprake van een positieve correlatie en daarmee wordt de EVP overschat. Een bekend fenomeen is dat het ruismodel schadelijk is voor de EVP, dit wordt echter veroorzaakt door de indirecte schattingsroutine (zie bovenstaande figuur). Bij de BJTR-methode is dit niet het geval en is het ruismodel daarentegen van wezenlijk belang om ook bij hoogfrequente tijdreeksanalyse te voldoen aan de statistische modelvoorwaarden voor het bepalen van zuivere schattingen.

Zie ook valkuil hoogfrequente tijdreeksanalyse en de Python-notebook ‘Hoezo Plausibel?’ (wordt binnenkort beschikbaar gesteld). De notebook toont uitkomsten van de PASTAS-PIRFICT-modellering zonder en met toepassing van het ruismodel als de werkelijkheid anders is dan een voorgedefinieerde functie, zoals de Gamma- of exponentiële verdelingsfunctie. Aan de orde komt modelverificatie, zuiverheid, bezettingsgraad en andere zaken die van belang zijn bij het testen van de goede werking van een tijdreeksmodel. 

Dit bericht is geplaatst in Tijdreeksanalist. Bookmark de permalink.