De wezenlijke verschillen tussen de Pirfict- en de BJTR-methode

In de STOWA handleiding tijdreeksanalyse is een scheiding aangebracht tussen twee methoden van tijdreeksanalyse de Pirfict- en de BJTR-modellering. Was die scheiding noodzakelijk?

De wezenlijke verschillen tussen de Pirfict- en de BJTR-modellering zijn:

  • Niet-equidistante modellering versus equidistante modellering van meetreeksen. Bij niet-equidistante modellering is er geen verwerking van de meetreeksen nodig bij equidistante modellering kunnen daarentegen statistische analyses uitgevoerd worden.
  • Een indirecte schattingsroutine versus een directe schattingsroutine, zie onderstaand schema in figuur 1.
  • Verificatie op basis van ‘goodness-of-fit’ en plausibiliteit versus ‘goodness-of-use’, maten voor de pasvorm, zoals de EVP, versus statistische modelvoorwaarden, zoals witte ruis en andere statistische modelspecificaties.
  • Geen identificatie maar een klasse  van voorgedefinieerde functies versus identificatie van een klasse passende modellen, zoals Box-Jenkins of voorgedefinieerde functies.
  • AR(1)-ruismodel versus een uitgebreid ARMA(*,*)-ruismodel om ook bij hoogfrequente tijdreeksmodellering te voldoen aan de statistische modelvoorwaarden.
  • Modellering op dagbasis versus modellering op een tijdseenheid waarbij modellen voldoen aan de statistische modelvoorwaarden.

Figuur 1: Stroomschema modelparameteroptimalisatie indirecte methode van Pirfict en de directe methode van BJTR (Tijdreeksanalist)

Bij de Pirfict-modellering met toepassing van een ruismodel wordt bij een parameterset ϑ eerst de ‘residuals’ N(t|ϑ) bepaald en uit de N(t|ϑ) worden vervolgens de ‘noise’ e(t|ϑ) berekend. Bij BJTR-modellering is de ruis N(t|ϑ) een latente variabele en herschreven als een som van de residuen a(t|ϑ). De ruis is daarmee, als de residuen niet gecorreleerd zijn, niet gecorreleerd met het deterministische deel (detmodel) van het model. De ‘noise’ e(t|ϑ) en de residuen a(t|ϑ) verschillen en daarmee de schatting van de parameterset ϑ. De directe schattingsroutine van de BJTR-modellering is optimaal, de indirecte schattingsroutine van de Pirfict-modellering geeft onzuivere schattingen.

Een veel genoemd verschil is fysisch versus statistisch. Dit is echter een synthetisch verschil. Het principe is altijd dat een tijdreeksmodel op basis van data geoptimaliseerd moet worden (het fitten van een model aan data) en het is altijd van belang om het tijdreeksmodel zo goed mogelijk te kiezen afhankelijk van het onderzoeksdoel. Bij het fitten van een model moet er altijd voldaan worden aan wiskundige /statistische voorwaarden van een goed model. Een fysisch model wordt dan ook stochastisch.

De EVP is een belangrijke ‘Goodness-of fit’-maat voor de modelkeuze bij Pirfict. De EVP wordt voorgesteld als de ‘verklaarde variantie’ van het deterministische deel van het tijdreeksmodel. Deze maat gaat uit van geen correlatie tussen het deterministische deel en de ruis N(t|ϑ). Vooral bij hoogfrequente tijdreeksanalyse is er bij Pirfict veelal sprake van een positieve correlatie en daarmee wordt de EVP overschat. Een bekend fenomeen is dat het ruismodel schadelijk is voor de EVP, maar dit wordt veroorzaakt door de indirecte schattingsroutine (zie bovenstaande figuur).

Zie ook valkuil hoogfrequente tijdreeksanalyse en de Notebook ‘Hoezo Plausibel?’ (om de notebook in een browser te bekijken). De notebook toont uitkomsten van de PASTAS-Pirfict-modellering zonder en met toepassing van het ruismodel als de werkelijkheid anders is dan een voorgedefinieerde functie, zoals de Gamma- of exponentiële verdelingsfunctie. Aan de orde komt modelverificatie, zuiverheid, bezettingsgraad en andere zaken die van belang zijn bij het testen van de Pirfict-modellering. 

Dit bericht is geplaatst in Tijdreeksanalist. Bookmark de permalink.