MOVE nationaal Model voor de Vegetatie versie 3.2 Achtergronden en analyse van modelvarianten

30-09-2002 | Publicatie

Een beschrijving van het optimaliseren van de regressievergelijkingen voor MOVE 3.2. MOVE is een regressieMOdel voor de Nederlands VEgetatie. Het onderzoek is in twee fase uitgevoerd, allereerst is in deel 1 de geschiktheid van de dataset geanalyseerd en vervolgens (deel 2) zijn de optimale regressievergelijkingen afgeleid.

Uit de analyse in deel 1 is geconcludeerd dat de dataset geschikt is om te gebruiken voor het afleiden van de regressievergelijkingen. Er zijn voor het complete bereik van de variabelen gegevens aanwezig. De ruimtelijke spreiding van de gegevens over Nederland is redelijk homogeen, dit is een belangrijke voorwaarde voor het kunnen gebruiken van deze gegevens voor regressie analyse. Bij het vergelijken van de waarden van de te gebruiken variabelen met 13 willekeurig getrokken plantensoorten blijkt dat de gemiddelde waarden en de spreiding van deze variabelen goed overeenkomen met vermeldingen in Heukel's Flora van Nederland voor deze soorten.

Er is op twee manieren geprobeerd om de optimale regressievergelijking (deel 2) per plantensoort af te leiden. Bij de eerste methode is het aantal vrijheidsgraden van te voren opgelegd en worden specifieke modellen doorgerekend. In totaal zijn er op deze wijze elf verschillende modellen doorgerekend. Bij de tweede methode, de stapsgewijze regressie methode, bepaald het rekenproces, de computer, in grote mate welke modellen doorgerekend worden. Door het aangeven van het startmodel en het eindmodel is het mogelijk om enige sturing over het proces te houden. Bij de tweede methode zijn zes varianten doorgerekend. Drie varianten leverden nooit een beter model op, dus zijn er uiteindelijk drie varianten verder geanalyseerd. Vervolgens is per soort het beste model geselecteerd uit de in totaal veertien verschillende modellen.

De selectieprocedure bestaat uit drie stappen. Allereerst is gekeken naar de goodness of fit. Van de oorspronkelijk aanwezige 914 plantensoorten uit de complete dataset zijn alleen die modellen geselecteerd met een redelijke goodness of fit. Hiervoor is de Hosmer en Lemeshow-test gebruikt met een alpha van 0.05. Dit betekent dat de kans dat een model onterecht wordt afgewezen 5% is. Ten tweede is, wanneer er meerdere modellen aan deze eis voldoen, het model gekozen met de hoogste schatter . Ten derde is als extra eis gesteld dat er minimaal 1 variabele aanwezig moet zijn, die veranderlijk in de tijd is of kan zijn. Dit resulteerde in 'optimale' modellen voor 690 soorten. Voor 15 soorten leverde de goodness of fit maat geen biologisch betekenisvol model op. Voor deze soorten is het model geselecteerd dat net buiten de goodness of fit eis lag, maar alpha groter dan 0.01, en een hogere maximale kans op voorkomen heeft.

In het uiteindelijke resultaat worden alle veertien modelvarianten minimaal eenmaal gekozen. De variabelen combipaf (toxiciteit als gevolg van aanwezigheid van zware metalen), zout en vegetatietype komen het minst in de uiteindelijke modellen voor en zijn dus voor minder plantensoorten een belangrijke factor. De andere variabelen worden ongeveer even vaak gekozen.