Regressie Analyse uitleg

Regressie Analyse

Wat is regressie analyse? Hier volgt een eenvoudige uitleg over wat Regressie Analyse in de statistiek inhoudt. Hierbij wordt uitgegaan dat je een regressie analyse met het statistiek programma SPSS uitvoert. Verder worden er voorbeelden van regressie analyses gegeven en wanneer je een regressie analyse zou moeten gebruiken.

Regressie analyse uitleg
Regressie analyse is een techniek uit de statistiek voor het analyseren van data gegevens waarin mogelijk sprake is van een samenhang, aangeduid als regressie. Een regressie analyse bestaat uit onafhankelijke variabelen en 1 of meerdere afhankelijke variabelen. De onafhankelijke variabelen worden de independent variables of predictors (voorspellers) genoemd van de afhankelijke variabele (y-variabele).
Als er sprake is van 1 onafhankelijke en 1 afhankelijke variabele spreken we van een simple regression of enkelvoudige regressie. Bij meer variabelen spreek je van een meervoudige regressie. Door middel van de regressie analyse kun je dus een bepaalde afhankelijke variabele voorspellen door middel van de onafhankelijke variabelen die je kiest. Vervolgens rekent SPSS voor je uit hoeveel procent van de veranderingen in jouw y-variabele wordt verklaard door jouw gekozen variabelen. Tevens zie je welke variabelen wel en geen significante invloed hebben. Lees hieronder verder over hoe je dat moet aflezen.

Regressie analyse in SPSS
Voer eerst een regressie analyse uit door in SPSS: Analyse -> Regression -> Linear te klikken. Vul bovenin de afhankelijke variabele in (de variabele die je wilt verklaren) en daaronder 1 of meerdere onafhankelijke variabelen, die de voorspellers in het model worden.
Als je dan op OK hebt geklikt krijg je in de output een aantal tabellen te zien.
Let daarbij op de volgende zaken.
- hoe hoog is de R-kwadraat (model summary)? Als de R-square 0,314 is betekent dat 31,4% van de variatie in de afhankelijke y-variabele wordt verklaard door de onafhankelijke variabelen die je hebt gekozen.
- bekijk voor elke variabele in de coefficients tabel of er een significant verband is met de y-variabele. Indien de Sig. waarde (meest rechtse kolom) ,05 of lager is betekent dat deze variabele significante invloed uitoefent in het model op de y-variabele.

Je moet het coefficients tabel aflezen als een formule die jouw y variabele voorspelt, waarbij de constante waarde het beginpunt van de denkbeeldige bijbehorende grafiek zou zijn. Y = (constant) + b1 x variabele1 + b2 x variabele2 + b3 x variabele3. Het getal voor de B-waarden (1e kolom) kun je zo aflezen en invullen. Neem hiervoor alleen de significante waarden (<0,05).
Deze waarden kunnen positief of negatief zijn. Negatieve waarden betekenen dat bij een stijging van de variabele, de afhankelijke variabele afneemt en andersom (+ – en – +). Positieve waarden hebben als resultaat dat als de variabele stijgt, stijgt de y-variabele ook. Dus bij 1 punt stijging van de variabele, stijgt de y-variabele met de b-waarde uit je tabel.

Voorbeelden Regressie Analyse
Stel je wil het cijfer voor het halen van een tentamen voorspellen (fictief). De hoogte van het cijfer is bij deze jouw y-variabele. Vervolgens ga je onderzoeken welke voorspellers (onafhankelijke variabelen) er zijn die hier invloed op zouden kunnen hebben.
Stel dat je hiervoor de volgende variabelen voor zou kiezen: aantal uur studeertijd, aantal gevolgde colleges en de mate waarin je opgelet hebt tijdens de colleges. Stel je hebt hier een dataset voor van studenten die een vragenlijstje hebben ingevuld. Dan stop je dus hoogte van het cijfer als y-variabele in je regressie analyse en de drie genoemde variabelen als onafhankelijke variabelen. Vervolgens lees je de tabellen af. De R-kwadraat is 0,62. Dat houdt in dat 62% van de variatie in de hoogte van het cijfer wordt verklaard door onze variabelen.
Stel dat alle drie de variabelen significant zijn (Sig = <0,05). Verder zien we dat de (constant) 1,542 is en de variabelen beta waarden hebben van 0,089 en 0,405 en 0,231.  Dan wordt je formule Y (hoogte cijfer) = 1,542 + 0,089 x aantal uur studeren + 0,405 x aantal gevolgde colleges + 0,231 x mate van opletten tijdens colleges.

Dan is dit jouw model en verklaar je dus voor een groot deel de hoogte van je cijfer voor het tentamen. Er blijft echter nog wel 38% onverklaard. Dit zouden factoren kunnen zijn waar je niet aan hebt gedacht. Hier hoef je niet druk over te maken, want als je in je onderzoeksmodel iets bedacht hebt is dit je resultaat, hoe hoog of laag je R-kwadraat ook is. Mooier is natuurlijk wel als je regressie analyse significant is met een hoge R-kwadraat (van bijvoorbeeld minimaal 0,5). Er zijn geen regels voor, maar de helft verklaren van je y-variabele is toch wel gewensd.

Gevaren van Regressie Analyse
Deze uitleg geeft de meest eenvoudige vorm van een regressie analyse zien. Er bestaan nog allerlei gevaren zoals multicollineariteit (waarbij de onafhankelijke variabelen elkaar onderling beinvloeden, de variabelen mogen onderling geen te hoge correlatie met elkaar hebben).

Meer ingewikkelde regressie analyses
Ook is het mogelijk om een moderator of mediator in je model te plaatsen. Het meten van een significante moderator of mediator doe je eveneens met een regressie analyse door middel van een moderatie analyse of een mediatie analyse.

VN:F [1.9.22_1171]
Rating: 9.2/10 (5 votes cast)
Regressie Analyse uitleg, 9.2 out of 10 based on 5 ratings
Tags: , ,