Sidor
▼
torsdag 12 april 2012
Om Korrelation
Vad är då korrelation? Ja, kortfattat kan man säga att det är en fråga om matematiskt samband mellan olika observationer. Säg till exempel att vi plockar fram statistik över:
a) Antal bilar i Sverige från år 1900 till år 1950
b) Antal trafikolyckor i Sverige under samma period.
Förmodligen skulle vi upptäcka att dessa siffror följs åt. Det finns ett samband och detta går att räkna ut rent matematiskt. Det resultat man då får kallas Korrelationskoefficient. Detta är en siffra som kan ha värden mellan -1 och +1.
Ju närmre noll desto mindre samband. En positiv siffra ger ett positivt samband. En negativ siffra ger ett negativt samband. Förmodligen skulle siffran bli väldigt nära +1 i ovanstående exempel.
Låt oss nu leka med ytterligare ett påhittat exempel. Vi behåller (a) från ovan men nu ska vi jämföra med något helt annat:
a) Antal bilar i Sverige från år 1900 till år 1950
b) Produktionen av spannmål i Pakistan under samma period
Skulle korrelationen här bli positiv så skulle det ju finnas ett samband som säger att dessa följs åt. Skulle det bli noll så skulle det betyda att det inte fanns något samband. Skulle det bli en negativ siffra så skulle detta innebära att ju fler bilar ju sämre skördar eller ju sämre skördar desto fler bilar.
Korrelationen kan ju inte tala om vad som är orsak och verkan. Den intressanta frågan är då - finns det något verkligt samband? Skulle man t.ex. kunna säga att om vi minskade antalet bilar i Sverige så skulle skördarna bli bättre i Pakistan? Förmodligen inte. Hög korrelation kan bero på tre saker:
1) En slump
2) En tredje faktor som påverkar båda observationerna
3) Ett verkligt samband
Nummer 1 kan vi inte göra något åt ... Här krävs ytterligare en undersökning.
Nummer 2 är mycket viktig. Här hamnar t.ex. argument från populisthögern som vill peka på ett samband mellan invandring och kriminalitet. Detta samband baserar man helt på statistiskt material. Utan att se till ytterligare faktorer som utanförskap, fattigdom och internationell kriminalitet. För att nu ta några exempel.
Nummer 3 ska jag återkomma till i nästa inlägg. En hög korrelation kan vara en indikation på ett samband. Men sambandet måste då ses som en kausaliter (en fråga om orsak och verkan).Och det är en fråga för filosofin.
(Att bli fortsättad...)
Å, något för mig alltså!
SvaraRaderaÖnskar att fler förstod det här! Det är fascinerande med samband... Jag älskar statistik, och älskar ännu mer att plocka sönder argument som någon tror sig ha grundat på statistik. ;-)
SvaraRaderaTack... orden värmer
SvaraRaderaAtt däremot sätt sig in i det filosofiska begreppet "orsak och verkan" var betydligt svårare än jag trodde.
Uppföljning kommer - jag vet bara inte när.