Korrelation mot Covariance
Korrelation och kovarians är nära besläktade begrepp i teoretisk statistik. De är viktiga för att bestämma förhållandet mellan två slumpmässiga variabler.
Vad är korrelation?
Korrelation är ett mått på styrkan i förhållandet mellan två variabler. Korrelationskoefficienten kvantifierar graden av förändring av en variabel baserat på förändringen av den andra variabeln. I statistiken är korrelationen kopplad till begreppet beroende, vilket är det statistiska sambandet mellan två variabler
Pearsons korrelationskoefficient eller bara korrelationskoefficienten r är ett värde mellan -1 och 1 (-1≤r≤ + 1). Det är den vanligaste korrelationskoefficienten och gäller endast för ett linjärt förhållande mellan variablerna. Om r = 0 finns inget förhållande, och om r≥0 är relationen direkt proportionell; värdet på en variabel ökar med ökning av den andra. Om r≤0 är förhållandet omvänt proportionellt; en variabel minskar som den andra ökar.
På grund av linjäritetstillståndet kan korrelationskoefficienten r också användas för att fastställa närvaron av ett linjärt förhållande mellan variablerna.
Vad är Covariance?
I statistisk teori är kovarians ett mått på hur mycket två slumpmässiga variabler förändras ihop. Med andra ord är kovarians ett mått på styrkan i korrelationen mellan två slumpmässiga variabler.
I ett annat perspektiv kan man se att korrelation bara är den normaliserade versionen av kovarians, där kovariansen delas av produkten av standardavvikelserna för de två slumpmässiga variablerna. Kovariansområdet kan vara stort; därför är det inte lätt att jämföra. Denna svårighet övervinns genom att bringa kovariansvärdena till ett intervall där det kan jämföras genom att normalisera det (typ av som vad z-poäng gör). Även om kovariansen och variansen är kopplade till varandra på ovanstående sätt, är deras sannolikhetsfördelningar inte enkelt kopplade till varandra och måste behandlas separat.
Vad är skillnaden mellan korrelation och Covariance?
• Både korrelation och kovarians är förhållningssätt mellan två slumpmässiga variabler. Korrelation är måttet på styrkan för de två variablernas linjäritet och kovariansen är ett mått på styrkan i korrelationen.
• Korrelationskoefficientvärdena är ett värde mellan -1 och +1, medan kovariansområdet inte är konstant, men kan antingen vara positivt eller negativt. Men om de slumpmässiga variablerna standardiseras innan kovariansen beräknas är kovariansen lika med korrelationen och har ett värde mellan -1 och +1.