Avvikelse mot standardavvikelse
Avvikelse mot standardavvikelse
I beskrivande och inferentiell statistik används flera index för att beskriva en datasats som motsvarar dess centrala tendens, dispersion och skevhet. I statistisk inferens är dessa vanligen kända som bedömare eftersom de uppskattar populationparametervärdena.
Dispersion är måttet på spridningen av data runt datasetets mittpunkt. Standardavvikelsen är en av de mest använda sprutåtgärderna. Avvikelserna för varje datapunkt från medelvärdet beaktas vid beräkning av standardavvikelsen. Därför kan man argumentera att standardavvikelsen tillsammans med medelvärdet ger en nästan tillräcklig bild om en dataset.
Tänk på följande dataset. Vikten av 10 personer (i kg) mäts till 70, 62, 65, 72, 80, 70, 63, 72, 77 och 79. Sedan är den genomsnittliga vikten av de tio personerna (i kilo) 71 (i kilogram ).
Vad är avvikelse?
I statistik menas avvikelse mängden med vilken en enda datapunkt skiljer sig från ett fast värde som medelvärdet. I allmänhet, låt k vara ett fast värde och x1,x2,..., xn beteckna en dataset. Då avvikelsen av xj från k definieras att vara (xj- k).
I ovanstående dataset är respektive avvikelser från medelvärdet (70 - 71) = -1, (62 - 71) = -9, (65 - 71) = -6, (72 - 71) = 1, (80-71) = 9, (70-71) = -1, (63-71) = -8, (72-71) = 1, (77-71) = 6 och (79-71) = 8.
Vad är standardavvikelsen?
När man kan ta hänsyn till data från hela befolkningen (till exempel vid en folkräkning), är det möjligt att beräkna befolkningsstandardavvikelsen. För att beräkna standardavvikelsen för befolkningen beräknas först avvikelserna av datavärdena från populationens medelvärde. Roten medelkvadrat (kvadratisk medelvärde) avvikelser kallas populationsstandardavvikelsen. I symboler, σ = √ Σ (xjag-μ)2 / n där μ är populationens medelvärde och n är befolkningsstorleken.
När data från ett prov (av storlek n) används för att uppskatta befolkningens parametrar beräknas provstandardavvikelsen. Först beräknas avvikelserna av datavärdena från provmedelvärdet. Eftersom provmedlet används i stället för populationsmedelvärdet (vilket är okänt) är det inte lämpligt att ta det kvadratiska medelvärdet. För att kompensera för användningen av provmedlet divideras summan av kvadraterna av avvikelser med (n-1) i stället för n. Provstandardavvikelsen är kvadratroten av detta. I matematiska symboler, S = √ Σ (xjag-X)2 / (n-1), där S är provstandardavvikelsen, ẍ är provvärdet och xi är datapunkterna.
I den föregående datamängden är summan av kvadraten av avvikelse (-1)2 + (-9)2 + (-6)2 + 12 + 92 + (-1)2 + (-8)2 + 12 + 62 + 82 = 366. Således är standardavvikelsen för befolkningen √ (366/10) = 6,05 (i kg). (Förutsatt att den aktuella befolkningen består av de 10 personer från vilka uppgifterna togs).
Vad är skillnaden mellan avvikelse och standardavvikelse? • Standardavvikelse är ett statistiskt index och en estimator, men avvikelsen är inte. • Standardavvikelse är ett mått på spridning av ett grupp av data från mitten, medan avvikelse avser den mängd med vilken en enda datapunkt skiljer sig från ett fast värde. |