Befolkning vs Prov Standard Avvikelse
I statistik används flera index för att beskriva en dataset som motsvarar dess centrala tendens, dispersion och skevhet. Standardavvikelse är en av de vanligaste åtgärderna för spridning av data från datasetets mittpunkt.
På grund av praktiska svårigheter är det inte möjligt att använda data från hela befolkningen när en hypotes testas. Därför använder vi data värden från prover för att ge slutsatser om befolkningen. I en sådan situation kallas dessa estimatorer eftersom de uppskattar populationparametervärdena.
Det är extremt viktigt att använda objektiva estimatorer i inferens. En uppskattare sägs vara opartisk om det förväntade värdet av denna estimator är lika med befolkningsparametern. Till exempel använder vi provmedlet som en obestämd bedömare för populationens medelvärde. (Matematiskt kan det visas att det förväntade värdet av provvärdet är lika med populationens medelvärde). Vid bedömning av befolkningsstandardavvikelsen är provstandardavvikelsen också en opartisk estimator.
Vad är populationens standardavvikelse??
När data från hela befolkningen kan tas i beaktande (till exempel vid en folkräkning) är det möjligt att beräkna befolkningsstandardavvikelsen. För att beräkna standardavvikelsen för befolkningen beräknas först avvikelserna av datavärdena från populationens medelvärde. Roten medelkvadrat (kvadratisk medelvärde) avvikelser kallas populationsstandardavvikelsen.
I en klass på 10 studenter kan data om eleverna enkelt samlas in. Om en hypotes är testad på denna population av studenter är det inte nödvändigt att använda provvärden. Vikten av de 10 eleverna (i kg) mäts till exempel 70, 62, 65, 72, 80, 70, 63, 72, 77 och 79. Då är de tio människornas vikt (i kilogram) (70 + 62 + 65 + 72 + 80 + 70 + 63 + 72 + 77 + 79) / 10, vilket är 71 (i kilogram). Detta är populationens medelvärde.
Nu för att beräkna befolkningsstandardavvikelsen beräknar vi avvikelser från medelvärdet. De respektive avvikelserna från medelvärdet är (70 - 71) = -1, (62 - 71) = -9, (65 - 71) = -6, (72 - 71) = 1, (80 - 71) = 9, (70-71) = -1, (63-71) = -8, (72-71) = 1, (77-71) = 6 och (79-71) = 8. Summan av kvadraten för avvikelse är -1)2 + (-9)2 + (-6)2 + 12 + 92 + (-1)2 + (-8)2 + 12 + 62 + 82 = 366. Populationens standardavvikelse är √ (366/10) = 6,05 (i kg). 71 är den exakta medelvikten för klassens elever och 6,05 är den exakta standardavvikelsen för vikt från 71.
Vad är provstandardavvikelse?
När data från ett prov (av storlek n) används för att uppskatta befolkningens parametrar beräknas provstandardavvikelsen. Först beräknas avvikelserna av datavärdena från provmedelvärdet. Eftersom provmedlet används i stället för populationsmedelvärdet (vilket är okänt) är det inte lämpligt att ta det kvadratiska medelvärdet. För att kompensera för användningen av provmedlet divideras summan av kvadrater av avvikelser med (n-1) i stället för n. Provstandardavvikelsen är kvadratroten av detta. I matematiska symboler, S = √ Σ (xjag-X)2 / (n-1), där S är provstandardavvikelsen, ẍ är provvärdet och xjags är datapunkterna.
Anta nu att befolkningen i det föregående exemplet är eleverna i hela skolan. Då är klassen bara ett prov. Om detta prov används i uppskattningen blir provstandardavvikelsen √ (366/9) = 6,38 (i kg) eftersom 366 delades med 9 istället för 10 (provstorleken). Faktum att observera är att detta inte garanteras vara det exakta befolkningsstandardvärdesavvikelsen. Det är bara en uppskattning för det.
Vad är skillnaden mellan populationens standardavvikelse och standardavvikelsen i provet? • Befolkningsstandardavvikelsen är det exakta parametervärdet som används för att mäta dispersionen från mitten, medan provstandardavvikelsen är en obestämd bedömare för den. • Befolkningsstandardavvikelsen beräknas när alla uppgifter om varje individs befolkning är kända. Annars beräknas provstandardavvikelsen. • Befolkningsstandardavvikelsen ges av σ = √ Σ (xi-μ)2/ n där μ är populationens medelvärde och n är befolkningsstorleken men provstandardavvikelsen ges av S = √ Σ (xi-ẍ)2 / (n-1) där ẍ är provvärdet och n är provstorleken.
|