Standardavvikelse vs Mean
I beskrivande och inferentiell statistik används flera index för att beskriva en datasats som motsvarar dess centrala tendens, dispersion och skevhet. I statistisk inferens är dessa vanligen kända som bedömare eftersom de uppskattar populationparametervärdena.
Central tendens hänvisar till och lokaliserar mitten av fördelningen av värden. Medel, läge och median är de vanligaste indexen för att beskriva den centrala tendensen för en dataset. Dispersion är mängden dataöverföring från distributionscentrum. Räckvidd och standardavvikelse är de mest använda sprutåtgärderna. Pearsons skevhetskoefficienter används för att beskriva skevheten hos en fördelning av data. Här hänvisar skevhet till huruvida datasatsen är symmetrisk om mitten eller inte och om inte hur vred det är.
Vad är medelvärdet?
Medel är det vanligaste indexet för central tendensen. Med en dataset beräknas medelvärdet genom att summan av alla datavärden delas och sedan divideras med antalet data. Exempelvis mäts vikterna på 10 personer (i kilo) till 70, 62, 65, 72, 80, 70, 63, 72, 77 och 79. Då kan de tio människornas medelvikt (i kilogram) vara beräknad enligt följande. Summan av vikterna är 70 + 62 + 65 + 72 + 80 + 70 + 63 + 72 + 77 + 79 = 710. Medel = (summa) / (antal data) = 710/10 = 71 (i kilogram).
Som i det här speciella exemplet är medelvärdet för en datamängd kanske inte en datapunkt för uppsättningen men kommer att vara unik för en viss dataset. Medel kommer att ha samma enheter som originaldata. Därför kan den markeras på samma axel som data och kan användas i jämförelser. Det finns också ingen teckenbegränsning för medelvärdet av en dataset. Det kan vara negativt, noll eller positivt, eftersom summan av datasatsen kan vara negativ, noll eller positiv.
Vad är standardavvikelsen?
Standardavvikelse är det mest använda indexet för dispersion. För att beräkna standardavvikelsen beräknas först avvikelserna av datavärdena från medelvärdet. Roten torget betyder avvikelser kallas standardavvikelsen.
I föregående exempel är respektive avvikelser från medelvärdet (70-71) = -1, (62-71) = -9, (65-71) = -6, (72-71) = 1, (80- 71) = 9, (70-71) = -1, (63-71) = -8, (72-71) = 1, (77-71) = 6 och (79-71) = 8. Summan av kvadrater av avvikelse är (-1) 2+ (-9)2+ (-6)2+ 12+92+ (-1)2+ (-8)2+ 12+ 62 + 82 = 366. Standardavvikelsen är √ (366/10) = 6,05 (i kg). Av detta kan man dra slutsatsen att majoriteten av data ligger i intervallet 71 ± 6,05, förutsatt att datasatsen inte är väldigt skevad, och det är verkligen så i det här exemplet.
Eftersom standardavvikelsen har samma enheter som originaldata, ger den oss ett mått på hur mycket deviated dataen är från mitten; större standardavvikelsen ökar dispersionen. Standardavvikelsen kommer också att vara ett icke-negativt värde oavsett vilken typ av data i datasatsen är.
Vad är skillnaden mellan standardavvikelse och medelvärde? • Standardavvikelse är ett mått på dispersion från mitten, medan medelvärdet mäter platsen för en datasatsens centrum. • Standardavvikelse är alltid ett nonnegative värde, men medelvärdet kan ta något verkligt värde.
|