Skillnad mellan provvariation och populationsvariation

Förklaring

I statistiken avser termen provtagning val av en del av aggregerad statistisk data för att erhålla relevant information om helheten. Sammanlagt eller hela statistisk information om en viss karaktär av alla medlemmar som omfattas av undersökningen kallas "befolkning" eller "universum". (Das, N.G., 2010). Den valda delen av befolkningen som används för att erhålla populationens eller universums egenskaper kallas som "prov". Befolkningen är gjord av enskilda enheter eller medlemmar, och några av enheterna ingår i provet. Totalt antal enheter av befolkningen kallas befolkningsstorlek, och den för provet kallas provstorlek. Befolkning och prov kan vara ändliga eller oändliga och på samma sätt kan de vara existerande eller hypotetiska.

Variation: Varians är ett numeriskt värde som visar hur mycket de enskilda siffrorna i en uppsättning data distribuerar sig om medelvärdet. Det är så långt varje tal är från medelvärdet och därmed från varandra. En varians av nollvärde betyder att alla data är identiska. Mer variansen, mer är värdena spridda om genomsnittliga, följaktligen från varandra. Mindre varians, mindre är värdena utbredda om genomsnittliga, följaktligen från varandra, och varians kan inte vara negativ.

Skillnad mellan population varians och provvariation

Huvudskillnaden mellan populationsvariation och provvariation avser beräkning av varians. Variansen beräknas i fem steg. Första medelvärdet beräknas, sedan beräknar vi avvikelser från medelvärdet, och för det tredje är avvikelserna kvadrerade, för det fjärde summeras de kvadrerade avvikelserna och slutligen delas summan av antalet poster för vilka variansen beräknas. Således varians = Σ (xi-x -) / n. Där xi = ith. Nummer, x- = medelvärde och n = antal objekt ...

Nu när variansen ska beräknas från befolkningsdata är n lika med antalet poster. Således om varians i blodtryck hos alla 1000 personer ska beräknas utifrån data på blodtryck hos alla 1000 personer, då n = 1000. Men när variansen beräknas från provdata 1 dras av från n före delning av summan av de kvadratiska avvikelserna. Således i exemplet ovan om provdata har 100 poster, skulle nämnaren vara 100-1 = 99.

På grund av detta är värdet av variansen beräknat från provdata högre än det värde som kunde ha blivit konstaterat genom att använda befolkningsdata. Logiken att göra det är att kompensera vår brist på information om befolkningsdata. Det är omöjligt att ta reda på variationer i höjder hos människor, för vår absoluta brist på information om höjder hos alla levande människor, för att inte tala om framtiden. Även om vi tar ett måttligt exempel, som befolkningsdata på höjder av alla levande män i USA är det fysiskt möjligt, men kostnaden och tiden för detta skulle besegra syftet med beräkningen. Detta är anledningen till att provdata tas för de flesta statistiska ändamål, och detta åtföljs av brist på information om majoriteten av data. För att kompensera detta är värdet av varians och standardavvikelse, som är kvadrerad variationsvräng, högre vid provdata än varians från populationsdata.

Detta fungerar som en automatisk sköld för analytikerna och beslutsfattarna. Logiken gäller beslut om kapitalbudgetning, personlig och företagsfinansiering, konstruktion, trafikledning och många tillämpliga områden. Detta hjälper stavhållaren att vara på den säkra sidan medan han fattar beslut eller för andra slutsatser.

Sammanfattning: Befolkningsvariation hänvisar till värdet av variansen som beräknas från befolkningsdata, och provvariationen är variansen beräknad från provdata. På grund av detta värde av nämnaren i formel för varians vid provdata är n-1 'och det är' n 'för befolkningsdata. Som ett resultat är både varians och standardavvikelse härledda från provdata mer än de som finns på grund av befolkningsdata.