Varians vs Covariance
Varians och kovarians är två åtgärder som används i statistiken. Varians är ett mått på dataspridningen, och kovarians anger graden av förändring av två slumpmässiga variabler tillsammans. Varians är snarare ett intuitivt koncept, men kovarians definieras matematiskt i inte det intuitiva först.
Mer om Varians
Varians är ett mått på dispersion av data från fördelningens medelvärde. Det berättar hur långt datapunkterna ligger från medelvärdet av distributionen. Det är en av de primära deskriptorerna för sannolikhetsfördelningen och en av distributionens stunder. Variationen är också en parameter för befolkningen, och variansen av ett urval ur befolkningen fungerar som en beräkningsberäknare för befolkningens varians. Ur ett perspektiv definieras det som kvadraten av standardavvikelsen.
I vanligt språk kan det beskrivas som medelvärdet av kvadraterna av avståndet mellan varje datapunkt och distributionsmedlet. Följande formel används för att beräkna variansen.
Var (X) = E [(X-μ)2 ] för en befolkning, och
Var (X) = E [(X-~x)2 ] för ett prov
Det kan vidare förenklas för att ge Var (X) = E [X2 ]-(EX])2.
Varians har några signaturegenskaper, och används ofta i statistiken för att göra användningen enklare. Variansen är icke-negativ eftersom det är kvadraten av avstånden. Variansen varierar emellertid inte och beror på den särskilda fördelningen. Variansen hos en konstant slumpmässig variabel är noll, och variansen ändras inte med avseende på en lokaliseringsparameter.
Mer om Covariance
I statistisk teori är kovarians ett mått på hur mycket två slumpmässiga variabler förändras ihop. Med andra ord är kovarians ett mått på styrkan i korrelationen mellan två slumpmässiga variabler. Det kan också betraktas som en generalisering av begreppet varians av två slumpmässiga variabler.
Covarians av två slumpmässiga variabler X och Y, som är gemensamt fördelade med ändliga andra momentum, är känd som σXY= E [(X-E [X]) (Y-E [Y])]. Från detta kan varians ses som ett speciellt fall av kovarians, där två variabler är desamma. Cov (X, X) = Var (X)
Genom normalisering av kovariansen kan den linjära korrelationskoefficienten eller Pearsons korrelationskoefficient erhållas, vilken definieras som p = E [(X-E [X]) (Y-E [Y])] / (σX σY ) = (Cov (X, Y)) / (aX σY)
Grafiskt kan kovarians mellan ett par datapunkter ses som rektangelens område med datapunkterna i motsatta hörn. Det kan tolkas som en mått på separationsnivån mellan de två datapunkterna. Med tanke på rektanglarna för hela befolkningen kan överlappningen av rektanglarna som motsvarar alla datapunkter betraktas som separationsstyrkan. varians av de två variablerna. Covarians är i två dimensioner, på grund av två variabler, men att förenkla den till en variabel ger variansen av en singel som separationen i en dimension.
Vad är skillnaden mellan Varians och Covariance?
• Varians är måttet på spridning / dispersion i en population medan kovarians anses vara ett mått på variation av två slumpmässiga variabler eller korrelationsstyrkan.
• Varians kan betraktas som ett speciellt fall av kovarians.
• Varians och kovarians är beroende av datavärdenas storlek och kan inte jämföras. därför normaliseras de. Covarians normaliseras i korrelationskoefficienten (dividerar med produkten av standardavvikelserna för de två slumpmässiga variablerna) och variansen normaliseras till standardavvikelsen (genom att ta kvadratroten)