Regression mot ANOVA
Regression och ANOVA (Variansanalys) är två metoder i statistisk teori för att analysera beteendet hos en variabel jämfört med en annan. I regression är det ofta variationen av beroende variabel baserat på oberoende variabel medan i ANOVA det är variationen av attributen hos två prover från två populationer.
Mer om regression
Regression är en statistisk metod som används för att rita förhållandet mellan två variabler. Ofta när data samlas in kan det finnas variabler som är beroende av andra. Det exakta förhållandet mellan dessa variabler kan endast fastställas genom regressionsmetoder. Att bestämma detta förhållande hjälper till att förstå och förutsäga beteendet hos en variabel till den andra.
Den vanligaste tillämpningen av regressionsanalysen är att uppskatta värdet av den beroende variabeln för ett givet värde eller värdeintervall för de beroende variablerna. Med hjälp av regression kan vi till exempel fastställa relationen mellan råvarupriset och konsumtionen baserat på de data som samlats in från ett slumpmässigt prov. Regressionsanalys kommer att producera en regressionsfunktion av datasatsen, vilken är en matematisk modell som bäst passar tillgänglig data. Detta kan lätt representeras av en scatterplot. Grafisk regression motsvarar att man finner den bästa anpassningskurvan för den givna datasatsen. Kurvens funktion är regressionsfunktionen. Med hjälp av den matematiska modellen kan användningen av en vara förutsägas för ett visst pris.
Därför används regressionsanalysen i stor utsträckning vid förutsägelse och prognos. Det används också för att upprätta relationer i experimentdata, inom fysik, kemi och många naturvetenskapliga och tekniska discipliner. Om förhållandet eller regressionsfunktionen är en linjär funktion är processen känd som en linjär regression. I scatterplot kan den representeras som en rak linje. Om funktionen inte är en linjär kombination av parametrarna är regressionen icke-linjär.
Mer om ANOVA (Variansanalys)
ANOVA innebär inte en analys av en relation mellan två eller flera variabler uttryckligen. Det kontrolleras snarare om två eller flera prover från olika populationer har samma medelvärde. Tänk exempel på provresultatet av en tentamen för en betyg i skolan. Även om testen är annorlunda kan prestanda vara lika från klass till klass. En metod att verifiera detta är genom att jämföra medelstora klasser. ANOVA eller ANALYS av varians tillåter denna hypotes att testas. I grunden kan ANOVA betraktas som en förlängning av t-testet, där medelvärdet för de två proverna som dras från två populationer jämförs.
Grundläggande idén om ANOVA är att överväga variationen i provet och variationen mellan proven. Variationen i provet kan hänföras till slumpmässigheten, medan variationen mellan prover kan hänföras till både slumpmässighet och andra externa faktorer. Variationsanalys baseras på tre modeller; fast effekter modell, slumpmässiga effekter modell och blandade effekter modell.
Vad är skillnaden mellan regression och ANOVA?
• ANOVA är analysen av variation mellan två eller flera prover medan regression är analys av en relation mellan två eller flera variabler.
• ANOVA-teorin tillämpas med hjälp av tre basmodeller (fast effektmodell, slumpmässig effektmodell och blandad effektmodell) medan regression tillämpas med hjälp av två modeller (linjär regressionsmodell och multipel regressionsmodell).
• ANOVA och regression är båda två versioner av den allmänna linjära modellen (GLM). ANOVA är baserad på kategoriska prediktorvariabler, medan regression baseras på kvantitativa prediktorvariabler.
• Regression är den mer flexibla tekniken och används för prognoser och förutsägelser medan ANOVA används för att jämföra jämställdheten hos två eller flera populationer.