Linjär vs Logistisk Regression
I statistisk analys är det viktigt att identifiera relationerna mellan variabler som berörs av studien. Ibland kan det vara det enda syftet med analysen själv. Ett starkt verktyg som används för att fastställa förekomsten av förhållandet och identifiera relationen är regressionsanalys.
Den enklaste formen av regressionsanalys är den linjära regressionen, där förhållandet mellan variablerna är ett linjärt förhållande. I statistiska termer förklarar det förhållandet mellan förklaringsvariabeln och svarsvariabeln. Med hjälp av regression kan vi till exempel fastställa relationen mellan råvarupriset och förbrukningen baserat på data som samlats in från ett slumpmässigt prov. Regressionsanalys kommer att producera en regressionsfunktion av datasatsen, vilken är en matematisk modell som bäst passar tillgänglig data. Detta kan lätt representeras av en scatterplot. Grafisk regression motsvarar att hitta den bästa anpassningskurvan för den givna datasatsen. Kurvens funktion är regressionsfunktionen. Med hjälp av den matematiska modellen kan användningen av en vara förutses för ett visst pris.
Därför används regressionsanalysen i stor utsträckning vid förutsägelse och prognos. Det används också för att upprätta relationerna i försöksdata, inom fysik, kemi och i många naturvetenskapliga och tekniska discipliner. Om förhållandet eller regressionsfunktionen är en linjär funktion är processen känd som en linjär regression. I scatterplot kan den representeras som en rak linje. Om funktionen inte är en linjär kombination av parametrarna är regressionen icke-linjär.
Logistisk regression kan jämföras med multivariat regression, och det skapar en modell för att förklara effekterna av flera prediktorer på en svarsvariabel. I logistisk regression bör slutresultatet variabeln vara kategorisk (vanligtvis delad, dvs ett par uppnåbara resultat, som död eller överlevnad, men speciella tekniker gör att mer kategoriserad information kan modelleras). En kontinuerlig utfallsvariabel kan omvandlas till en kategorisk variabel som ska användas för logistisk regression; Kollapserande kontinuerliga variabler på detta sätt är emellertid vanligen avskräckta eftersom det minskar noggrannheten.
Till skillnad från i linjär regression behöver medelvärdena i logistisk regression i motsats inte vara tvungna att vara linjärt anslutna, vanligen distribuerade eller för att ha lika variation inom varje kluster. Som ett resultat är relationen mellan prediktor och resultatvariabler sannolikt inte en linjär funktion.
Vad är skillnaden mellan logistisk och linjär regression?
• I linjär regression antas en linjär relation mellan förklaringsvariabeln och svarsvariabeln och parametrar som uppfyller modellen hittas genom analys för att ge det exakta förhållandet.
• Linjär regression utförs för kvantitativa variabler, och den resulterande funktionen är en kvantitativ.
• I den logistiska regressionen kan data som används vara antingen kategoriska eller kvantitativa, men resultatet är alltid kategoriskt.