De nyckelskillnad mellan klassificering och regressionsträd är det I klassificeringen är de beroende variablerna kategoriska och oordnade medan de i beroende av regression är de beroende variablerna kontinuerliga eller beställda hela värden.
Klassificering och regression är lärande tekniker för att skapa modeller av förutsägelse från samlad data. Båda teknikerna presenteras grafiskt som klassificerings- och regressionsträd, eller snarare flödesdiagram med datadistribution efter varje steg, eller snarare "gren" i trädet. Denna process kallas rekursiv partitionering. Fält som mining använder dessa klassificerings- och regressionsinlärningstekniker. Denna artikel fokuserar på klassificeringsträd och regressionstree.
1. Översikt och nyckelskillnad
2. Vad är klassificering
3. Vad är regression
4. Jämförelse vid sida vid sida - Klassificering mot regression i tabellform
5. Sammanfattning
Klassificering är en teknik som används för att komma fram till en schematisk tabell som visar hur data ska startas med en prekursorvariabel. De beroende variablerna är vilka som klassificerar data.
Figur 01: Data Mining
Klassificeringsträdet börjar med den oberoende variabeln, som delas ut i två grupper som bestäms av de befintliga beroende variablerna. Det är meningen att belysa svaren i form av kategorisering som orsakas av de beroende variablerna.
Regression är en prediktionsmetod som baseras på ett antaget eller känt numeriskt utgångsvärde. Detta utgångsvärde är resultatet av en serie rekursiv partitionering, där varje steg har ett numeriskt värde och en annan grupp av beroende variabler som grenar ut till ett annat par, såsom detta.
Regressionsträdet börjar med en eller flera föregångarvariabler och avslutas med en slutlig utgångsvariabel. De beroende variablerna är antingen kontinuerliga eller diskreta numeriska variabler.
Klassificering mot regression | |
En trädmodell där målvariabeln kan ta en diskret uppsättning värden. | En trädmodell där målvariabeln kan ta kontinuerliga värden, vanligtvis reella tal. |
Beroende variabel | |
För klassificeringsträdet är de beroende variablerna kategoriska. | För regressionsträdet är de beroende variablerna numeriska. |
värden | |
Har en viss mängd oordnade värden. | Har antingen diskreta men beställda värden eller indiscrete värden. |
Syftet med byggandet | |
Syftet med konstruktionen av regressionsträdet är att passa ett regressionssystem till varje determinantgren på ett sådant sätt att det förväntade utmatningsvärdet kommer upp. | Ett klassifikationsträ grenar ut som bestämt av en beroende variabel härledd från föregående nod. |
Regressions- och klassificeringsträd är användbara tekniker för att kartlägga processen som pekar på ett studerat resultat, vare sig i klassificering eller ett enda numeriskt värde. Skillnaden mellan klassificeringsträdet och regressionsträdet är deras beroende variabel. Klassificeringsträd har beroende variabler som är kategoriska och oordnade. Regressions träd har beroende variabler som är kontinuerliga värden eller beställda helvärden.
1. "Decision Tree Learning." Wikipedia, Wikimedia Foundation, 13 maj 2018. Tillgänglig här
1.Data Mining'By Arbeck - eget arbete, (CC BY 3.0) via Commons Wikimedia