Skillnad mellan beslutsträd och slumpmässig skog

De huvudskillnad mellan beslutsträd och slumpmässig skog är det ett besluts träd är ett diagram som använder en förgreningsmetod för att illustrera alla möjliga resultat av ett beslut, medan en slumpmässig skog är en uppsättning beslutsträd som ger slutresultatet baserat på utgångarna från alla sina beslutsträd.

Maskininlärning är en tillämpning av artificiell intelligens, vilket ger ett system förmågan att lära sig och förbättra baserat på tidigare erfarenhet. Beslutstree och slumpmässig skog är två tekniker inom maskininlärning. Ett beslutsträd kartar de möjliga resultaten av en serie relaterade val. Det är populärt eftersom det är enkelt och lättare att förstå. När datasetet blir mycket större är det inte ett enda beslutsträd att hitta förutsägelsen. En slumpmässig skog, som är en samling besluts träd, är ett alternativ till denna fråga. Utgången från slumpmässig skog är baserad på utgångarna från alla sina beslutsträd.

Viktiga områden som omfattas

1. Vad är ett beslutsträd
- Definition, Funktionalitet, Exempel
2. Vad är en slumpmässig skog
- Definition, Funktionalitet, Exempel
3. Skillnad mellan beslutsträd och slumpmässig skog
- Jämförelse av viktiga skillnader

Nyckelbegrepp

Beslutsträd, maskinlärning, slumpmässig skog

Vad är beslut Tree

Ett besluts träd är ett diagram för träform som används för att bestämma en åtgärd. Varje gren av trädet representerar ett möjligt beslut, förekomst eller reaktion.

Det finns flera termer i samband med ett beslutsträd. Entropi är mätningen av oförutsägbarhet i datasetet. Efter att ha delat datasetet minskar entropinivån då oförutsägbarheten minskar. Informationsvinst är minskningen i entropin efter att spita datasetet. Det är viktigt att dela upp data så att informationsvinsten blir högre. De slutliga besluten eller klassificeringen kallas bladnodarna. Den översta eller huvudnoden heter rootnoden. Datasetet ska delas tills den slutliga entropin blir noll.

Ett enkelt beslutsträd är som följer.

Figur 1: Beslut Tree

Ovanstående beslutsträd klassificerar en uppsättning frukter. Det finns 4 druvor, 2 äpplen och 2 apelsiner. När man beaktar diameteren mindre än 5, kategoriseras druvorna i ena sidan medan apelsiner och äpplen i andra sidan. Druvor kan inte klassificeras ytterligare eftersom det har noll entropi. När kategoriseringen baseras på färgen, dvs. om fruktröd är röd eller ej, klassificeras äpplen i ena sidan medan apelsiner klassificeras till andra sidan. Således klassificerar detta beslutsträd ett äpple, druv eller apelsin med 100% noggrannhet.

Sammantaget är ett beslutsträd lätt att förstå, lättare att tolka och visualisera. Det kräver inte mycket databehandling. Den kan hantera både numeriska och kategoriska data. Å andra sidan kan bruset i data orsaka övermontering. Dessutom kan modellen också bli instabil tack vare små variationer.

Vad är Random Forest

Slumpmässig skog är en metod som fungerar genom att bygga flera beslutsträd under träningsfasen. De flesta av trädens beslut är det slutliga beslutet av slumpmässig skog. Ett enkelt exempel är som följer.

Antag att det finns en uppsättning frukter (körsbär, äpplen och apelsiner). Följande är de tre besluts träd som kategoriserar dessa tre frukttyper.

Figur 2: Beslutstree 1

Figur 3: Beslutstree 2

Figur 4: Besluts Tree 3

En ny frukt vars diameter är 3 ges till modellen. Denna frukt är orangefärgad och växer på sommaren. Det första beslutsträdet kategoriserar det som en apelsin. Det andra beslutsträdet kommer att kategorisera det som en körsbär medan det tredje beslutsträdet kategoriserar det som en apelsin. När man beaktar alla tre träd finns det två utgångar för orange. Därför är den slutliga utgången av slumpmässig skog en orange.

Sammantaget ger den slumpmässiga skogen exakta resultat på en större dataset. Det minskar också risken för övermontering.

Skillnad mellan beslutsträd och slumpmässig skog

Definition

Ett besluts träd är ett beslutsstödsverktyg som använder en trädlik graf eller beslutsmodell och deras möjliga konsekvenser, inklusive eventuella händelseresultat, resurskostnader och nytta. Slumpmässiga skogar är en ensemble inlärningsmetod som fungerar genom att bygga en mängd beslutsträd på träningstiden och utföra klassen beroende på de enskilda träden.

overfitting

Det finns möjlighet till överfitting i ett beslutsträd. Användningen av flera träd i slumpmässig skog minskar risken för överfitting.

Noggrannhet

En slumpmässig skog ger mer exakta resultat än ett beslutsträd.

Komplexitet

Ett beslutsträd är enklare och lättare att förstå, tolka och visualisera än en slumpmässig skog, som är relativt mer komplex.

Slutsats

Skillnaden mellan beslutsträd och slumpmässig skog är att ett beslutsträva är ett diagram som använder en förgreningsmetod för att illustrera alla möjliga resultat av ett beslut medan en slumpmässig skog är en uppsättning beslutsträd som ger slutresultatet baserat på utgångarna från alla dess beslut träd.

Referens:

1. Slumpmässig skogsalgoritm - Slumpmässig skogsförklaring | Slumpmässig skog i maskinlärande , Simplilearn, 12 Mars 2018, Tillgänglig här.

Teknologi