De huvudskillnad mellan beslutsträd och slumpmässig skog är det ett besluts träd är ett diagram som använder en förgreningsmetod för att illustrera alla möjliga resultat av ett beslut, medan en slumpmässig skog är en uppsättning beslutsträd som ger slutresultatet baserat på utgångarna från alla sina beslutsträd.
Maskininlärning är en tillämpning av artificiell intelligens, vilket ger ett system förmågan att lära sig och förbättra baserat på tidigare erfarenhet. Beslutstree och slumpmässig skog är två tekniker inom maskininlärning. Ett beslutsträd kartar de möjliga resultaten av en serie relaterade val. Det är populärt eftersom det är enkelt och lättare att förstå. När datasetet blir mycket större är det inte ett enda beslutsträd att hitta förutsägelsen. En slumpmässig skog, som är en samling besluts träd, är ett alternativ till denna fråga. Utgången från slumpmässig skog är baserad på utgångarna från alla sina beslutsträd.
1. Vad är ett beslutsträd
- Definition, Funktionalitet, Exempel
2. Vad är en slumpmässig skog
- Definition, Funktionalitet, Exempel
3. Skillnad mellan beslutsträd och slumpmässig skog
- Jämförelse av viktiga skillnader
Beslutsträd, maskinlärning, slumpmässig skog
Ett besluts träd är ett diagram för träform som används för att bestämma en åtgärd. Varje gren av trädet representerar ett möjligt beslut, förekomst eller reaktion.
Det finns flera termer i samband med ett beslutsträd. Entropi är mätningen av oförutsägbarhet i datasetet. Efter att ha delat datasetet minskar entropinivån då oförutsägbarheten minskar. Informationsvinst är minskningen i entropin efter att spita datasetet. Det är viktigt att dela upp data så att informationsvinsten blir högre. De slutliga besluten eller klassificeringen kallas bladnodarna. Den översta eller huvudnoden heter rootnoden. Datasetet ska delas tills den slutliga entropin blir noll.
Ett enkelt beslutsträd är som följer.
Figur 1: Beslut Tree
Ovanstående beslutsträd klassificerar en uppsättning frukter. Det finns 4 druvor, 2 äpplen och 2 apelsiner. När man beaktar diameteren mindre än 5, kategoriseras druvorna i ena sidan medan apelsiner och äpplen i andra sidan. Druvor kan inte klassificeras ytterligare eftersom det har noll entropi. När kategoriseringen baseras på färgen, dvs. om fruktröd är röd eller ej, klassificeras äpplen i ena sidan medan apelsiner klassificeras till andra sidan. Således klassificerar detta beslutsträd ett äpple, druv eller apelsin med 100% noggrannhet.
Sammantaget är ett beslutsträd lätt att förstå, lättare att tolka och visualisera. Det kräver inte mycket databehandling. Den kan hantera både numeriska och kategoriska data. Å andra sidan kan bruset i data orsaka övermontering. Dessutom kan modellen också bli instabil tack vare små variationer.
Slumpmässig skog är en metod som fungerar genom att bygga flera beslutsträd under träningsfasen. De flesta av trädens beslut är det slutliga beslutet av slumpmässig skog. Ett enkelt exempel är som följer.
Antag att det finns en uppsättning frukter (körsbär, äpplen och apelsiner). Följande är de tre besluts träd som kategoriserar dessa tre frukttyper.
Figur 2: Beslutstree 1
Figur 3: Beslutstree 2
Figur 4: Besluts Tree 3
En ny frukt vars diameter är 3 ges till modellen. Denna frukt är orangefärgad och växer på sommaren. Det första beslutsträdet kategoriserar det som en apelsin. Det andra beslutsträdet kommer att kategorisera det som en körsbär medan det tredje beslutsträdet kategoriserar det som en apelsin. När man beaktar alla tre träd finns det två utgångar för orange. Därför är den slutliga utgången av slumpmässig skog en orange.
Sammantaget ger den slumpmässiga skogen exakta resultat på en större dataset. Det minskar också risken för övermontering.
Ett besluts träd är ett beslutsstödsverktyg som använder en trädlik graf eller beslutsmodell och deras möjliga konsekvenser, inklusive eventuella händelseresultat, resurskostnader och nytta. Slumpmässiga skogar är en ensemble inlärningsmetod som fungerar genom att bygga en mängd beslutsträd på träningstiden och utföra klassen beroende på de enskilda träden.
Det finns möjlighet till överfitting i ett beslutsträd. Användningen av flera träd i slumpmässig skog minskar risken för överfitting.
En slumpmässig skog ger mer exakta resultat än ett beslutsträd.
Ett beslutsträd är enklare och lättare att förstå, tolka och visualisera än en slumpmässig skog, som är relativt mer komplex.
Skillnaden mellan beslutsträd och slumpmässig skog är att ett beslutsträva är ett diagram som använder en förgreningsmetod för att illustrera alla möjliga resultat av ett beslut medan en slumpmässig skog är en uppsättning beslutsträd som ger slutresultatet baserat på utgångarna från alla dess beslut träd.
1. Slumpmässig skogsalgoritm - Slumpmässig skogsförklaring | Slumpmässig skog i maskinlärande , Simplilearn, 12 Mars 2018, Tillgänglig här.