Klassificering och predikation är två termer i samband med data mining. Data är viktigt för nästan hela organisationen för att öka vinsten och förstå marknaden. Vanlig data har inte mycket värde. Därför bör uppgifterna behandlas för att få användbar information. Data mining är den teknik som extraherar information från en stor mängd data. Det bidrar till att få en bred förståelse för data. Vissa tillämpningar av data mining är marknadsanalys, produktionskontroll och bedrägeribekämpning. Klassificeringen och predikationen är två termer i samband med data mining. I denna artikel diskuteras skillnaden mellan klassificering och predikation. Klassificering är processen för att identifiera kategorin eller klassmärket för den nya observation som den tillhör. Predikering är processen att identifiera de saknade eller otillgängliga numeriska data för en ny observation. Det är nyckelskillnad mellan klassificering och predikation. Predikationen gäller inte klassmärket som i klassificering.
1. Översikt och nyckelskillnad
2. Vad är klassificering
3. Vad är predikan
4. Likheter mellan klassificering och förutsägelse
5. Jämförelse vid sida vid sida - Klassificering mot förutsägelse i tabellform
6. Sammanfattning
Klassificering är att identifiera kategorin eller klassmärket för en ny observation. För det första används en uppsättning data som träningsdata. Satsen av ingångsdata och motsvarande utgångar ges till algoritmen. Således innehåller träningsdatasatsen ingångsdata och deras tillhörande klassetiketter. Med hjälp av träningsdatasetet kommer algoritmen från en modell eller klassificeringsenheten. Den härledda modellen kan vara ett beslutsträd, en matematisk formel eller ett neuralt nätverk. I klassificering, när en omärkt data ges till modellen, borde den hitta den klass som den tillhör. Den nya data som tillhandahålls till modellen är testdatasatsen.
Klassificering är processen för att klassificera en post. Ett enkelt exempel på klassificering är att kontrollera om det regnar eller inte. Svaret kan antingen vara ja eller nej. Så det finns ett visst antal val. Ibland kan det vara mer än två klass att klassificera. Det kallas multiclass klassificering. I det verkliga livet måste banken analysera huruvida att ge ett lån till en viss kund riskabelt eller inte. I det här exemplet är en modell konstruerad för att hitta den kategoriska etiketten. Etiketterna är riskfyllda eller säkra.
En annan analys av dataanalys är predikationen. Det används för att hitta en numerisk utgång. Samma som i klassificeringen innehåller träningsdatasatsen ingångarna och motsvarande numeriska utgångsvärden. Enligt träningsdatasetet kommer algoritmen att härleda modellen eller en prediktor. När den nya data ges, bör modellen hitta en numerisk utgång. Till skillnad från klassificering har denna metod inte klassmärket. Modellen förutspår en kontinuerlig värderad funktion eller beställt värde.
Regression används generellt för predikation. Förutsägande värdet av ett hus beroende på fakta som antal rum, totalt areal mm är ett exempel för predikation. Ett företag kan hitta den mängd pengar som kunden spenderar under en försäljning. Det är också ett exempel för förutsägelse.
Klassificering vs Predikation | |
Klassificering är processen för att identifiera i vilken kategori en ny observation hör till grund av en träningsdatasats som innehåller observationer vars kategorilidskap är känd. | Predikering är processen att identifiera de saknade eller otillgängliga numeriska data för en ny observation. |
Noggrannhet | |
I klassificeringen beror noggrannheten på att hitta klassmärket korrekt. | I predikation beror noggrannheten på hur bra en viss predikator kan gissa värdet på ett predikerat attribut för en ny data. |
Modell | |
En modell eller klassificeraren är konstruerad för att hitta de kategoriska etiketterna. | En modell eller en prediktor kommer att konstrueras som förutspår en kontinuerlig värderad funktion eller beställt värde. |
Synonymer för modellen | |
I klassificeringen kan modellen kallas klassificeringsenheten. | I predikation kan modellen vara känd som prediktor. |
Att extrahera meningsfull information från en stor dataset kallas data mining. I denna artikel diskuteras två metoder för dataanalys vid datautvinning, såsom klassificering och predikation. Hastigheten, skalbarheten och robustheten är betydande faktorer i klassificerings- och prediktionsmetoderna. Klassificering är processen för att identifiera kategorin eller klassmärket för den nya observation som den tillhör. Predikering är processen att identifiera de saknade eller otillgängliga numeriska data för en ny observation. Det är skillnaden mellan klassificering och predikation.
1.Point, handledning. "Data Mining Classification & Prediction.", Tutorials Point, 8 jan 2018. Tillgänglig här
2. "Statistisk klassificering". Wikipedia, Wikimedia Foundation, 6 mars 2018. Tillgänglig här
1.'2729773 'av GDJ (Public Domain) via pixabay