Skillnad mellan datautvinning och förutsägande Analytics

De huvudskillnad mellan data mining och predictive analytics är att data mining är processen att identifiera de dolda mönstren för data med hjälp av algoritmer och gruvverktyg medan den prediktiva analysen är processen att tillämpa affärskunskap på de upptäckta mönstren för att göra förutsägelser.

Data Mining är processen att upptäcka mönstren i en stor dataset. Den extraherar nya mönster och relationer mellan dataenheter. Utgången av data mining är ett mönster som bildar en tidslinje varierande distribution. Å andra sidan är predictive analytics processen att tillämpa affärskunskap på upptäckta mönster i en dataset för att förutsäga trender och beteenden. Dessa mönster upptäcks av data mining eller med annan teknik. Affärsanalytiker och domänexperter analyserar och tolkar dem för att göra meningsfull affärsinsikt. 

Viktiga områden som omfattas

1. Vad är Data Mining
     - Definition, Användning
2. Vad är Prediktiv Analytics
     - Definition, Användning
3. Skillnad mellan datautvinning och förutsägande Analytics
      - Jämförelse av viktiga skillnader

Nyckelbegrepp

Data Mining, Predictive Analytics

Vad är Data Mining

Data mining avser processen att upptäcka mönster i en stor dataset. Det handlar om att extrahera information från en dataset och omvandla informationen till en förståelig struktur för vidare användning. Den används på många områden som matematik, cybernetik, marknadsföring mm.

Figur 1: Dataset

Data mining är förknippad med flera uppgifter såsom dataintegration, dataomvandling, mönsterutvärdering och visualisering. Data kommer från flera källor. Alla data är integrerade och lagrade på en enda plats som heter datalager. För det andra är uppgifterna förbehandlade för att göra det lämpligt att utföra datautvinning. Mönstren känns sedan igen med hjälp av algoritmer som kluster, regression etc. Slutligen utvärderas och mönstras dessa mönster med hjälp av grafer.

Dessutom finns en typ av data mining som kallas webbmining. Detta är processen att samla in information via traditionell data mining metoder och tekniker via webben. Det hjälper till att förstå faktorer som effektiviteten av en webbplats och kundbeteende. Sammantaget ger data mining möjligheten att avslöja dolda mönster i data så att de kan användas för att göra förutsägelser och ta affärsbeslut.

Vad är Prediktiv Analytics

Prediktiv analys analyserar aktuella och historiska fakta för att göra förutsägelser om framtida eller okända händelser. Den använder olika statistiska tekniker som data mining, prediktiv modellering och maskininlärning.

Figur 2: Prediktiv Analytics-process

Den prediktiva analysprocessen innefattar följande aktiviteter.

  1. Definiera projekt - Definiera projektresultat, omfattning, affärsmål och identifiera dataset som ska användas.
  2. Datainsamling - Samla data från flera källor.
  3. Dataanalys - Process för inspektion, modelleringsdata för att upptäcka användbar information.
  4. Statistisk analys - Validera antaganden, hypotes och testa dem med hjälp av statistiska modeller.
  5. Modellering - Skapa noggranna prediktiva modeller för beslutsfattande.
  6. Distribution - Använd analytiska resultat för den dagliga beslutsprocessen för att få resultat, rapporter och utdata.
  7. Modellövervakning - Hantera och övervaka modellens prestanda för att säkerställa att modellen ger de förväntade resultaten.

Prediktiv Analytics används i många fält. Det hjälper företagsorganisationer att analysera mönster som finns i historiska och transaktionsdata för att identifiera risker och möjligheter. Antag exempelvis kreditpoäng. Kundens kredithistoria, låneansökan och kunddata analyseras och bearbetas för att fatta beslut om huruvida kunden betalar kreditbetalningen i tid. Dessutom används predictive analytics inom områden som marknadsföring, finans, försäkring, detaljhandel, telekommunikation, sjukvård, sociala nätverk och så vidare.

Skillnad mellan datautvinning och förutsägande Analytics

Definition

Data mining är processen att upptäcka mönster i stor dataset med metoder för maskininlärning, statistik och databassystem. Prediktiv analys är fältet för statistik som handlar om att extrahera information från data och använda dem för att förutsäga trender och beteendemönster. Detta förklarar den grundläggande skillnaden mellan data mining och predictive analytics. 

Funktionalitet

Data mining tillämpar algoritmer som regression och klassificering på insamlade data för att upptäcka dolda mönster. Prediktiv analys tillämpar emellertid affärskunskap för upptäckta mönster för att få affärsmässiga giltiga förutsägelser.

Användande

Det finns en annan skillnad mellan data mining och predictive analytics baserat på deras användning. Medan data mining hjälper till att förstå de insamlade dataen bättre bidrar predictive analytics till att göra förutsägelser om framtida eller okända händelser.

Involverade yrken

Även om datautvinning utförs av statistiker och ingenjörer utförs predictive analytics av ​​affärsanalytiker och andra domänexperter.

Slutsats

Skillnaden mellan data mining och predictive analytics är att data mining är processen att identifiera de dolda mönstren för data med hjälp av algoritmer och gruvverktyg medan den prediktiva analysen är processen som tillämpar företagskunskaper på de upptäckta mönstren för att göra förutsägelser.

Referens:

1. "Vad är Data Mining? - Definition från WhatIs.com. "SearchSQLServer, tillgänglig här.
2. "Prediktiv Analytics." Wikipedia, Wikimedia Foundation, 26 Aug. 2018, Tillgänglig här.