Data mining mot datalagring
Data Mining och Data Warehousing är båda mycket kraftfulla och populära tekniker för att analysera data. Användare som är benägna att använda statistik använder Data Mining. De använder statistiska modeller för att leta efter dolda mönster i data. Data minare är intresserade av att hitta användbara relationer mellan olika dataelement, vilket i slutändan är lönsamt för företagen. Men å andra sidan kan dataxperter som analyserar dimensionerna av verksamheten direkt bruka använda datalager.
Data mining är också känd som Knowledge Discovery in data (KDD). Som nämnts ovan är det ett datavetenskapsområde som behandlar extraktion av tidigare okänd och intressant information från rådata. På grund av exponentiell tillväxt av data, särskilt inom områden som näringsliv, har datautvinning blivit ett mycket viktigt verktyg för att omvandla denna stora mängd data till affärsintelligens, eftersom manuell utvinning av mönster har blivit omöjligt omöjligt under de senaste decennierna. Till exempel är det för närvarande använt för olika applikationer som social nätverksanalys, bedrägeri-upptäckt och marknadsföring. Data mining handlar vanligen om följande fyra uppgifter: gruppering, klassificering, regression och association. Clustering identifierar liknande grupper från ostrukturerad data. Klassificering är lärande regler som kan tillämpas på nya data och kommer normalt att innehålla följande steg: förbehandling av data, design modellering, inlärning / funktion val och utvärdering / validering. Regression är att hitta funktioner med minimalt fel på modelldata. Och föreningen söker relationer mellan variabler. Data mining brukar användas för att svara på frågor som de viktigaste produkterna som kan bidra till att få hög vinst nästa år i Wal-Mart?
Som nämnts ovan används datalagring också för att analysera data, men av olika uppsättningar användare och ett något annat mål i åtanke. När det gäller detaljhandeln är datalagringsanvändarna mer oroade över vilka typer av inköp som är populära bland kunderna, så analysresultaten kan hjälpa kunden genom att förbättra kundupplevelsen. Men Data miners första gissning en hypotes som till exempel vilka kunder köper en viss typ av produkt och analyserar data för att testa hypotesen. Data warehousing kan utföras av en större återförsäljare som ursprungligen lagrar sina butiker med samma storlekar av produkter för att senare ta reda på att New York-butikerna säljer mindre storlek lager mycket snabbare än i Chicago butiker. Så, genom att titta på detta resultat, kan återförsäljaren lagra New York-butiken med mindre storlekar jämfört med Chicago-butiker.
Så, som du tydligt kan se, verkar dessa två typer av analys vara av samma natur för det blotta ögat. Båda gör oro för att öka vinsten baserat på historiska data. Men det finns naturligtvis viktiga skillnader. I enkla termer är Data Mining och Data Warehousing dedikerade till inredning av olika typer av analyser, men definitivt för olika typer av användare. Med andra ord söker Data Mining efter korrelationer, patter för att stödja en statistisk hypotes. Men Data Warehousing svarar en relativt bredare fråga och det skivar och tärningar data därifrån för att känna igen sätt att förbättra i framtiden.