Data samlas in överallt över hela världen. Denna stora mängd data heter Big data eller Big Data och kan inte hanteras av vanliga lagringsenheter. Hadoop programvara ram, som är en öppen källkod ramverk av Apache Software Foundation, kan användas för att övervinna detta problem. De nyckelskillnad mellan Big Data och Hadoop är det Stora data är en stor mängd komplexa data medan Hadoop är en mekanism för att lagra stora data effektivt och effektivt.
1. Översikt och nyckelskillnad
2. Vad är stora data
3. Vad är Hadoop
4. Likheter mellan Big Data och Hadoop
5. Jämförelse vid sida vid sida - Big Data vs Hadoop i tabellform
6. Sammanfattning
Data produceras dagligen och i stora mängder. Det är viktigt att lagra de samlade uppgifterna i enlighet med dem och att analysera dem för att få bättre resultat. Google samlar Facebook dagligen en stor mängd data. Att organisera data och analysera dem kan ge fördelar till organisationen. I en bank är det viktigt att analysera data för att förstå kundinformation, transaktioner, kundfrågor. Att analysera dessa data och utveckla lösningar kommer att förbättra vinsten. Detta visar att data spelar en viktig roll för en organisation att arbeta effektivt och effektivt. Eftersom data växer snabbt är relationella databaser eller vanliga lagringsenheter inte tillräckliga. Denna typ av en stor samling data som är svår att lagra och bearbeta kan betecknas som Stor data eller Stor data.
Stora data
Stora data har tre egenskaper. De är volym, hastighet och variation. För det första är stora data en stor mängd data. Dessa data kan ta volymen Giga Bytes, Tera Bytes eller ännu högre än den. Det andra attributet är hastigheten. Det är den hastighet som data genereras på. Detta är en stor egenskap vid analys av miljöförändringar och för att upptäcka flygplan. Uppgifterna ska vara korrekta och kontinuerliga i dessa situationer. Det är en stor faktor att göra beslut i realtid. En annan huvudegenskap är variation, som beskriver typen av data. Data kan ta textformat, video, ljud, bild, XML-format, sensordata, etc..
Det är en öppen källkod av Apache Software Foundation att lagra stora data i en distribuerad miljö för att bearbeta parallell. Den har en effektiv distributionslagring med en databehandlingsmekanism. Hadoop lagringssystem är känt som Hadoop Distributed File System (HDFS). Det delar upp data bland vissa maskiner. Hadoop följer master-slave arkitektur. Mästerkoden heter Namn-nod och slavar kallas Data-noder. Data distribueras bland alla Data-noder.
Huvudalgoritmen som används för att bearbeta data i Hadoop kallas Map Reduce. Med hjälp av kart-reducera program kan jobb skickas till slavnoder. Standard språk för att skriva karta-reducera program är Java, men andra språk kan också användas. Datododer eller slavnoder kommer att utföra analyseringsuppgiften och skickar resultatet tillbaka till huvudnoden / namnetoden. Master-node / name-node har en Jobb Tracker för att köra karta minska jobb på slavnoder. Slave-noder / data-noder har en Task Tracker för att slutföra dataanalysen och att skicka resultatet tillbaka till huvudnoden.
Hadoop Arkitektur
Hadoop har några fördelar. Det minskar kostnader, datakomplexitet och ökar effektiviteten. Det är lätt att lägga till en annan maskin i Hadoop-klustret.
Big Data vs Hadoop | |
Big Data är en stor samling komplexa och olika data som är svår att lagra och analysera med traditionella lagringsmetoder. | Hadoop är en programvara för att lagra och behandla stora data effektivt och effektivt. |
Betydelse | |
Stora data har inte mycket betydelse. | Hadoop kan göra stora data mer meningsfulla och är användbar för maskininlärning och statistisk analys. |
Lagring | |
Stora data är svåra att lagra eftersom den består av en mängd olika data, såsom strukturerad och ostrukturerad data. | Hadoop använder Hadoop Distributed File System (HDFS) som tillåter lagring av en mängd olika data. |
Tillgänglighet | |
Att få tillgång till stora data är svårt. | Hadoop tillåter åtkomst till och bearbetar stora data snabbare. |
Data växer snabbt. Regering och företagsorganisationer alla samlar data. Analysera data är mycket värdefullt. En enda dator räcker inte för att lagra en stor mängd data. Denna stora mängd komplexa data heter Big data. Därför kan stora data fördelas mellan vissa noder med hjälp av Hadoop. Skillnaden mellan Big Data och Hadoop är att Stor data är en stor mängd komplexa data och Hadoop är en mekanism för att lagra stora data effektivt och effektivt.
Du kan hämta PDF-versionen av den här artikeln och använda den för offlineändamål enligt citationsnotat. Var god ladda ner PDF-versionen här Skillnaden mellan Big Data och Hadoop
1. "Vad är stora data och varför det är viktigt." Vad är stora data? | SAS USA. Tillgänglig här
2.Punktet, handledning. "Hadoop - Big Data Overview." Tutorials Point, 15 aug 2017. Tillgänglig här
3.Punktet, handledning. "Big Data Analytics Översikt." Tutorials Point, 15 aug 2017. Tillgänglig här
4. "Vad är skillnaden mellan stora data och Hadoop?" Techopedia.com. Tillgänglig här
5.thippireddybharath. "Big Data and Hadoop Quick Introduktion." YouTube, YouTube, 12 augusti 2014. Tillgänglig här
1.'BigData 2267 × 1146 trasparent 'Av Camelia.boban - Egent arbete, (CC BY-SA 3.0) via Commons Wikimedia