Skillnad mellan RDBMS och Hadoop

De nyckelskillnad mellan RDBMS och Hadoop är att RDBMS lagrar strukturerad data medan Hadoop lagrar strukturerad, halvstrukturerad och ostrukturerad data.

RDBMS är ett databashanteringssystem baserat på relationsmodellen. Hadoop är en mjukvara för lagring av data och löpande applikationer på kluster av handelsvaror.

INNEHÅLL

1. Översikt och nyckelskillnad
2. Vad är RDBMS
3. Vad är Hadoop
4. Jämförelse vid sida vid sida - RDBMS vs Hadoop i tabellform
5. Sammanfattning

Vad är RDBMS?

RDBMS står för Relational Database Management System baserat på relationsmodellen. I RDBMS används tabeller för att lagra data, och nycklar och index hjälper till att ansluta tabellerna. En tabell är en samling dataelement, och de är enheterna. Den innehåller rader och kolumner. Raden representerar en enda post i tabellen. Kolumnerna representerar attributen.

Till exempel kan försäljningsdatabasen ha kund- och produktenheter. Kunden kan ha attribut som kund_id, namn, adress, telefonnummer. Artikeln kan ha attribut som product_id, namn etc. Den primära nyckeln till kundtabell är customer_id medan produkttabellens primära nyckel är product_id. Placerar product_id i kundtabellen som en utländsk nyckel kopplar dessa två enheter. På samma sätt är tabellerna också relaterade till varandra. De tillhandahåller dataintegritet, normalisering och många fler. Några av de vanliga RDBMS är MySQL, MSSQL och Oracle. De använder SQL för att fråga.

Vad är Hadoop?

Hadoop är en Apache Open Source Framework skrivet i Java. Det hjälper till att lagra och behandla en stor mängd data över datorklyftor med enkla programmeringsmodeller. Hadops huvudsyfte är att lagra och bearbeta stora data, som refererar till en stor mängd komplexa data. Hadops genomströmning, som är kapaciteten att behandla en datamängd inom en viss tidsperiod, är hög.

Det finns fyra moduler i Hadoop-arkitekturen. De är Hadoop Common, YARN, Hadoop Distributed File System (HDFS) och Hadoop MapReduce. Den vanliga modulen innehåller Java-bibliotek och verktyg. Det har också filerna för att starta Hadoop. Hadoop YARN utför job schemaläggning och cluster resurshantering.

Vidare är Hadoop Distributed File System (HDFS) Hadops lagringssystem. Den använder master-slavarkitekturen. Huvudkoden är namnetNoden, och hanterar filsystemets metadata. Andra datorer är slavnoder eller DataNodes. De lagrar de faktiska data. Å andra sidan har Hadoop MapReduce den distribuerade beräkningen. Det har algoritmerna att bearbeta data. I HDFS har huvudnodet en jobbspårare. Det körs kartor reducera jobb på slavnoderna. Det finns en uppgiftsspårare för varje slavnod för att slutföra databehandling och att skicka resultatet tillbaka till huvudnoden. Sammantaget erbjuder Hadoop massiv lagring av data med hög bearbetningskraft.

Vad är skillnaden mellan RDBMS och Hadoop?

RDBMS vs Hadoop

RDBMS är en systemprogramvara för att skapa och hantera databaser som bygger på relationsmodellen. Hadoop är en samling av öppen källkodsprogramvara som kopplar samman många datorer för att lösa problem med en stor mängd data och beräkning.
 Data Variety
RDBMS lagrar strukturerad data. Hadoop lagrar strukturerad, halvstrukturerad och ostrukturerad data.
Datalagring
RDBMS lagrar genomsnittlig mängd data. Hadoop lagrar en stor mängd data än RDBMS.
 Fart
I RDBMS är läser snabbt. I Hadoop läses och skrivs snabbt.
skalbarhet
RDBMS har vertikal skalbarhet. Hadoop har horisontell skalbarhet.
Hårdvara
RDBMS använder avancerade servrar. Hadoop använder råvaruhårdvara.
  genomströmning
RDBMS genomströmning är högre. Hadoop genomströmning är lägre.

Sammanfattning - RDBMS vs Hadoop

I denna artikel diskuterades skillnaden mellan RDBMS och Hadoop. Huvudskillnaden mellan RDBMS och Hadoop är att RDBMS lagrar strukturerad data medan Hadoop lagrar strukturerad, halvstrukturerad och ostrukturerad data.

Referens:

1.Tutorials Point. "SQL RDBMS Concepts." , Tutorials Point, 8 jan 2018. Tillgänglig här  
2.Tutorials Point. "Hadoop Tutorial." , Tutorials Point, 8 jan 2018. Tillgänglig här  

Image Courtesy:

1.'8552968000'by Intel Free Press (CC BY-SA 2.0) via Flickr