Skillnad mellan Star och Snowflake Schema

Data warehousing är ett system som är utformat för att lagra och organisera data i centrala arkiv, inklusive data från andra källor. Det är ett kärnkoncept för affärsintelligens i relationsdatabasmodeller som använder analytiska tekniker för att integrera företagsdata i en central databas.

Det finns två vanliga arkitektoniska modeller som används i datalagring:

  • Star Scheme
  • Snowflake Schema

Båda är de vanliga multidimensionella databasmodellerna som används för att tillgodose behoven hos stora databaser för de analytiska ändamålen i reala datalager.

Vi presenterar en opartisk jämförelse mellan de två för att bättre förstå vilken som är bättre än den andra.

Vad är Star Schema?

Det är den vanligaste och allmänt accepterade arkitektoniska modellen som används för att utveckla datalager och data mars där data är organiserad i fakta och dimensioner. Det är den enklaste arkitektoniska modellen där en faktabord används för att referera till flera dimensionstabeller, imitera ett stjärnmönster.

Som namnet antyder, liknar diagrammet en stjärna med faktabordet i mitten och multipeldimensionstabeller som utstrålar det, vilket skapar en stjärna som mönster.

Det är också känt som Star Join Schema och det lagrar alla attribut av en dimension i en denormaliserad faktabord för att snabbt navigera genom stora multidimensionella dataset som svarar för snabba svarstidstider.

Vad är Snowflake Schema?

Det är en förlängning av stjärnschemat med extra funktioner. Till skillnad från stjärnschema normaliseras dimensionstabellerna i snöflingaskjema i flera relaterade tabeller.

Den arkitektoniska modellen representerar ett logiskt arrangemang av tabeller i en många-till-en-förhållandehierarki där flera dimensionstabeller normaliseras i underdimensionstabeller, som liknar ett snöflingformigt mönster, därav namnet.

Det är en mer komplicerad version av stjärnschemat med fler kopplingar mellan dimensionstabeller som står för långsam behandlingstid för att hämta data vilket betyder långsiktig svarstid. Det minimerar dataförlängning vilket i sin tur förbättrar sökresultatet.

Skillnad mellan Star och Snowflake Schema

Arkitektur av Star och Snowflake Schema

I relationsdatabaser är stjärnschema den enklaste arkitektoniska modellen som används för att utveckla datalager och multidimensionell data mars. Som namnet antyder liknar modellen en stjärna med punkter som utstrålar från mitten, vilket betyder att faktabellen är mitten och punkterna är dimensionstabellerna. Liksom andra dimensionella modeller består den av data i form av fakta och dimensioner. Snowflake schema är å andra sidan den mer komplexa arkitektoniska modellen som refererar till en flerdimensionell databas med logiskt arrangemang av tabeller i form av en snöflinga.

Dimensionstabell

Snöflingaskjematet är ganska likt stjärnschemat, förutom att det kan ha mer än en dimensionstabell som normaliseras ytterligare i flera relaterade tabeller som kallas underdimensionstabeller. Det representerar flera nivåer av relationer som grenar ut i ett snöflingermönster. Stjärnschema lagrar dock alla relaterade attribut av en dimension till en denormaliserad dimensionstabell som gör det lätt att förstå och hantera enklare frågor.

Affärsmodell av Star och Snowflake Schema

En dimensionstabell kan inte innehålla dubbla rader i relationsdatabasmodeller för det enkla faktum att det kan skapa tvetydigheter vid hämtning. Varje tabell ska ha en kolumn eller en kombination av kolumner som heter primärnyckeln, som unikt identifierar alla tabellposter. En främmande nyckel är en kolumn eller en grupp kolumner som ger en länk mellan två tabeller. I stjärnschema har varje dimensionstabell en primär nyckel som är relaterad till en främmande nyckel i faktabellen. Verksamhetshierarkin i ett snöflingaskema representeras av en primärnyckel / utländsk nyckelrelation mellan dimensionstabeller.

Dataintegritet i Star och Snowflake Schema

Nyckelfaktorn mellan de två relationsdatabasmodellerna är normalisering. Dimensionstabellerna i stjärnscheman är inte normaliserade, vilket innebär att affärsmodellen kommer att använda relativt mer utrymme för att lagra dimensionstabeller och mer utrymme betyder mer överflödiga poster som i slutändan skulle orsaka inkonsekvens. Snowflake schema, å andra sidan minimerar data redundans eftersom dimension tabeller normaliseras som står för mycket mindre redundanta poster. Verksamhetshierarkin och dess dimensioner bevaras genom referensintegritet, vilket innebär att relationer kan uppdateras oberoende i datalager.

Query Performance

Stjärnschemaet har färre kopplingar mellan dimensionstabell och faktabord jämfört med det för snöflingaskjematet som har flera samlingar som står för mindre frågekomplexitet. Eftersom dimensionerna i ett stjärnschema är kopplade via en central faktabord, har den tydliga anslutningsvägar som betyder snabba svarstidstider och snabb svarstid betyder bättre prestanda. Snowflake schema har ett högre antal anslutningar så längre frågesponser som resulterar i mer komplexa frågor som slutligen komprometterar prestanda.

Star Schema vs Snowflake Schema: Jämförelse Diagram


Sammanfattning av Star verses Snowflake Schema

Båda är de vanligaste och allmänt antagna arkitektoniska modellerna som används för att utveckla databaslager och data mars. Men varje affärsmodell har sin rättvisa andel av fördelar och nackdelar. Medan stjärnschema är den enklaste multidimensionella modellen som används för att organisera data i fakta och dimensioner, är den idealisk för att utveckla data marts som involverar mindre komplexa relationer. Snowflake schema är en logisk representation av tabeller i en flerdimensionell databas där dimensionerna lagras i underdimensionella tabeller. Huvudskillnaden mellan de två är normalisering. Dimensionstabellerna i ett snöflingaskjema normaliseras helt i flera uppslagstabeller, medan i ett stjärnschema deformaliseras dimensionstabellerna i en central faktabord.