Eksempler på Data Warehouse og dets computerdefinition

Hvad hvis organisationer behandlede alle deres data til beslutningsstøtte? Hvad ville der ske, hvis de brugte specialiseret software, der tjente til præsentation af oplysningerne og analyse af disse? Vi vil give nogle Data Warehouse eksempler at besvare disse spørgsmål.

EKSEMPLER PÅ DATA-LAGER

Datavarehuseksempler

For det første er det vigtigt at skelne mellem to udtryk, der på grund af deres forkortelse let kan forvirre os, og fra begyndelsen er det meningen, at brugeren skal vide, hvad han kan forvente og kende nogle grundlæggende begreber, som de går efter at stå ansigt til ansigt med. Her vil vi vise uendelige eksempler, der tjener, så individet har værktøjerne til at skelne mellem disse elementer.

definition

I betragtning af forskellen mellem de to udtryk, vil vi fortsætte med at definere dem formelt, da det er en proces, der udtrækker, transformerer, konsoliderer og integrerer data fra en organisation, både internt og eksternt, for at gøre dem tilgængelige og nyttige i beslutninger -fremstilling.

På samme måde kan datalageret også defineres som en base med elektronisk filsysteminformation, som gemmer de nødvendige data til informationsanalyse og beslutningstagning. Dens forskel er, at den er forretningsorienteret, integreret, tidsvarierende og ikke-flygtig.

Grundlæggende er Data Warehousing (DWH) en proces, og Data Warehouse (DW) er en database.

funktioner

Der er flere aspekter, der kendetegner datalageret, der giver de nødvendige værktøjer til optimal brug og dermed overholder programmerede retningslinjer, der genererer værktøjerne til dets brug på den bedst mulige måde. Vi vil beskrive egenskaberne ved et datavarehus:

Forretningsorienteret

Kun relevante data indtastes i datavarehuset til analyse og beslutningstagning. Det vil sige, at data, der ikke har en analytisk værdi, såsom lokaladresser, postnumre, e -mail -adresser, blandt andre, ikke tages i betragtning. Men de er af variabel interesse, f.eks. Klienttype, geografisk placering, alder osv.

Enheder på højt niveau administreres, såsom kunder, produkter, varer, områder og andre. Dataene gemmes på en multidimensionel måde, det vil sige faktisk og dimensionstabeller.

integreret

Alle data fra heterogene kilder er konsolideret for at garantere deres kvalitet og renlighed. De vigtigste datakilder er:

I henhold til brugerens type.

    • Operationel: Den producerer en stor mængde data på daglig basis, men i sig selv er den af ​​ringe relevans for den krævede analyse. For eksempel produktsalg.
    • Medium: Genererer data med implikation på kort og mellemlang sigt, baseret på driftsdata. Et godt eksempel på dette koncept er lagergenerering.
    • Ledelsesmæssig: Bruger data som følge af integrations- og transformationsprocessen. Til gengæld genererer det nye oplysninger. Det refererer dybest set til brugeren af ​​datavarehuset.

I henhold til organisationens område eller afdeling

    • Områder: Hver har et veldefineret ansvar. De producerer deres egne data, der deles med de andre områder.
    • Underinddelinger: De er normalt geografiske. De leverer placeringsdata, som skal inkorporeres sammen med de andre.

Ifølge kilden

    • Intern: De genererer deres egne data, der kommer fra virksomhedens daglige aktiviteter.
    • Eksternt: De supplerer interne data, for eksempel folketællinger og statistikker.

Variant i tid

Det giver adgang til forskellige versioner af den samme situation, da aktuelle data lagres sammen med historiske data i datalagereksemplerne.

datalager

Ikke flygtig

Det garanterer stabiliteten af ​​oplysningerne, da dataene først indtastes, ændres det ikke. Det vil sige, at dataene kun manipuleres, når de indtastes, og når de konsulteres.

Sammenfattende er datavarehusets vigtigste kvaliteter:

Kvaliteter

Det håndterer data i volumen, en konsekvens af akkumulering af historiske, aktuelle og aggregerede data fra forskellige kilder.

Det placerer hele datamængden i en enkelt centraliseret database. Strukturér dataene på en flerdimensionel måde.

fordele

På grund af sine egenskaber og kvaliteter giver datavarehuset følgende fordele:

  • Det reducerer den mindste tid, der kræves for at indsamle alle relevante data om et specifikt emne.
  • Giver analyseværktøjer.
  • Mange rapporter og analyser er brugerdefinerede.
  • Det giver dig mulighed for direkte at få adgang til, analysere og overvåge organisationens indikatorer.
  • Det hjælper med at identificere de faktorer, der påvirker virksomhedens drift.
  • Det gør det muligt at fremme og bestemme institutionens fremtidige adfærd.
  • Brugere kan forespørge data hurtigt og nemt.

Kort sagt, datavarehuset hjælper organisationen med at besvare væsentlige spørgsmål til beslutningstagning. Dette opnår konkurrencemæssige fordele, der optimerer deres position på det marked, de opererer på. Nogle af disse spørgsmål er:

  • Hvad er kundens profil?
  • Hvordan er deres adfærd?
  • Hvad er virksomhedens rentabilitet?
  • Hvad er risikoen for organisationen?
  • Hvilke tjenester og produkter bruger du, og hvordan kan du øge dem?

EKSEMPLER PÅ DATA-LAGER

Anvendelsesområde

Et datavarehus kan tilpasses enhver organisation, uanset dets størrelse og kompleksitet. Dette er en konsekvens af dagsordenen for enhver institution, virksomhed eller organisation, når der træffes relevante beslutninger vedrørende de data, den producerer.

Anvendelsesrisici

Det kræver en stor investering fra organisationens side. Fordelene ved implementeringen ses ikke på kort sigt, men på mellemlang og lang sigt.

Manipulation af data truer manipulation af følsomme data.

Aspekter, der skal tages i betragtning

Som nævnt i begyndelsen er der flere aspekter, der skal tages i betragtning ved anvendelsen af ​​disse elementer til brug af en server. Blandt dem kan vi nævne følgende:

Ansøgningsomkostninger

Et datalager bærer bygge-, drifts- og supportomkostninger. Byggeomkostningerne indebærer omkostninger til menneskelige ressourcer, tid og teknologi, mens drifts- og vedligeholdelsesomkostninger tager højde for omkostningerne ved udvikling, vækst og omkostninger, der er forårsaget af ændringer i datas oprindelse.

Virkning på mennesker

Anvendelsen af ​​et datavarehus skaber altid forventninger hos brugerne, som nødvendigvis skal tilegne sig nye færdigheder. Succesen af ​​denne type data afhænger af aktiv brug og feedback fra brugerne.

Virkning på forretnings- og beslutningsprocesser

Med anvendelsen af ​​et datavarehus kan visse mangler i forretningsprocesser afsløres, men samtidig stiger tilliden til de beslutninger, der træffes baseret på de opnåede resultater.

Arkitektur

EKSEMPLER PÅ DATA-LAGER

Den generelle arkitektur for et eksempeldatavarehus er vist i figuren ovenfor. Som det kan ses, involverer dette system en række interaktioner mellem dets komponenter. I denne henseende og som et resumé kan dets drift beskrives som følger:

  • Dataene er hentet fra forskellige kilder, såsom webtjenester, filer og andre databaser, både interne og eksterne.
  • Når dataene er ekstraheret, integreres, transformeres og rengøres de for senere at blive indlæst i datavarehuset.
  • For at generere taktisk og strategisk information hentes rapporter og analyser fra indlæsning af dataene.
  • Endelig kan brugerne konsultere og undersøge de genererede rapporter og analyser.

elementer

Vi skal nu beskrive nogle af de elementer, der kan evalueres i datavarehuset, der bør overvejes.

Datavarehuskilder

Generelt er de resultatet af virksomhedens daglige aktivitet, i hvilket tilfælde de kaldes interne kilder. Når data hentes fra f.eks. Webservere, betragtes disse som eksterne kilder. De er forskellige fra hinanden, fordi de afhænger af deres oprindelse, format, funktion osv.

Ekstraktion, transformation og lastning

EKSEMPLER PÅ DATA-LAGER

Kendt som ETL, er det processen, der omfatter alle de opgaver, der udføres, fra dataene er indhentet, til de indlæses i datavarehuset. Disse er: ekstraktion, manipulation, kontrol, integration, datarensning, indlæsning og opdatering.

ekstraktion

Det indeholder teknikker, der fokuserer på at skaffe, fra forskellige kilder, kun de relevante data og opbevare dem i intern lagring. Denne lagringstype gør det muligt at manipulere data uden at intervenere eller ændre kilderne eller datavarehuset med flere data, skabe et ekstraktionslag mellem læsning og indlæsning, lagring og håndtering af de metadata, der genereres i processen og letter integration.

Udtrækningen er baseret på brugernes behov og de krav, der er defineret til løsningen.

Transformation

Dette er de teknikker, der er ansvarlige for at gøre de forskellige formater kompatible, samt filtrering og klassificering af data og relaterede kilder.

Denne funktion er ansvarlig for at anvende alle de relevante kommandoer i forhold til dataene for at promovere dem på en stærk og rimelig måde, der er kompatibel og i overensstemmelse med datavarehuset. Derudover er den ansvarlig for renligheden og kvaliteten af ​​dataene.

fiber transformation

Carga

Med hensyn til teknikkerne til den første indlæsning af dataene og den periodiske opdatering af datavarehuset.

  • Den indledende belastning refererer til den første belastning af data, som datavarehuset modtager. Generelt er det meget tidskrævende på grund af det store antal poster, der tilhører lange perioder.
  • Periodisk opdatering refererer til indsættelse af små datamængder. Dit mål er kun at tilføje data til datalageret de data, der genereres fra den sidste opdatering. Det afhænger af brugerens behov og krav.

Kort sagt, ved at indlæse data er vedligeholdelsen af ​​datavarehuset garanteret.

Sammenfattende kan det siges, at ETL -processen udføres som følger:

  • Dataene, når de er ekstraheret fra de relevante kilder, deponeres i det interne lager.
  • Mens dataene opbevares i intern lagring, er de integreret og transformeret.
  • Når dataene renses, videregives de efter det foregående trin til datavarehuset.

Rapporter

Rapporterne er grafiske værktøjer, der gør det muligt for brugeren at få detaljerede rapporter om oplysninger om din virksomhed. Måden at interagere med disse rapporter er ganske enkel for brugeren, da de er nemme at følge instruktioner. Grundlæggende skal du vælge muligheder fra en menu under henvisning til betingelserne og specifikationerne for det præsenterede emne.

OLAP

Det er den mest kraftfulde komponent i datavarehuset, da det indeholder systemets specialiserede multidimensionelle forespørgselsmotor.

Det tillader analyse af organisationen ud fra forskellige historiske scenarier. Den projekterer sin adfærd og udvikling ud fra en multidimensionel vision, det vil sige ved at kombinere forskellige perspektiver, emner af interesse eller dimensioner. Dette gør det muligt at udlede tendenser ved at opdage relationer mellem perspektiver, der ville være vanskelige at finde ved første øjekast.

Data Mining

EKSEMPLER PÅ DATA-LAGER

Det er primært et statistisk værktøj, hvorigennem forudsigelser kan foretages. Det handler om at udlede adfærd, uden at der er forud fastsatte regler. Det genererer blandt andet rapporter i form af tabeller og grafer, der fremmer beslutningstagning på en proaktiv måde. Det fungerer på grundlag af oplysninger, der allerede er fuldt behandlet.

Forskel mellem OLAP og Data Mining

Når hovedaspekterne ved OLAP og Data Minig er blevet overvejet, kan der etableres en grundlæggende forskel mellem dem.

  • Ved hjælp af OLAP fortolkes virksomhedens nuværende situation og giver hurtige svar, der letter beslutningstagningen.
  • Data Minig forudsiger situationer baseret på undersøgelse af skjult viden, der fremkalder visse former for adfærd.

Følgelig beskæftiger begge systemer sig med at løse forskellige typer af analytiske situationer.

Data Minig og dets forhold til Data Warehouse

Et Data Minig -system er en supportteknologi til slutbrugeren, hvis formål er at udtrække nyttig information fra informationerne i virksomhedernes database. Med andre ord er oprindelsen af ​​de oplysninger, der bruges af Data Minig -algoritmerne, normalt historiske data i et datavarehus.

Der skal være en integration mellem Data Minig -teknikker og de processer, der er involveret i datavarehuset. Det vil sige, at for at kunne udføre forretningsanalysen, skal der være enighed mellem Data Minig, Data Warehouse og OLAP -serveren.

Hver gang Data Warehouse leverer nye resultater, kan virksomheden anvende Data Minig igen for at optimere beslutningstagningen.

Kort sagt, Data Minig og Data Warehouse er fuldt kompatible værktøjer. Datavarehuset giver hukommelse og Data Minig -intelligens.

Traditionelle databaser vs Data Warehouse

Analysen af ​​de hidtil afslørede aspekter får os til at forstå, at et datavarehus adskiller sig fra de databaser, der understøtter organisationers daglige transaktioner. Her er de grundlæggende forskelle

  • I traditionelle databaser er oplysningerne organiseret, så de let kan hentes og opdateres. Et datavarehus er organiseret og orienteret mod slutbrugeren, som kun kan foretage forespørgsler.
  • Transaktionsdatabaser tager sig af den daglige behandling af dataene. Datavarehuset arbejder med historiske data, det vil sige svarende til lange tidsperioder.
  • Traditionelle databaser tilgås flere gange i løbet af en arbejdsdag. I et datavarehus er aflæsninger og forespørgsler minimale, da der er sporadisk adgang til det.
  • Mængden af ​​data, som et datavarehus administrerer, er meget større end det, der administreres i traditionelle databaser.
  • Transaktionsbasernes struktur er stabil. Strukturen i et datavarehus varierer alt efter dets egen udvikling og anvendelse.

Dernæst vil vi etablere nogle Data Warehouse eksempler.

Datavarehuseksempler

En landsdækkende virksomhed, der er dedikeret til salg af rengøringsartikler til engroshandel og detailhandel, og som også betragtes som mellemstor for sin salgsmængde, har som hovedmål at maksimere sin fortjeneste. For at få flere kunder vil du på samme måde udvide til et nyt markedsniveau og senere udvide din produktserie. En af dens hovedpolitikker er løbende at forbedre sig for at få en bedre position i forhold til sine konkurrenter i datalagerprøverne.

EKSEMPLER PÅ DATA-LAGER

Anvendelsen af ​​et datavarehus giver organisationen følgende fordele.

  • Det giver brugerne mulighed for at få overblik over virksomheden.
  • Transformér driftsdata til analytiske oplysninger med fokus på beslutningstagning.
  • Generer dynamiske rapporter, der letter din analyse.
  • Det letter dannelsen af ​​strategier til opfyldelse af organisationens mål.
  • Det gavner stabiliteten i virksomhedsstrukturen.

Et andet eksempel på et dagligt datalager refererer til ledelsen af ​​en uddannelsesinstitution, som har mangler med hensyn til kommunikation med sine studerende. Tilsvarende mangler det et samlet informationscenter, der har alle deres oplysninger. Formålet med institutionen er at ledsage studerende i løbet af deres karriere og efter eksamen, at tilbyde nye forslag, der forbedrer organisationens præstationer og udviklingen af ​​studerende.

Med anvendelsen af ​​et datavarehus søger vi at imødekomme universitetets behov. I princippet eliminerer duplikation af oplysninger og tilstedeværelsen af ​​fejlagtige detaljer om eleverne samt alle de oplysninger, der generelt anses for at være af dårlig kvalitet, og som ikke er relevante. Derudover er alle oplysninger integreret og danner en samlet studenterrekord, der tjener som grundlag for en korrekt udvikling af institutionens projekt.

Endelig fremmes markedsføringsaktiviteter, hvilket giver universitetet større fordel og hjælper dets vækst gennem korrekt forvaltning af information.

Afslutningsvis giver det i eksempler på datalager mulighed for at vide, hvad der sker i organisationen, hvad der er sket, hvad der kan ske og hvorfor. Du kan se artiklen typer computervirus.