Oversigt over HBase Storage Architecture

Der består HBase Storage-arkitektur af adskillige komponenter. Lad os se på funktionerne i disse komponenter og vide, hvordan data skrives.



Apache HBase er en open source, distribueret, ikke-relationel database modelleret efter Googles Bigtable og skrevet i Java. Det giver funktioner svarende til Bigtable oven på Hadoop og HDFS (Hadoop Distribueret filsystem), dvs. det giver en fejltolerant måde at lagre store mængder sparsomme data på, hvilket er almindeligt i mange big data-brugssager. HBase bruges til real-time læse- / skriveadgang til Big Data.



HBase Storage-arkitekturen indeholder adskillige komponenter. Lad os se på funktionerne i disse komponenter og vide, hvordan data skrives.

HFiler:



HFiles udgør det lave niveau af HBases arkitektur. HFiles er lagerfiler, der er oprettet for at gemme HBases data hurtigt og effektivt.

HMaster:

java skift dobbelt til int

HMaster er ansvarlig for at tildele regionerne til hver HRegionServer, når HBase startes. Det er ansvarligt for at styre alt relateret til rækker, tabeller og deres koordineringsaktiviteter. Hmaster har også detaljerne i metadataene.



Komponenter af HBase:

HBase har følgende komponenter:

  • Tabel - Omfatter regioner
  • Region - række række lagret sammen
  • Region Servers - Betjener en eller flere regioner
  • Master Server - Daemon er ansvarlig for styring af HBase-klynge

HBase gemmer data direkte i HDFS og er i høj grad afhængig af HDFSs høje tilgængelighed og fejltolerance.

HBase-opbevaringsarkitektur:

HBase opbevaringsarkitektur

Den generelle strømning er, at en klient først kontakter Zookeeper for at finde en bestemt række nøgle. Det gør det ved at hente servernavnet fra Zookeeper. Med disse oplysninger kan det nu forespørge på denne server for at få den server, der indeholder metatabellen. Begge disse detaljer er cachelagrede og kiggede kun op en gang. Endelig kan den forespørge på metaserver og hente den server, der har rækken, som klienten leder efter.

Når den først ved, i hvilken region rækken ligger, cachelager den også disse oplysninger og kontakter HRegionServer direkte. Så over tid har klienten komplette oplysninger om, hvor de kan få rækker fra uden at skulle spørge metaserver igen. Når HR-regionen åbnes, opretter den en butiksinstans for hver HColumnFamily for hver tabel. Data skrives, når klienten udsender en anmodning til HRegionServer, der giver detaljerne til den matchende HRegion-forekomst. Det første trin er, at vi skal beslutte, om dataene først skal skrives til 'Write-Ahead-Log' (WAL) repræsenteret af HLog-klassen. Beslutningen er baseret på det flag, som klienten har sat.
Når dataene er skrevet til WAL, placeres de i MemStore. Samtidig kontrolleres Memstore, om den er fuld, og i så fald anmodes om en flush til disk. Derefter skrives dataene ind i HFilen.

hvad er forskellen mellem jquery og javascript

Har du et spørgsmål til os? Nævn dem i kommentarfeltet, så vender vi tilbage til dig.

Relaterede indlæg

Indsigt i HBase-arkitektur