Sådan kører du bikubescript?

Dette er en vejledning i, hvordan du kører Hive Scripts. At køre dette script vil reducere den tid og kræfter, vi lægger på at skrive og udføre hver kommando manuelt.

At være en datavarehousing-pakke bygget oven på Hadoop bliver Apache Hive i stigende grad vant til dataanalyse, datamining og forudsigelig modellering. Organisationer leder efter fagfolk med et fast greb . I dette indlæg skal vi se på, hvordan du kører Hive Scripts. Generelt bruger vi scripts til at udføre et sæt udsagn på én gang. Hive Scripts bruges stort set på samme måde. Det reducerer den tid og kræfter, vi lægger på at skrive og udføre hver kommando manuelt.



Hive-scripts understøttes i Hive 0.10.0 og derover. Da Hive 0.90-versionen er installeret i CDH3, kan vi ikke køre Hive-scripts i CDH3. Du kan prøve nedenstående trin i CDH4, da den har Hive 0.10.0-version installeret i dem. Er du opmærksom på, hvordan du opretter et Hive-script? Hvis nej, klik for at få mere afklaring.



Master-Hive-Now

Lad os nu se, hvordan man skriver scripts i Hive og kører dem i CDH4:



forskellen mellem forbipasseringsværdi og videregivelse af reference i java

Trin 1: Skrivning af et Hive-script.

For at skrive Hive Script skal filen gemmes med .sql udvidelse. Åbn en terminal i din Cloudera CDH4-distribution, og giv følgende kommando for at oprette et Hive-script.
Kommando: sudo gedit sample.sql

Ved udførelse af ovenstående kommando åbner den filen med listen over alle de Hive-kommandoer, der skal udføres.



I dette script oprettes en tabel, der beskrives, og data indlæses og hentes fra tabellen.

1. Oprettelse af bordet i bikuben:

Kommando: Opret tabelprodukt (produktid: int, produktnavn: streng, pris: float, kategori: streng) rækker format afgrænsede felter afsluttet med ','

Her er produkt tabelnavnet, og {produktid, produktnavn, pris, kategori} er kolonnerne i denne tabel.

Felter, der afsluttes med ',' angiver, at kolonnerne i inputfilen er adskilt med symbolet ','.

Som standard er posterne i inputfilen adskilt af en ny linje.

2. Beskrivelse af tabellen:

Kommando: beskrive produkt

3. Indlæsning af data i tabellen.

For først at indlæse dataene i tabellen skal vi oprette en inputfil, der indeholder de poster, der skal indsættes i tabellen.

Lad os oprette en inputfil.

Kommando: sudo gedit input.txt

Rediger indholdet i filen som vist på figuren.

4. Hentning af data:

For at hente dataene bruges kommandoen select.

Kommando: Vælg * fra produkt

Ovenstående kommando bruges til at hente værdien af ​​alle kolonnerne i tabellen. Scriptet skal være som det er vist i nedenstående billede.

Nu er vi færdige med at skrive Hive-scriptet. Filen sample.sql kan nu gemmes.

Trin 2: Kørsel af Hive Script

Følgende er kommandoen til at køre Hive-scriptet:

Kommando: bikube –f /home/cloudera/sample.sql

pl / sql undtagelse håndtering

Mens du udfører scriptet, skal du sørge for, at hele stien til scriptfilens placering er til stede.

Vi kan se, at alle kommandoer udføres med succes.

Sådan køres og udføres Hive-scripts i CDH4.

Hive er en kritisk komponent i Hadoop, og din ekspertise i Hive kan give dig de mest betalte Hadoop-job! Edureka har et specielt kurateret Hadoop-kursus, der hjælper dig med at mestre koncepter som MapReduce, Garn, Pig, Hive, HBase, Oozie, Flume og Sqoop. Klik på knappen nedenfor for at komme i gang.

Har du et spørgsmål til os? Nævn dem i kommentarfeltet, så vender vi tilbage til dig.

Relaterede indlæg:

Hive-kommandoer

Hive-datamodeller