SQL til datalogi: One stop-løsning til begyndere

Dette blogindlæg om SQL for Data Science hjælper dig med at forstå, hvordan SQL kan bruges til at gemme, få adgang til og hente data til at udføre dataanalyse.

Siden datavidenskaben er rangeret som nummer 1 for at være det mest lovende job i æraen, forsøger vi alle at deltage i løbet af . Dette blogindlæg om SQL for Data Science hjælper dig med at forstå, hvordan SQL kan bruges til at gemme, få adgang til og hente data til at udføre dataanalyse.



Her er en liste over emner, der vil være dækket af denne blog:



    1. Hvorfor er SQL nødvendigt for datalogi?
    2. Hvad er SQL?
    3. Grundlæggende om SQL
    4. Installation af MySQL
    5. Praktisk erfaring

Hvorfor er SQL nødvendigt for datalogi?

Vidste du, at vi genererer mere end 2,5 billioner byte data hver dag? Dette tempo i datagenerering er årsagen til populariteten af ​​avancerede teknologier som f.eks Datavidenskab , , og så videre.

At udlede nyttige indsigter fra data er det, der kaldes datavidenskab. Datavidenskab involverer udpakning, behandling og analyse af masser af data. I øjeblikket er det, vi har brug for der kan bruges til at gemme og administrere denne enorme mængde data.



Hvad er datalogi - Edureka

Det er her SQL kommer ind.

streng split flere afgrænsere java

SQL kan bruges til at gemme, få adgang til og udtrække enorme mængder data for at udføre hele datavidenskabsprocessen mere jævnt.



Hvad er SQL?

SQL som står for Structured Query Language er et forespørgselssprog, der har til formål at styre relationsdatabaser.

Men hvad er egentlig en relationsdatabase?

En relationsdatabase er en gruppe veldefinerede tabeller, hvorfra data kan tilgås, redigeres, opdateres og så videre uden at skulle ændre databasetabellerne. SQL er standarden (API) til relationsdatabaser.

Kommer tilbage til SQL, kan SQL-programmering bruges til at udføre flere handlinger på data såsom forespørgsel, indsættelse, opdatering, sletning af databaseposter. Eksempler på relationsdatabaser, der bruger SQL, inkluderer MySQL Database, Oracle osv.

Hvis du vil lære mere om SQL, kan du gå gennem følgende blogs:

  1. Forståelse af SQL-datatyper - Alt hvad du behøver at vide om SQL-datatyper
  2. Opret TABEL i SQL - Alt hvad du behøver at vide om oprettelse af tabeller i SQL

Før vi går i gang med en demo om SQL, lad os blive fortrolige med de grundlæggende SQL-kommandoer.

Grundlæggende om SQL

SQL leverer et sæt enkle kommandoer til at ændre datatabeller, lad os gennemgå nogle af de grundlæggende SQL-kommandoer:

  • OPRET DATABASE - opretter en ny database
  • Opret TABEL - opretter en ny tabel
  • INDSÆT I - indsætter nye data i en database
  • VÆLG - udtrækker data fra en database
  • OPDATERING - opdaterer data i en database
  • SLET - sletter data fra en database
  • ALTER DATABASE - ændrer en database
  • ALTER TABEL - ændrer en tabel
  • DROPTABEL - sletter et bord
  • OPRET INDEX - opretter et indeks for at søge i et element
  • DROP INDEX - sletter et indeks

For bedre at forstå SQL, lad os installere MySQL og se, hvordan du kan lege med data.

Installation af MySQL

Installation af MySQL er en enkel opgave. Her er en trin for trin guide der hjælper dig med at installere MySQL på dit system.

Når du er færdig med installationen MySQL, følg nedenstående afsnit for en simpel demo, der viser dig, hvordan du kan indsætte, manipulere og ændre data.

SQL For Data Science - MySQL Demo

I denne demonstration vil vi se, hvordan man opretter databaser og behandler dem. Dette er en demonstration på begynderniveau for at komme i gang med dataanalyse på SQL.

Så lad os komme i gang!

Trin 1: Opret en SQL-database

En SQL-database er et lagerlager, hvor data kan lagres i et struktureret format. Lad os nu oprette en database ved hjælp af MySQL :

OPRET DATABASE edureka BRUG edureka

I ovenstående kode er der to SQL-kommandoer:

Bemærk : SQL-kommandoer er defineret med store bogstaver, og en semikolon bruges til at afslutte en SQL-kommando.

  1. OPRET DATABASE: Denne kommando opretter en database kaldet 'edureka'

  2. BRUG: Denne kommando bruges til at aktivere databasen. Her aktiverer vi 'edureka'-databasen.

Trin 2: Opret en tabel med de nødvendige datafunktioner

Oprettelse af en tabel er så simpelt som at oprette en database. Du skal bare definere variablerne eller funktionerne i tabellen med deres respektive datatyper. Lad os se, hvordan dette kan gøres:

OPRET TABLE-legetøj (TID INTEGER IKKE NULL PRIMÆR NØGLE AUTO_INCREMENT, Varenavn TEKST, Pris INTEGER, Mængde INTEGER)

I ovenstående kodestykke forekommer følgende ting:

  1. Brug kommandoen 'CREATE TABLE' til at oprette en tabel kaldet legetøj.
  2. Legetøjstabellen indeholder 4 funktioner, nemlig TID (transaktions-id), varenavn, pris og mængde.
  3. Hver variabel er defineret med deres respektive datatyper.
  4. TID-variablen erklæres som en primær nøgle. En primær nøgle angiver grundlæggende en variabel, der kan gemme en unik værdi.

Du kan yderligere kontrollere detaljerne i den definerede tabel ved hjælp af følgende kommando:

BESKRIV legetøj

Trin 3: Indsættelse af data i tabellen

Nu hvor vi har oprettet en tabel, lad os udfylde den med nogle værdier. Tidligere i denne blog nævnte jeg, hvordan du kan tilføje data til en tabel ved blot at bruge en enkelt kommando, dvs. INSERT INTO.

c ++ brug navneområdet

Lad os se, hvordan dette gøres:

INDSÆT I LEGETØJVÆRDIER (NULL, 'Tog', 550, 88) INDSÆT I LEGETØJVÆRDIER (NULL, 'Hotwheels_car', 350, 80) INDSÆT I LEGETØJVÆRDIER (NULL, 'Magic_Pencil', 70, 100) INDSÆT I LEGOVERDIER ( NULL, 'Dog_house', 120, 54) INDSÆT I LEGETØJVÆRDIER (NULL, 'Skateboard', 700, 42) INDSÆT I LegetøjsVÆRDIER (NULL, 'GI Joe', 300, 120)

I ovenstående kodestykke indsatte vi simpelthen 6 observationer i vores 'legetøj'-tabel ved hjælp af INSERT INTO-kommandoen. For hver observation inden for parenteser har jeg angivet værdien for hver variabel eller funktion, der blev defineret, mens du oprettede tabellen.

TID-variablen er indstillet til NULL, da den automatisk øges fra 1.

Lad os nu vise alle de data, der findes i vores tabel. Dette kan gøres ved hjælp af nedenstående kommando:

VÆLG * FRA legetøj


Trin 4: Rediger dataposterne

Lad os sige, at du besluttede at øge prisen på G.I. Joe, da det giver dig mange kunder. Hvordan opdaterer du prisen på variablen i en database?

Det er simpelt, brug bare kommandoen nedenfor:

UPDATE legetøjsæt Pris = 350 WHERE TID = 6

UPDATE-kommandoen giver dig mulighed for at ændre alle værdier / variabler, der er gemt i tabellen. SET-parameteren giver dig mulighed for at vælge en bestemt funktion, og WHERE-parameteren bruges til at identificere den variabel / værdi, du vil ændre. I ovenstående kommando har jeg opdateret prisen på dataindgangen, hvis TID er 6 (G.I. Joe).

Lad os nu se den opdaterede tabel:

VÆLG * FRA legetøj

Du kan også ændre, hvad du vil have vist ved blot at henvise til de kolonner, du vil se. For eksempel viser kommandoen nedenfor kun navnet på legetøjet og dets respektive pris:

VÆLG varenavn, pris FRA legetøj

Trin 5: Hentning af data

Så efter indsættelse af data og ændring af dem er det endelig tid til at udtrække og hente dataene i henhold til forretningskravene. Det er her, data kan hentes til yderligere dataanalyse og datamodellering.

Bemærk, at det er et simpelt eksempel for at komme i gang med SQL, men i virkelige scenarier er dataene meget mere komplicerede og store i størrelse. På trods af dette forbliver SQL-kommandoerne de samme, og det er det, der gør SQL så enkel og forståelig. Det kan behandle komplekse datasæt med et sæt enkle SQL-kommandoer.

Lad os nu hente data med et par ændringer. Se koden nedenfor og prøv at forstå, hvad den gør uden at se på output:

hvordan man konverterer streng til dato
VÆLG * FRA legetøj GRÆNSE 2

Du gættede det! Det viser de to første observationer, der er til stede i min tabel.

Lad os prøve noget mere interessant.

VÆLG * FRA legetøj BESTIL EFTER Pris ASC

Som vist i figuren er værdierne arrangeret i forhold til stigende rækkefølge af prisvariablen. Hvis du vil kigge efter de tre mest købte varer, hvad ville du gøre?

Det er virkelig simpelt!

VÆLG * FRA legetøj BESTIL EFTER MÆNGDE DESC LIMIT 3

Lad os prøve en mere.

VÆLG * FRA legetøj HVOR Pris> 400 BESTIL EFTER Pris ASC


Denne forespørgsel udtrækker detaljerne om legetøjet, hvis pris er mere end 400, og arrangerer output i stigende rækkefølge af prisen.

Så det er sådan, du kan behandle data ved hjælp af SQL. Nu hvor du kender det grundlæggende i SQL til datalogi, er jeg sikker på, at du er nysgerrig efter at lære mere. Her er et par blogs for at komme i gang:

  1. Hvad er datalogi? En begyndervejledning til datalogi
  2. MySQL Tutorial - En begyndervejledning til at lære MySQL

Hvis du ønsker at tilmelde dig et komplet kursus om kunstig intelligens og maskinindlæring, har Edureka en specielt kurateret der gør dig dygtig i teknikker som Supervised Learning, Unsupervised Learning og Natural Language Processing. Det inkluderer træning i de nyeste fremskridt og tekniske tilgange inden for kunstig intelligens og maskinindlæring som dyb læring, grafiske modeller og forstærkningslæring.