Hvordan fungerer LOD-udtryk i Tableau?

Tableau LOD Expressions repræsenterer en elegant og kraftfuld måde at besvare spørgsmål, der involverer flere niveauer af granularitet i en enkelt visualisering.

Målet med ethvert BI-værktøj er at give Dataanalyse et bedre flow. Hvis man som professionel står over for vanskelighederne med at bruge værktøjet, mens man løser et problem, er strømningstilstanden brudt. En almindelig årsag til dette problem er behovet for at arbejde med data, der er samlet til forskellige Detaljeringsniveau i tabletten (LOD) .



Tableau, der placeres oven på bunken for 6. gang i træk, på Gartners Magic Quadrant, siger bestemt noget om sin efterspørgsel på markedet. Dette er sandsynligvis det bedste tidspunkt at .



Denne blog hjælper dig med at forstå LOD-udtryk og diskutere følgende emner:



Tableau LOD: Hvorfor har du brug for LOD?

Der er ofte spørgsmål, som man kommer til at komme på tværs af, når man analyserer data. Disse spørgsmål er ofte enkle at stille, men svære at besvare. De lyder ofte noget som:

Spørgsmål i Tableau - LOD Tableau - EdurekaFor at løse disse typer spørgsmål blev der introduceret en ny syntaks kaldet Niveau for detaljer i Tableau 9.0. Denne nye syntaks både forenklet og udvidet Tableaus beregningssprog ved at gøre det muligt at adressere disse spørgsmål direkte.

Tableau LOD: Hvad er LOD?

LOD-udtryk repræsenterer en elegant og effektiv måde at besvare spørgsmål, der involverer flere niveauer af granularitet i en enkelt visualisering.



blanding af tableddata fungerer ikke

Detaljeringsniveau i Tableau- eller LOD-udtryk giver dig mulighed for at beregne værdier på datakildeniveau og visualiseringsniveau. LOD-udtryk giver dig dog endnu mere kontrol på det granularitetsniveau, du vil beregne. De kan udføres på en mere granulær niveau (INCLUDE Calculation), a mindre kornet niveau (EXCLUDE Calculation) eller et helt uafhængig mild l (FAST beregning).

Tableau LOD: Række niveau & Vis niveau udtryk

Række niveau

I Tableau refererer udtryk uaggregeret datakildekolonner beregnes for hver række i den underliggende tabel. I dette tilfælde er udtrykkets dimensionalitet række niveau . Et eksempel på et udtryk på række-niveau er:

[Salg] / [Profit]

Denne beregning evalueres i hver række i databasen. Salgsværdien i hver række divideres med fortjenstværdien i den række og producerer en ny kolonne med resultatet af multiplikationen (et fortjenesteforhold).

Hvis du opretter en beregning med denne definition, skal du gemme den med navnet [ProfitRatio], og træk den derefter fra Datarude til en hylde, Tableau aggregerer typisk det beregnede felt for visningen:

SUM [ProfitRatio]

Visningsniveau

I modsætning hertil henvisninger til udtryk aggregeret datakildekolonner beregnes med den dimensionalitet, der er defineret af dimensionerne i visningen. I dette tilfælde er udtryksdimensionaliteten visningsniveau. Et eksempel på et udtryk på visningsniveau er:

SUM (salg) / SUM (fortjeneste)

Hvis du trækker denne beregning til en hylde (eller skriver den direkte på en hylde som en ad hoc-beregning), lukker Tableau den i en AGG-funktion :

AGG (SUM (salg) / SUM (fortjeneste))

Dette er hvad der er kendt som en Samlet beregning .

Tableau LOD: Aggregering og LOD-udtryk

LOD-udtryk er grovere end udsigtsniveauet

Et udtryk har et grovere detaljeringsniveau end visningen, når det refererer til a delmængde af dimensionerne i udsigten.

For eksempel til en visning, der indeholdt dimensionerne [Kategori] og [Segment], kan du oprette et detaljeringsniveau i Tableau, der kun bruger en af ​​disse dimensioner:

{FAST [Segment]: SUM ([salg])}

I dette tilfælde har udtrykket et grovere detaljeringsniveau end udsigten. Det baserer sine værdier på en dimension ([Segment]), hvorimod udsigten baserer sin opfattelse på to dimensioner ([Segment] og [Kategori]).

Resultatet er, at brug af detaljeringsniveauet i visningen får visse værdier til at replikeres - det vil sige til vises flere gange .

LOD-ekspression er finere end udsigtsniveauet

Et udtryk har et finere detaljeringsniveau end visningen, når det refererer til a overmængde af dimensionerne i udsigten.

Når du bruger et sådant udtryk i visningen, samler Tableau resultater op til visningsniveauet. For eksempel refererer det følgende detaljeringsniveau i Tableau til to dimensioner:

{FAST [Segment], [Kategori]: SUM ([Salg])}

Når dette udtryk bruges i en visning, der kun har [Segment] som detaljeringsniveau, er værdierne skal aggregeres . Her er hvad du ville se, hvis du trak dette udtryk til en hylde:

AVG ([{FAST [Segment]], [Kategori]]: SUM ([Salg]]}}))

En sammenlægning (i dette tilfælde gennemsnit) tildeles automatisk af Tableau. Du kan ændre sammenlægningen efter behov.

Tilføjelse af et LOD-udtryk til visningen

Om et detaljeringsniveau i Tableau-udtryk er aggregeret eller replikeret i visningen bestemmes af ekspressionstype og granularitet .

  • INKLUDER udtryk har enten det samme niveau af detaljer som udsigten eller et finere detaljeringsgrad end udsigten. Derfor replikeres værdier aldrig.
  • FASTE udtryk kan have et finere detaljeringsniveau end udsigten, et grovere detaljeringsniveau eller det samme niveau af detaljer. Behovet for at samle resultaterne af et FIKTET detaljeringsniveau afhænger af, hvilke dimensioner der er i visningen.
  • EXCLUDE-udtryk får altid replikerede værdier til at vises i visningen. Når beregninger inklusive EXCLUDE niveau af detaljeringsudtryk placeres på en hylde, er Tableau som standard standardindstillingen ATTR-aggregering i modsætning til SUM eller AVG, for at indikere, at udtrykket faktisk ikke aggregeres, og at ændring af aggregering ikke har nogen effekt på udsigten.

Detaljeringsniveauudtryk pakkes altid automatisk sammen, når de føjes til en hylde i visningen, medmindre de bruges som dimensioner.

Tableau LOD: Filtre og LOD-udtryk

Billedet her viserrækkefølge for udførelse af filtre fra top til bund.Teksten til højre viser, hvor LOD-udtryk evalueres i denne sekvens.

Uddragsfiltre (i orange) er kun relevante, hvis du opretter en Tableau-uddrag fra en datakilde. Tabelberegningsfiltre (mørkeblå) anvendes, når beregningerne er udført, og skjuler derfor mærker uden at filtrere de underliggende data, der er brugt i beregningerne.

FASTE beregninger anvendes før dimensionsfiltre, så medmindre du promoverer felterne på din filterhylde for at forbedre visningsydelsen med kontekstfiltre, ignoreres de.

Tableau LOD: Typer af LOD-udtryk

INKLUDERER Beregning

INCLUDE beregner værdier ved hjælp af de angivne dimensioner ud over de dimensioner, der er i visningen. Dette detaljeringsniveau er mest nyttigt, når man inkluderer en dimension, der ikke er i visningen.

For eksempel: {INCLUDE [Customer Name]: SUM ([Sales])}

EKSKLUDERING Beregning

UDELUKKE fjerner eksplicit dimensioner fra udtrykket - det vil sige, de trækker dimensioner fra detaljeringsniveauet. Dette niveau af detaljer i Tableau er mest nyttigt til at eliminere en dimension i visningen.

For eksempel: {EXCLUDE [Region]: SUM ([Sales])}

FAST beregning

FIXED beregner værdier ved hjælp af de angivne dimensioner uden henvisning til detaljeringsniveauet - det vil sige uden henvisning til andre dimensioner i visningen. Dette detaljeringsniveau ignorerer også alle filtre i visningen bortset fra kontekstfiltre, datakildefiltre og ekstraktfiltre.

For eksempel: {FAST [Region]: SUM ([Salg])}

stigende rækkefølge c ++

Tableau LOD: Oprettelse af LOD-udtryk

Syntaks for et LOD-udtryk

Et detaljeringsniveau har følgende struktur:

OMFATTE

Trin 1: Opsæt visualiseringen

  1. Åbn Tableau Desktop, og opret forbindelse til Prøve-Superstore gemt datakilde.
  2. Naviger til et nyt regneark.
  3. Fra Data træk under Dimensioner Område til Kolonner Hylde.
  4. Fra Data træk under Mål Salg til Rækker Hylde. Der vises et søjlediagram, der viser summen af ​​salget for hver region.

Trin 2: Opret LOD-udtrykket

I stedet for summen af ​​alt salg pr. Region, vil du måske også se det gennemsnitlige salg pr. Kunde for hver region. Du kan bruge et LOD-udtryk til at gøre dette.

  1. Vælg Analyse > Opret beregnet felt.
  2. Gør følgende i beregningseditoren, der åbnes:
    • Navngiv beregningen, salg pr. Kunde.
    • Indtast følgende LOD-udtryk:

      {INCLUDE [Customer Name]: SUM ([Sales])}

  3. Når du er færdig, skal du klikke på Okay. Det nyoprettede LOD-udtryk føjes til dataruden under Målinger.

Trin 3: Brug LOD-udtrykket i visualiseringen

  1. Fra Data træk under Mål Salg pr. Kunde til Rækker hylden og placer den til venstre for SUM (salg).
  2. Højreklik på rækkehylden Salg pr. Kunde og vælg Mål (sum) > Gennemsnit. Du kan nu se både summen af ​​alt salg og det gennemsnitlige salg pr. Kunde for hver region. For eksempel kan du se, at salget i den centrale region udgjorde ca. 500.000 USD med et gennemsnitligt salg for hver kunde på ca. 800 USD .

Tableau LOD: Datakilder, der understøtter LOD-udtryk

Datakilde Understøttet / Ikke understøttet
Actian VectorwiseIkke understøttet.
Amazon EMR Hadoop HiveUnderstøttet Hive 0.13 og fremefter.
Amazon RedshiftUnderstøttet.
Aster-databaseUnderstøttet version 4.5 og fremefter.
Cloudera HadoopUnderstøttet Hive 0.13 og fremefter.
Cloudera ImpalaUnderstøttet Impala 1.2.2 og fremefter.
Kuber (flerdimensionelle datakilder)Ikke understøttet.
DataStax EnterpriseIkke understøttet.
EXASOLUnderstøttet.
FirebirdUnderstøttet version 2.0 og fremefter.
Generisk ODBCBegrænset. Afhænger af datakilde.
Google Big QueryUnderstøttes til Standard SQL, ikke Legacy.
IBM DB2Understøttet version 8.1 og fremefter.
MarkLogicUnderstøttet version 7.0 og fremefter.
SAP HANAUnderstøttet.
SAP Sybase ASEUnderstøttet.
SAP Sybase IQUnderstøttet version 15.1 og fremefter.
Gnist SQLUnderstøttet.
SplunkIkke understøttet.
DataekstraktabelUnderstøttet.
TeradataUnderstøttet.
VerticaUnderstøttet version 6.1 og fremefter.
Microsoft AccessIkke understøttet.
Microsoft Jet-baserede forbindelserIkke understøttet.
Hortonworks Hadoop HiveUnderstøttet Hive 0.13 og fremefter.

På version 1.1 af HIVE er LOD-udtryk, der producerer krydsforbindelser, ikke pålidelige.

IBM BigInsightsUnderstøttet.
Microsoft SQL ServerUnderstøttet SQL Server 2005 og fremefter.
MySQLUnderstøttet.
IBM PDA (Netezza)Understøttet version 7.0 og fremefter.
OracleUnderstøttet version 9i og fremefter.
Actian Matrix (ParAccel)Understøttet version 3.1 og fremefter.
Pivotal GreenplumUnderstøttet version 3.1 og fremefter.
PostgreSQLUnderstøttet version 7.0 og fremefter.
Fremskridt OpenEdgeUnderstøttet.

Tableau LOD: Tabelberegninger vs LOD

LOD-udtryk er ikke en ny form for tabelberegninger. Selvom de kan erstatte mange tabelberegninger, er deres hovedmål at åbne nye muligheder.LOD-udtryk og tabelberegninger fungerer forskelligt.

Tabelberegninger LOD-udtryk
Tabelberegninger genereres af Forespørgselsresultater .LOD-udtryk genereres som en del af forespørgslen til underliggende datakilde . De udtrykkes som et indlejret valg, så det afhænger af DBMS-ydeevne.
Tabelberegninger kan producerer kun resultater, der er lig med eller mindre granulære end den nævnte LOD.LOD kan producere resultater uafhængig af nævnte LOD .
Dimensioner, der styrer operationerne i en tabel, er adskilt fra beregningssyntaxen.Dimensioner, der styrer operationerne af et LOD-udtryk er indlejret i udtrykket sig selv.
Tabelberegninger bruges som aggregerede foranstaltninger .LOD-udtryk kan bruges i andre konstruktioner.
Filtre i tabelberegninger fungerer som en SKJULE .Filtre på LOD fungerer som en UDELUKKE .

Tableau LOD: Begrænsninger af LOD

Følgende er de begrænsninger, der gælder for LOD-udtryk.

  • LOD-udtryk, der henviser til mål med flydende punkt, har tendens til at opføre sig upålideligt, når de bruges i en visning, der kræver en sammenligning af værdierne i udtrykket.
  • LOD vises ikke på datakildesiden.
  • Når der henvises til en parameter i en dimensionalitetserklæring, skal du altid bruge parameternavnet og ikke parameterværdien.
  • Når data blandes, skal linkfeltet fra den primære datakilde være i visningen, før du kan bruge et detaljeringsniveauudtryk fra den sekundære datakilde.

Derudover har nogle datakilder kompleksitetsgrænser. Tableau deaktiverer ikke beregninger for disse databaser, men forespørgselsfejl er en mulighed, hvis beregninger bliver for komplekse.