Forudsigelig Analytics-proces i Business Analytics med R

Bloggen giver en kort idé om forudsigelig Analytics-proces i Business Analytics med R



Typisk modelleringsproces:

I en typisk modelleringsproces er det vigtigt at begynde at tegne en hypotese. En RFP (anmodning om forslag) modtages, og derefter tegnes en hypotese.



  1. Bestem den rigtige datakilde - Her kan kunden give datakilde, hvis ikke, skal vi kigge efter en datakilde. I betragtning af et scenarie, hvor vi forsøger at evaluere, hvem der ville vinde valget, foretages en offentlig analyse af data med kilder, der inkluderer sociale medier, nyhedskanaler eller opinion. Vi er også nødt til at forstå mængden af ​​data, der er nødvendige for at analysere problemet. I dette tilfælde ser vi typisk efter store prøver, da det er en valgsag. På den anden side, hvis analysen er udført på Healthcare, er det svært at gå efter en stor befolkning, fordi der er en mulighed for ikke at få nok mennesker til at validere hypotesen. Også kvaliteten af ​​data er meget vigtig.
  2. Uddrag data - Hvis vi for eksempel tager en befolkningsprøve, kan vi se på attributter, såsom høj indkomst, lav indkomst, alder, arbejdende befolkning (offsite / onsite), beboere, NRI, dækning af hospitaler osv. For at indlede undersøgelsen . Her har vi muligvis ikke brug for så mange attributter til hypotesen. Vi forstår, at egenskaber såsom høj og lav indkomst måske ikke er de medvirkende faktorer til at bestemme, hvem der vinder valget. Men alder kan gøre en forskel, da det vil give en direkte optælling af, hvor mange mennesker der skal stemme. Mange gange udelukker vi måske mindre anvendte attributter eller inkluderer attributter, der er nyttige. Det kunne gå galt i begge tilfælde. Det er grunden til, at analyse er en udfordring.
  3. Massér dataene, så de passer til værktøjet - Dette er fordi ikke alle værktøjer kan acceptere alle data. Visse værktøjer accepterer kun CSV-data eller excel-data. Mangel på værktøjer er en udfordring.
  4. Kør analysen - Denne operation kan udføres ved hjælp af mange analyseteknikker.
  5. Drage konklusioner - Analysen giver tal for at være præcise. Men det er op til en bruger at udlede konklusioner ud af disse tal. For eksempel, hvis der står 10% eller 20%, skal vi forstå, hvad det betyder? Stammer det sammenhæng mellem attribut A og attribut B?
  6. Implementere resultater - Det er vigtigt at implementere konklusioner for at se resultater i forretningen. For eksempel kan det konkluderes, at 'Folk køber paraply i regntiden' hvilket kan resultere i flere forretninger. Her er vi nødt til at implementere konklusion, hvor vi laver paraply, tilgængelig i butikker, men så kan det have ledelsesproblemer. I det øjeblik statistikker giver resultat, kan implementeringen gå galt.
  7. Overvåg fremskridt - Det sidste trin her, overvågning spiller en vigtig rolle. Overvågning kan gå galt, fordi ikke mange organisationer ønsker at overvåge fremskridt, og det betragtes som et ubetydeligt skridt. Men overvågning er vigtig, som vi kan forstå, hvis vores forskning og konklusioner går i den rigtige retning.

Tjek også denne artikel'' Korrelation betyder ikke årsag ''hvilket giver et indblik i, hvordan analytikere kan gå galt. Et vigtigt punkt at bemærke i dette diagram er, at løbeanalyse er det eneste trin, hvor maskinen er ansvarlig, og ud over det er det op til et menneske, der i sidste ende vil bestemme, hvordan forskningen udføres.

kandidatbevis vs mestre

Har du et spørgsmål til os? Nævn dem i kommentarfeltet, så vender vi tilbage til dig.



Relaterede indlæg: