Modelleringsteknikker i forretningsanalyse med R

Bloggen giver en kort introduktion af modelleringsteknikker i forretningsanalyse med R.



Forskellige modelleringsteknikker:

Vi kan opdele ethvert problem i mindre processer:



Klassifikation - er, hvor vi klassificerer dataene. For eksempel. sygdomme alle sygdomme udviser en vis adfærd, og vi kan klassificere dem yderligere.

For eksempel: sygdomme, der reducerer immunitet, sygdomme, der giver hovedpine osv.



Regression - indebærer at finde ud af forholdet mellem flere variabler.

For eksempel: hvordan et menneskes vægt er relateret til hans højde.

AnomoliOpdagelse - er dybest set en udsving.



For eksempel: I tilfælde af høj- eller lavspænding.

big data tutorial for begyndere

Et andet eksempel kan omfatte reguleret adfærd, der involverer kørsel i højre eller venstre side baseret på land. Anomoliet her er nogen, der kører fra det modsatte.

Et andet eksempel kan være netværksindbrud. Her logger en godkendt bruger ind på din virksomheds websted, og hvis nogen ikke-godkendt logger ind, er det enAn0moly.

Attributts betydning - Det giver dybest set flere attributter, såsom højde, vægt, temperatur, hjerterytme. Et punkt at bemærke er, at alle disse attributter er vigtige for en opgave.

For eksempel: Nogen prøver at forudsige, hvornår en person når kontoret. Hver attribut spiller en vigtig rolle, men ikke alle attributter er vigtige.

Foreningsregler - I enklere vendinger er det at analysere eller forudsige den næste adfærd, hvor den drejer sig om anbefalingsmotoren.

For eksempel: En person, der køber brød, kan også købe mælk. Hvis vi analyserer den tidligere shoppingadfærd, har alle varer i kurven en relation. I dette tilfælde kan der være en sandsynlighed for, at den, der køber brød, også køber mælk.

Klyngedannelse - Det er en af ​​de ældste teknikker inden for statistik. Faktisk kan man altid modellere ethvert problem, det være sig klassificering eller klyngedannelse, hvilket betyder at gruppere lignende enheder.

For eksempel:

1) Tag en kurv med æbler og appelsiner, hvor vi kan adskille æbler fra appelsiner.

2) En vigtig brugstilstand til klyngedannelse er sundhedspleje. Næsten alle statistikker og analyser startede med brugstilfælde af sundhedsydelser. For at gå dybere er der et klyngeudtryk kaldet kohorter (mennesker med lignende sygdomme), så de kan studeres adskilt fra eksisterende kunder. For eksempel, hvis 10 personer lider af feber og yderligere 10 personer med hovedpine, finder vi det, der er fælles mellem dem, og genererer medicin.

Ekstraktion af funktioner - Med hensyn til nøjagtighed af ekstraktion er gyldighed og fiasko ret relevant. Med andre ord kan udtræk af funktioner betegnes som mønstergenkendelse.

For eksempel:

Når en bruger indtaster et udtryk i Google-søgning, kommer det med resultater. Nu er et vigtigt spørgsmål, der skal stilles, hvordan vidste det, hvilken side er relevant og ikke-relevant for udtrykket? Dette kan besvares med funktionsextraktion og mønstergenkendelse, hvor det tilføjer fremtrædende funktioner. Lad os sige, at der gives et foto, visse kameraer registrerer ansigter, fremhæver ansigt for at give smukke billeder, som også bruger funktionsgenkendelse.

Overvåget læring vs Uovervåget læring

til) Forudsigelseskategori - Teknikkerne inkluderer regression, logistik, neurale netværk og beslutningstræer. Nogle eksempler inkluderer afsløring af svig (hvor en computer lærer og forudsiger den næste bedrageri fra tidligere svindelhistorie). I ikke-overvåget læring kan man ikke forudsige med eksempler, da der ikke er historiske data.

b) Klassificeringskategori - Hvis vi tager et eksempel, uanset om transaktionen er svigagtig eller ej, går den ind i klassifikationskategorien. Her tager vi historiske data og klassificerer det med beslutningstræer, eller hvis vi slet ikke tager nogen historiske data, så starter vi direkte på data og prøver at udnytte funktioner alene. For eksempel, hvis vi har brug for at kende de ansatte, som sandsynligvis vil forlade organisationen eller sandsynligvis bliver. I tilfælde af at det er en ny organisation, hvor vi ikke kan bruge historiske data, kan vi altid bruge klyngedannelse til dataudvinding.

c) Efterforskningskategori - Dette er en ligefrem metode, der kommer op på, hvad big data betyder. I ikke-overvåget læring kaldes det principkomponenter og klyngedannelse.

d) Affinitetskategori - her er flere elementer involveret såsom krydssalg / op-salg, markedskurvanalyse. I kurvanalysen er der ingen overvåget læring, da der ikke er nogen historiske data. Så vi tager data direkte og finder associationer, sekventering og faktoranalyse.

Har du et spørgsmål til os? Nævn dem i kommentarfeltet, så vender vi tilbage til dig.

Relaterede indlæg: