Presentasjon lastes. Vennligst vent

Presentasjon lastes. Vennligst vent

Hvordan øke forretningsverdien av dine data

Liknende presentasjoner


Presentasjon om: "Hvordan øke forretningsverdien av dine data"— Utskrift av presentasjonen:

1 Hvordan øke forretningsverdien av dine data
Are Skaar

2 Agenda Hva er datamining Microsofts Løsning 1 (Table analysis Demo)
Hvilke bruksområder har DM Datamining som prosess Crisp DM Microsofts Løsning 2 (Data Mining plugin Demo) Case, Kundeanalyse Casebeskrivelse Forretningsmessig utfordring Forventet forretningsverdi Funn

3 Hva er Data Mining? Forretningsdrevet bruk av matematiske og statistiske teknikker for å identifisere sammenhenger, mønstre og trender i data.

4 Demo... Microsoft SQL Server 2005 Data Mining Add-ins for Office 2007
Table Analysis Tools for Excel Data Mining Client for Excel Data Mining Templates for Visio

5 Klassifisering Klassifisérer til en av flere predefinerte klasser
Kan benyttes for prediksjon av diskrete variable i et datasett. Algoritmer som kan benyttes til en rekke formål. F.eks prediksjon av enkeltkunders respons på en DM. Klassifisering er den mest brukte algoritmen til datamining. Menneskets natur å klassifisere data, eks. Hunderaser, bransjer osv. Eks: Klassifisering av nøkkelord i artikler Risikoklassifiseringer av kredittsøknader Beregne klassifiserende kundedemografi ved manglende data +++

6 Segmentering Inndeling av data i ”grupper”, hvor data i gruppene har sammenlignbare egenskaper eller adferd. Brukes ofte til gruppéring av kunder basert på demografi Kan benyttes for gruppéring i forkant av andre typer datamining Hovedforskjell mellom segmentering og klassifisering er at segmentering ikke trenger predefinerte klasser. Klassene dannes av algoritmen. Eks: Beregne segmenter av kunder som har lignende kjøpsmønster i forkant av en kampanje basert på klassifiseringsalgoritmer

7 Estimering/Prediksjon
Prediksjon av kontinuerlige variable i et datasett. Brukes for å predikere tallverdier som f.eks Total kundeverdi, salgsforecast, varebeholdning, bemanningsbehov. Estimering kan benyttes for å berike eksisterende data med estimerte verdier. Estimering er likt klassifisering med unntak av at output er kontinuerlig. Prediksjon tar i tillegg hensyn til tidsdimensjonen for å predikere i henhold til trender

8 Assosiasjon ”Nytt på Nytt” algoritmen. Gir svar på hva som hører sammen. Regelbasert Er svært mye brukt for ”handlekurv-analyser” Benyttes for kryssalgs analyser Eksempel: En dagligvarekjede i statene fant at menn som kjøpte bleier på torsdager og lørdager også handlet øl. Dette gjorde at kjeden flyttet øl og bleier i nærheten av hverandre, og at de ikke kjørte kampanjer på øl torsdager og lørdager. Dermed økte ølomsetningen.

9 Sekvensanalyser Inndeling av data i ”grupper”, hvor data i gruppene har sammenlignbare sekvens Benyttes for klikkstrømsanalyser, og andre sammenhenger hvor man har en sekvens av hendelser.

10 Algoritmematrise Estimering Segmentering Prediksjon Text Analysis
Avansert Data utforskning Segmentering Prediksjon Klassifisering Estimering Assosiasjon Text Analysis Association Rules Clustering Decision Trees Linear Regression Logistic Regression Naïve Bayes Neural Nets Sequence Clustering Time Series

11 Prosessen

12 Datamining teknikker Hypotesetesting
Top-down Bottom-up Rettet Knowledge Discovery in Databases (KDD) Finne forklaring på verdiene i et felt Resultatorientert Urettet Knowledge Discovery in Databases (KDD) Slipp algoritmene løs, og se om de finner meningsfulle sammenhenger i data. Resulterer ofte i hypoteser, eller behov for å forklare verdiene i et felt Hypotesetesting: Forretning fremlegger hypoteser som senere søkes bekreftet eller avkreftet gjennom statistiske dataanalyser Rettet KDD: Hvilke produkter vil øke som følge av at vi fjerner et spesifikt produkt? Hva vil Livstidsverdien på denne kunden være? Urettet KDD: Clustering, og handlekurvanalyser er eksempler på denne teknikken. Resulterer ofte i et behov for å benytte en av de andre teknikkene

13 Demo... Microsoft SQL Server 2005 Data Mining Add-ins for Office 2007
Table Analysis Tools for Excel Data Mining Client for Excel Data Mining Templates for Visio

14 Hvem bruker Data Mining
Selskaper med fokus på Retail Finans Forsikring Telecom Salgs/markedsorganisasjoner

15 Hvordan kan datamining hjelpe deg?
Identifisere dine beste prospects, og beholde dem som kunder. Gjennom å fokusere på dine beste prospects, effekiviseres markedsføring og salg, som igjen fører til økt lønnsomhet. Endringer i kundeadferd kan varsle om at kunden er i ferd med å falle fra, slik at du kan sette i verk tiltak for å forhindre avgangen. Finne kryssalgsmuligheter og tilby anbefalinger. Hjelp kundene å finne produkter som har relevans for dem, samtidig som du øker verdien av kommunikasjonen med kunden. Finne hvilke parametre som påvirker trender i salg og marginer. Tradisjonell analyse forutsetter at du vet hva som påvirker nøkkeltallene dine. Det kan være helt andre parametre enn du tror. Segmentére kunder og marked og skreddersy kommunikasjonen. Kundene dine kan være svært forskjellige. Pensjonister i Alta og tenåringer i Bergen vil skjelden treffes av samme kampanje.

16 Case Sperre Industrier er et industriselskap som leverer startluftkompressorer til skip. Lønnsomheten ligger i reservedeler og tjenester i ettermarkedet Klarer ikke å analysere ettermarkedet pga store datamengder og forskjellige datakilder som ikke er integrert Individkartotek for kompressorer plassert om bord i cirka skip Lloyds Fairplay: Oppdatert informasjon for samtlige skip og redere (>1 skip)

17 Forretningsmessig utfordring
Selskapet har behov for å vite mer om sine kunder Utstrakt bruk av piratkomponenter truer markedsandelene i ettermarkedet Handler på etablerte hypoteser og magefølelse

18 Forventet forretningsverdi
Sperre kan benytte egne salgstall i kombinasjon med markedsdata fra Fairplay. Hensikten er å øke lønnsomheten på kundeporteføljen gjennom anvendt bruk av Data mining.

19 Funn Enkelte etablerte sannheter viser seg å være feilaktige.
Sentrale forretningsregler viser seg å være unøyaktige. Modellene klarte med rimelig god nøyaktighet å treffe på valideringsdata. Vil gi kunden mulighet til å plukke ut de potensielt mest lønnsomme kundene basert på offentlig tilgjengelig kundedemografi.

20 Funn 2 Forretningens definisjon av ”pirat”-kunde er sannsynligvis feil, basert på en hypotese om at offshore næringen ikke benytter pirat-deler. Det ble påvist at offshore-næringen benytter piratdeler gitt definisjonen, men i betydelig mindre grad enn gjennomsnittet. Andre parametre var betydelig mer signifikante.

21 Funn 3 Flåtestørrelse var mest signifikant. Denne parameteren er høyt korrelért med geografi, spesiellt for Norge. Kunder med veldig små, og veldig store flåter er betydelig mer eksponert for bruk av piratdeler enn kunder med flåtestørrelser på 2-54 skip. Hvis en kunde har en større andel av flåten som allerede har produkter fra vår leverandør inne, vil denne kunden være mindre eksponert for bruk av piratdeler Rabattordninger/pris er signifikant. Rabatt reduserer sannsynligheten for bruk av piratdeler.

22 Screenshots

23 Naive Bayes Dependency network

24 Dependency network Viser hvilke parametre som har sterkest betydning for hvorvidt en kunde vil benytte piratkomponenter.

25 Descision tree viewer

26 Descision tree viewer Viser en trestruktur av parametre med verdier som beskriver statusen på en kundes sannsynlighet for å benytte piratdeler

27 Naive Bayes Attribute Characteristics

28 Naive Bayes Attribute Characteristics
Sorterer parametre og verdier etter sannsynlighet. I dette tilfellet for at en kunde benytter piratdeler

29 Alle Modeller

30 Modeller med alle parametre

31 Modeller med markedsdata

32 Hypotesemodell kompressoralder

33 Classification matrixes


Laste ned ppt "Hvordan øke forretningsverdien av dine data"

Liknende presentasjoner


Annonser fra Google