Prediksjon og modellering av kundeavgang fra Gjensidige Clara-Cecilie Günther, Ingunn Fride Tvete, Geir Inge Sandnes, Ørnulf Borgan, Kjersti Aas Statistics for Innovation (SFI)2 SFI-dag finans, NR, 20.10.2011
Innledning Lett å bytte forsikringsselskap. Ustabil kundemasse. Vanskelig å tiltrekke seg nye kunder. Behold de eksisterende. Hvilke kunder har størst sannsynlighet for å forlate selskapet? Kundeavgang: Kunde sier opp alle polisene. www.clipart.com http://www.newsviewspedia.com/insurance.html
Data fra Gjensidige Bil, bolig og personforsikring November 2007 – mai 2009 (19 måneder) 160 000 kunder www.clipart.com
Modell I La og Kunde Måned Respons Forklaringsvariable 1 2007/11 Y1,2007/11 2007/12 Y1,2007/12 X1,2007/11 . 2009/05 Y1,2009/05 X1,2009/04 2 2008/02 Y2,2008/02 2008/03 Y2,2008/03 X2,2008/02
Model II Trinn 1: Bruk generaliserte additive modeller (GAM) til å oppdage ikke-lineære sammenhenger mellom og Trinn 2: Tilpass generalisert lineær modell (GLM) med variable definert fra trinn 1. .
Forklaringsvariable Alder Kjønn Årspremie (totalt, bil, bolig, person) Levetid Antall poliser (totalt, bil, bolig, person) Rabatt Partner www.clipart.com www.photos.com
Variable definert fra GAM S(Alder) Alder
Redefinerte forklaringsvariable ToHjem: Mer enn to boligforsikringer. Hovedforsikringer: Antall hovedtyper forsikringer. ReturnertKunde: Tidligere kunde har returnert til selskapet. BilKansellert: Bilforsikring sagt opp sist måned. RabattEndring: Fra rabatt til ingen rabatt sist måned.
Endelig modell 10% av dataene brukes til å tilpasse modellen. Variable i modellen: Originale variable: Partner, Kjønn, Rabatt Fra GAM: log.Årspremie, Alder.T, Levetid.K Redefinert: Hovedforsikringer, ReturnertKunde, ToHjem,BilKansellert, Rabattendring Samspill mellom: Partner og log.Årspremie Hovedforsikringer og log.Årspremie Rabatt og log.Årspremie Rabatt og Hovedforsikringer Kjønn og Alder.T
Estimerte hovedeffekter Variabel Estimert effekt Returnert kunde 0.58 ToHjem -0.47 Levetid.K=1 Levetid.K=2 0.61 0.34 BilKansellert 0.16 RabattEndring 1.79 Se opp for "røde" kunder - disse har større sansynlighet for avgang!
Estimerte samspill Kunder med høy årspremie er mer lojale hvis deres partner også er kunde hos Gjensidige. Dersom man får rabatt avtar avgangssannsynligheten, og den avtar videre dersom antallet hovedtyper forsikring øker.
Prediksjon Samme tidsperiode: Ny tidsperiode: Gjenværende 90% av dataene, ikke brukt til modelltilpasning. Ny tidsperiode: Nye data: Juni 2009 – januar 2010 Testsett A: Kundene fra opprinnelig testsett. Testsett B: Kundene fra opprinnelig treningssett.
Resultater - prediksjon Klassifiseringsregel: Kunde med avgangssannsynlighet høyere enn valgt cut-off klassifiseres som avgått. ROC: Sann positiv rate mot falsk positiv rate for alle mulige cut-offs.
Flere resultater - prediksjoner Blant de 1000 høyeste prediksjonene predikerer modellen avgangskunder 15-18 ganger bedre enn tilfeldig gjetting. Prediksjonsevnen avtar ikke med tiden.
Lignende problem: Soft fraud Identifisere svindlere. Beregne sannsynlighet for at en kunde er svindler basert på et gitt sett av forklaringsvariable. Sette inn tiltak mot kundene med høy svindelsannsynlighet. Kan kanskje bruke samme metoder som for kundeavgang.
Avsluttende kommentarer Denne modelleringsteknikken kan brukes i customer relationship management (CRM). Identifisere kunder som vil forlate selskapet. Bedre enn tilfeldig gjetting. Modellen kan forbedres med mer informasjon. Vi vet ikke hvorfor kundene forlater selskapet.