Datall's first blog

Datall's first blog

Wie en wanneer?: Survival analysis brengt klantgedrag in kaart

Data analysisPosted by Stefan Gelissen 15 May, 2014 09:12

Survival analysis is een wiskundige analyse die ondermeer voorspelt wanneer een gebeurtenis (bijv. opzeggen van abonnement) gaat plaatsvinden.
In deze blog geef ik eerst een korte uitleg van survival analysis aan de hand van voorbeelden uit de medische wereld en engineering. Vervolgens passeren enkele toepassingen de revue die betrekking hebben op klantgedrag (zoals “klantbehoud” en “terugwinnen van klanten”).
Duidelijk zal worden dat de analyse twee belangrijke vragen beantwoordt: (1) wie van de klanten gaat bepaald gedrag vertonen (bijv. opzeggen abonnement) en (2) wanneer in de loop van de tijd gaan deze klanten dit gedrag vertonen. Door deze twee eigenschappen bewijst survival analysis in de praktijk keer op keer haar nut bij het adequaat reageren op klantgedrag.


Wat is survival analysis?
Survival analysis is een wiskundige methode die helpt bepalen of en wanneer een gebeurtenis gaat plaatsvinden. Tevens gaat deze analyse na in welke mate bepaalde factoren de timing van een gebeurtenis beïnvloeden. Het volgende praktijkvoorbeeld maakt snel duidelijk wat de analyse doet.


Praktijkvoorbeeld
In sommige medische studies wordt onderzocht wat het effect is van een behandeling op de levensverwachting. Met andere woorden, beïnvloedt de behandeling hoelang iemand leeft bij een levensbedreigende ziekte? Survival analysis is één van de meest gebruikte methoden om aan te tonen of een behandeling daadwerkelijk invloed heeft op de levensverwachting. Onderstaande grafiek illustreert hoe de analyse het effect in beeld brengt van hormonale therapie op de levensverwachting bij borstkanker*.



(klik hier voor een grotere weergave van de afbeelding)

De grafiek toont dat bij een groter aantal positieve lymfeklieren (d.w.z. klieren die kankercellen bevatten) de levensverwachting daalt. Maar bij eenzelfde aantal positieve lymfeklieren (bijv. 20) is de levensverwachting groter indien hormonale therapie wordt toegepast. Dit is te zien in de grafiek: De rode lijn (therapie) ligt boven de blauwe (geen therapie) wat duidt op een grotere levensverwachting bij hormonale therapie.
In dit voorbeeld maakt survival analysis dus duidelijk wat de invloed is van factoren (therapie/aantal positieve lymfeklieren) op de timing van een gebeurtenis (hoelang een persoon met borstkanker overleeft).
Ook op het gebied van engineering wordt survival analysis toegepast. Zo wordt deze analyse ondermeer gebruikt om te onderzoeken hoe verschillende temperatuursomstandigheden de levensduur van een motor beïnvloeden. Hierdoor kom een engineer te weten wanneer een motor het begeeft bij een bepaalde bedrijfstemperatuur.
Maar niet alleen binnen de medische wetenschap en engineering wordt survival analysis gebruikt, ook op het gebied van klantgedrag levert deze analyse een significante bijdrage.


Klantbehoud
Klanten die hun abonnement opzeggen of contract niet verlengen gaan verloren voor een bedrijf. Ook klanten die na verloop van tijd nooit meer bestellingen plaatsen zijn verloren klanten.
Toch ligt thans meer en meer de nadruk op het behouden van bestaande klanten. Daar zijn tal van redenen voor op te noemen. Vaak duurt het bijvoorbeeld een hele poos voordat nieuwe klanten evenveel afnemen als bestaande klanten.
Survival analysis is van belang voor bedrijven die actief bezig zijn met klantbehoud. Deze analyse is namelijk in staat te voorspellen wanneer bepaalde klanten het bedrijf verlaten (zogenaamde churners). Met deze voorspellingen in de hand kan een bedrijf proactief reageren op churners. Nog voordat churners daadwerkelijk het bedrijf gaan verlaten worden ze (proactief) benaderd. De kunst daarbij is toekomstige churners tijdig te belonen zodat ze toch klant blijven. Dit kan bijvoorbeeld door ze een aanbieding te doen.

Maar waarom nu zo moeilijk doen en precies willen voorspellen wanneer een klant het bedrijf verlaat? Waarom niet gewoon wachten tot een klant daadwerkelijk weggaat en dan pas een aanbieding doen? Dit achteraf reageren op churners heeft nadelen. Blattberg, Kim en Neslin (2008) suggereren bijvoorbeeld dat pas achteraf reageren op churners een bepaald leereffect bij deze groep tot gevolg heeft. Deze groep gaat namelijk het verband inzien tussen beloning en churn. Om deze beloning in de wacht te slepen zullen churners keer op keer gaan dreigen het bedrijf te verlaten en over te stappen naar de concurrent.

Niet alleen voorspelt survival analysis wie en wanneer, het brengt ook in kaart welke factoren een belangrijke rol spelen bij klantbehoud. In het bovenstaande voorbeeld met borstkanker toonde de analyse al aan hoe de levensverwachting beïnvloed werd door factoren als (1) het aantal positieve lymfeklieren en (2) hormonale therapie.
Zo ook kan de analyse bepalen in welke mate specifieke factoren hun uitwerking hebben op klantbehoud. Bijvoorbeeld, voor een verzekeraar zal de analyse duidelijk maken of een factor als “aantal aangeschafte producten” van invloed is op klantbehoud. Daarbij wordt verondersteld dat hoe meer verschillende verzekeringproducten lopen bij de verzekeraar, des te groter de kans dat een klant langer blijft. Bevestigt de analyse dit verband, dan kan een verzekeraar overwegen de nadruk te leggen op het verkopen van meerdere producten bij één en dezelfde klant. Immers, op die manier blijven klanten langer behouden.


Andere toepassingen van survival analysis
Survival analysis kent buiten klantbehoud tal van andere toepassingen op het gebied van klantgedrag. Deze analyse is nuttig als de vragen wie en wanneer kunnen worden gesteld. Bijvoorbeeld:

  • Tijd tussen aankopen - Bij herhalingsaankopen van hetzelfde product (bijvoorbeeld koffie) kan de tijd tussen aankopen worden gemodelleerd. Door de analyse wordt ondermeer duidelijk in welke mate factoren (zoals gezinsgrootte en prijsverschil) van invloed zijn op de tussenaankooptijd.
  • Heractiveren van abonnement (terugwinnen van klanten) - Bij het opzeggen van een abonnement kan het zijn dat een klant na verloop van tijd dit toch weer heractiveert. Survival analysis brengt in kaart welke factoren maken dat klanten na verloop van tijd hun abonnement heractiveren. Een bedrijf kan overwegen op deze factoren in te spelen om klanten snel terug te winnen.

Heterogeniteit: Verschillen tussen klantgroepen
Vaak is het raadzaam om bij het modelleren en voorspellen van klantgedrag rekening te houden met verschillen tussen klantgroepen (zogenaamde heterogeniteit). Zo ook bij het toepassen van survival analysis. Nemen we eens “heractiveren van een abonnement” onder de loep. Er zullen klanten zijn die na verloop van tijd het abonnement daadwerkelijk heractiveren. Maar er zal ook een groep zijn die nooit en te nimmer het abonnement heractiveert. We kunnen dus twee groepen onderscheiden die zich ieder verschillend gedragen in de loop van de tijd: (1) heractiveren en (2) niet heractiveren.
Houdt survival analysis rekening met dergelijke verschillen tussen groepen? De “traditionele” survival analysis niet. Eén van de aannames bij deze analyse is namelijk dat iedereen uiteindelijk een specifieke gebeurtenis zal ondergaan. Bij “heractiveren” betekent dit dat de analyse veronderstelt dat iedere verloren klant uiteindelijk het abonnement heractiveert. Deze aanname klinkt niet plausibel in de oren, juist vanwege het zonet beschreven verschil tussen de twee groepen wat betreft wel/niet heractiveren.


Mixed cure models: Modelleren van verschillen tussen klantgroepen
Recentelijk is een type survival analysis in opkomst dat wel geschikt is als het gaat om dit soort verschillen tussen groepen: Mixed Cure Model. Simpelweg, dit model gaat uit van twee groepen die van elkaar verschillen in gedrag. Daarbij veronderstelt het model dat één groep de gebeurtenis zal ondergaan (wel heractiveren) terwijl de andere deze nooit ondergaat (niet heractiveren). Tevens bepaalt het voor de eerste groep (wel heractiveren) wanneer deze gebeurtenis gaat plaatsvinden.

Een toepassing binnen de bankwereld van het mixed cure model wordt beschreven door Teng, Kim & Thomas (2012). Bij kredietverstrekking bestaat de kans dat bepaalde consumenten het krediet niet aflossen (zogenaamde defaults). Maar ook is er een groep die het krediet wél binnen de gestelde termijn aflost. Teng en zijn collega’s wilden met het model in kaart brengen (1) wie wel/niet tot de defaults-groep gaat behoren en (2) hoelang duurt het voordat een default stopt met terugbetalen.
De analyseresultaten tonen ondermeer dat factoren als “bezit van een huis” en “hogere frequentie bij terugbetalen” resulteren in een kleiner risico dat iemand tot de defaults-groep behoort. Tegelijkertijd geldt voor de defaults-groep dat mensen die individueel een lening afsluiten (single loan) een groter gevaar lopen om eerder te stoppen met terugbetalen dan personen die gezamenlijk een lening afsluiten (joint loan).

Naar mijn mening zijn ook op het gebied van marketing interessante toepassingen te vinden van het mixed cure model. Maar tot op heden lijkt dit een onontgonnen gebied. Het eerder besproken “heractiveren van abonnement” is een kandidaat als het gaat om mogelijke toepassingen. In die context zal het model ondermeer helder maken welke factoren bepalen of een klant wel/niet ooit heractiveert. Hierbij kan gedacht worden aan factoren als “aantal doorgegeven klachten tijdens abonnementsperiode”. Wellicht is het zo dat bij meer klachten het risico stijgt dat een klant gaat behoren tot de groep “nooit heractiveren”. Maar dit is iets waar het mixed cure model over zal moeten beslissen.
In ieder geval zullen de door het mixed cure model geïdentificeerde factoren van waarde zijn bij het invullen van toekomstig klantbeleid.


Meer informatie?
Wilt u meer informatie over het toepassen van survival analysis of het mixed cure model? Neem dan contact op met Datall (tel: 06 413 00 472; email: info at datall-analyse.nl) of raadpleeg www.datall-analyse.nl.


dr.ing. Stefan Gelissen
data-analist en analyse-ontwikkelaar bij Datall


* Data is afkomstig van Peters, A., en Hothorn, T. (2012). ipred: Improved Predictors. R package version 0.8-13, URL http://cran.r-project.org/web/packages/ipred/


Gebruikte literatuur

  • Blattberg, R.C., Kim, B., & Neslin S.A. (2008). Database marketing. Springer, NewYork.
  • Teng, E.N.C., Mues, C., & Thomas, L.C. (2012). Mixture cure models in credit scoring: If and when borrowers default. European journal of operational research, 218, 132-139.