Datall's first blog

Datall's first blog

Maar mijn gevoel zegt…: Mens versus computer bij klantsegmentatie

Data analysisPosted by Stefan Gelissen 14 May, 2014 18:06

Klantsegmentatie wordt vaak toegepast door bedrijven. Het doel van segmentatie is het opdelen van klanten in groepen, en dient om beter in te spelen op verschillen tussen klanten. In deze blog beschrijf ik wat mis kan gaan als segmentatie wordt uitgevoerd door de mens of computer. Ook komt een nieuwe segmentatie-analyse van Datall aan bod die een oplossing biedt voor problemen met bestaande analyses.


Het wat en waarom van klantsegmentatie
Klanten verschillen van elkaar. Bij segmentatie worden klanten opgedeeld in groepen aan de hand van deze verschillen. Als input voor segmentatie worden klanteigenschappen genomen. Het doel is groepen zodanig samen te stellen dat klanteigenschappen binnen een groep zoveel mogelijk overeenkomen, terwijl de verschillen tussen segmenten zo groot mogelijk zijn.
Door segmentatie is een bedrijf in staat klantgroepen gedifferentieerd te benaderen, waarbij beter rekening gehouden wordt met verschillen in eigenschappen, voorkeuren en wensen. Zodoende krijgt ieder segment een specifieke klantbenadering wat betreft verkoopmethodiek, marketing, productaanbod en service. Resultaat van deze gedifferentieerde benadering: meer tevreden klanten.
Het vinden van segmenten gebeurd bij bedrijven (1) op basis van “gezond verstand” of “onderbuikgevoel”, of (2) met behulp van een wiskundige analyse (zogenaamde clusteranalyse) op een computer. Maar waarin verschillen nu deze twee manieren van elkaar, en welke verdient de voorkeur?


Zit het wel goed met dat “gezond verstand”?
Uit de besliskunde-literatuur is bekend dat “gezond verstand” in beslis- en beoordelingstaken niet altijd even accuraat is (voor een uitgebreid overzicht zie Gilovich, Griffin en Kahneman 2002). In taken waarin mensen (met name experts) wordt gevraagd voorspellingen te doen, zijn computermodellen bijna altijd evengoed en zelfs beter. Bijvoorbeeld, Grove en collega’s (2000) namen 136 onderzoeken onder de loep waarin voorspellingen van experts werden vergeleken met die van computermodellen. In slechts 8 van deze onderzoeken waren mensen beter dan computers in het genereren van voorspellingen. Computermodellen lijken ondermeer beter te zijn wanneer het gaat om het voorspellen van (a) succes bij het opstarten van een bedrijf, (b) prestatiesucces van werknemers en (c) succesvol leiderschap/management.
Bij deze voorspellingstaken draait het dikwijls om het combineren van verschillende eigenschappen (bijvoorbeeld leeftijd en opleidingsniveau). Bij segmentatie is dit niet anders. In veel gevallen beschik je als bedrijf voor iedere klant over scores op verschillende klanteigenschappen. Dit kan informatie zijn over bijvoorbeeld “aankoopfrequentie” of “branchetype”. Al deze gegevens tezamen zijn meestal verzameld in een database (of CRM-systeem). Door rekening te houden met meerdere klanteigenschappen tegelijk worden vaak de beste segmenten gevonden.
De sterkte van computermodellen ligt erin dat zij vaak beter dan mensen verschillende klanteigenschappen kunnen combineren om tot de juiste interpretatie te komen. Bij segmentatie valt het dus te betwijfelen of je als mens met “gezond verstand” of “onderbuikgevoel” beter gaat zijn dan een computermodel.


Is mijn onderbuikgevoel dan helemaal verkeerd?
Wat in de praktijk opvalt is dat bedrijven zich bij “onderbuikgevoel-segmentatie” regelmatig baseren op slechts één klanteigenschap (bijvoorbeeld “branchetype”). Daarbij is het is niet zo dat bedrijven niet op de hoogte zijn van verschillende andere klanteigenschappen, alleen laten ze deze buiten beschouwing bij segmentatie.
Dit richten op slechts één eigenschap lijkt trouwens veel op een verschijnsel dat optreedt bij de free sorting task in psychologisch onderzoek. Bij deze categorisatietaak wordt personen gevraagd verschillende objecten naar eigen inzicht te groeperen. De objecten in dit soort taken zijn ieder beschreven aan de hand van meerdere kenmerken. Wat vertellen de resultaten van deze categorisatietaak? Veelal vormen personen categorieën door het toepassen van een uni-dimensionale regel (Eysenck en Keane, 2000). Dat wil zeggen: Categoriseren gebeurt op basis van slechts één kenmerk (jongens bij de jongens, meisjes bij de meisjes). Dit laatste resultaat stemt opvallend veel overeen met wat gebeurd bij “onderbuikgevoel-segmentatie” bij bedrijven.
Helaas schuilt er een gevaar in bij segmenteren op basis van slechts één kenmerk. Indien alleen rekening wordt gehouden met één kenmerk, en niet met meerdere tegelijk, dan kunnen twee nadelen optreden.

  1. Binnen één segmentatiegroep kunnen verschillende groepen worden onderscheiden. Echter, alleen door rekening te houden met meerdere klanteigenschappen tegelijk zullen deze verschillende groepen worden opgemerkt. Bijvoorbeeld, een bedrijf segmenteert haar klanten op basis van alleen “branchetype” en komt zodoende tot de segmenten “overheid”, “zakelijke dienstverlening” en “financiële dienstverlening”. Echter, na verloop van tijd vermoedt het bedrijf dat binnen het segment “overheid” meerdere groepen kunnen worden geïdentificeerd, met ieder hun eigen wensen en eisen wat betreft klantbenadering. Juist door geen rekening te houden met deze verschillende groepen binnen het segment “overheid” is een nadelig effect opgetreden: Een grote groep ontevreden klanten.
  2. Verschillende segmenten zoals “financiële dienstverlening” en “zakelijke dienstverlening” vertonen zoveel overeenkomsten op meerdere kenmerken dat ze eigenlijk als één groep kunnen worden gezien. Toch kiezen voor twee aparte klantbenaderingen resulteert in een verspilling van belangrijke resources (bijvoorbeeld kosten die gemoeid zijn met het invoeren van twee aparte marketingstrategieën en productgroepen terwijl maar één nodig is).

Maar wanneer gaat het mis met computermodellen?
Nu rijst de vraag: Zit het wel altijd goed met die computermodellen? Een veel gebruikt computermodel voor segmentatie is clusteranalyse. Maar ook aan deze clusteranalyse kleeft een probleem. Het probleem met clusteranalyse is namelijk hoe het omgaat met categorische variabelen. Een voorbeeld van een categorische variabele is “branchetype” met een onderverdelingen in “overheid”, “zakelijke dienstverlening” en “industrie”. Een tegenhanger van dit type variabele is de numerieke variabele (bijvoorbeeld “leeftijd”). Bij het opnemen van categorische variabelen in een clusteranalyse (zoals het k-means/k-medoid algoritme) zie je vaak dat deze de segmentatie sturen en domineren (Wielinga, 2007). Dit komt erop neer dat de segmentatie-analyse voornamelijk aandacht richt op categorische variabelen, terwijl andere (numerieke) variabelen niet of nauwelijks worden meegenomen in het vormen van segmenten.
Het domineren van categorische variabelen is iets waar niet alle analisten van op de hoogte zijn wanneer ze een clusteranalyse uitvoeren. Maar de gevolgen van deze dominerende variabelen op segmentatie zijn even funest als bij “onderbuikgevoel-segmentatie”: De “juiste” segmenten worden niet altijd gevonden, waardoor verschillende klantgroepen niet altijd de juiste klantbenadering krijgen.
Eén mogelijke oplossing* voor de dominerende variabelen is ze gewoonweg weglaten uit de analyse. Maar dit weglaten is niet altijd even wenselijk. Daarom heeft Datall een analyse ontwikkeld die in staat is op gepaste wijze met categorische variabelen om te gaan. Bij deze analyse wordt een wiskundige methode toegepast waardoor categorische variabelen niet langer de segmentatie domineren. Een belangrijk gevolg hiervan is dat andere (numerieke) variabelen ook invloed krijgen op de vorming van segmenten. Daardoor is deze analyse daadwerkelijk in staat meerdere variabelen te combineren, in plaats van zich te richten op alleen categorische variabelen. Door dit combineren van meerdere eigenschappen wordt de kans groter dat de “juiste” segmenten worden gevonden. Voor deze “juiste” segmenten kan een klantbenadering worden uitgedacht waar alle klanten binnen een segment tevreden mee zullen zijn.
Daarnaast stelt de analyse per segment een handig profiel samen. Deze profielen geven de karakteristieke eigenschappen per segment weer en zijn nuttig voor het uitdenken van een doordachte klantgroepbenadering.


Meer informatie?
Wilt u meer informatie over de door Datall ontwikkelde segmentatie-analyse? Neem dan contact op met Datall (tel: 06 413 00 472; email: info at datall-analyse.nl) of raadpleeg www.datall-analyse.nl.


dr.ing. Stefan Gelissen
data-analist en analyse-ontwikkelaar bij Datall


*Wielinga (2007) stelt nog een andere oplossing voor, namelijk: Bij categorische variabelen voor iedere categorie een aparte clusteranalyse uitvoeren. Deze oplossing brengt echter ook de nodige problemen met zich mee. Voor een toelichting van deze problemen kunt u contact opnemen met de auteur van deze blog.


Gebruikte literatuur

  • Eysenck, M., & Keane, M., 2000. Cognitive psychology (pp. 294-295). Psychology press, East Sussex.
  • Gilovich, T., Griffin, D., & Kahneman, D. (Eds.), 2002. Heuristics and biases: The psychology of intuitive judgment. Cambridge University Press, Cambridge (UK).
  • Grove, W.M., Zald, D.H., Lebow, B.S., Snitz, & B.E., Nelson, C., 2000. Clinical versus mechanical prediction: a meta-analysis. Psychological Assessment, 12, 19-30.
  • Wielinga, D., 2007. Identifying and Overcoming Common Data Mining Mistakes, Paper 073-2007, SAS Global Forum: Data Mining and Predictive Modeling.