Gegevens zijn noodzakelijk voor merken en organisaties om conclusies te trekken uit de gedachten van klanten. Clusteranalyse is een cruciaal onderdeel van gegevensanalyse in marktonderzoek die merken helpt bij het afleiden van trends, het identificeren van groepen binnen verschillende demografische groepen van klanten, aankoopgedrag, voorkeuren en afkeuren en meer.
Deze analysemethode in het marktonderzoeksproces biedt inzichten om informatie in kleinere groepen in te delen die helpen begrijpen hoe verschillende groepen individuen zich onder vergelijkbare omstandigheden gedragen. Verschillende organisaties en onderzoekers kunnen clusters in verschillende categorieën indelen, afhankelijk van vooraf gedefinieerde criteria van wat zinvol is aan een cluster, maar de onderliggende gegevensanalyse thema is vergelijkbaar.
Wat is clusteranalyse?
Clusteranalyse is een statistische onderzoeksmethode waarmee onderzoekers een verzameling objecten kunnen indelen of groeperen in kleine maar afzonderlijke clusters die qua kenmerken verschillen van andere, zulke verschillende clusters. Het onderliggende thema in verkennende gegevensanalyse helpt merken, organisaties en onderzoekers inzichten te ontlenen aan visuele gegevens om trends te ontdekken en hypotheses en expliciete aannames te valideren.
Deze analysemethode in onderzoek is meestal gebaseerd op statistische gegevensanalyse die wordt gebruikt in verschillende velden, waaronder patroonherkenning, machinaal leren, inzichtenbeheer in marktonderzoek, data scrubbing, bio-informatica en meer.
Het doel van clusteranalyse is om groepen objecten te vinden met verschillende gedragsveranderingen, maar waarbij de onderliggende kenmerken en de dingen in dezelfde controlegroep zitten. Een uitstekend voorbeeld van deze onderzoeksmethode zijn banken die kwalitatieve en kwantitatieve gegevens gebruiken om trends in de verwerking van claims bij klanten in kaart te brengen. Met behulp van clusteranalyse kunnen ze frauduleuze claims concluderen en beter begrijpen consumentengedrag .
Ontdek een schat aan inzichten in ons nieuwste artikel, waarin diverse voorbeelden van kwalitatieve gegevens in het onderwijs worden getoond.
Methoden voor clusteranalyse
Clusteranalyse helpt onderzoekers en statistici om gegevens beter te begrijpen en betere beslissingen te nemen. Hoewel de gegevens deel kunnen uitmaken van kwalitatief onderzoek of kwantitatief onderzoek De gegevensanalyse wordt nog steeds uitgevoerd op een onderzoeksplatform waar de gegevens op een grafiek worden uitgezet. Zoals hierboven vermeld, worden er echter verschillende clusteranalysemethoden gebruikt om aan de onderzoeksbehoeften te voldoen.
Het is echter essentieel om op te merken dat de clustermethode experimenteel gekozen moet worden, tenzij er een wiskundige redenering is om voor een specifieke manier te kiezen. Laten we eens kijken naar de meest gebruikte clusteranalysemethoden.
Hiërarchische clustering of op connectiviteit gebaseerde clusteringanalyse
Hiërarchische clustering of op connectiviteit gebaseerde clusteringanalyse is de meest gebruikte methode bij clusteranalyse. Bij deze methode worden gegevens die gelijkaardige componenten vertonen, gegroepeerd om een cluster te vormen.
Deze clusters worden vervolgens gecorreleerd met andere sets die identieke eigenschappen vertonen om andere clusters te vormen. Het centrale uitgangspunt van deze methode in overzichtsonderzoek is dat objecten die dichterbij staan veel meer verwant zijn dan objecten die verder uit elkaar staan.
De andere methode in hiërarchisch clusteren is de verdeelmethode, waarbij je begint met een verzameling gegevens en deze vervolgens verdeelt in kleinere clusters van vergelijkbare informatie. In deze methode worden koppelingscriteria tussen clusters beter gedefinieerd om de afstand tussen clusters en hun relatie te begrijpen. Het is belangrijk op te merken dat er in dit analysemodel geen sprake is van één gegevensverdeling.
Op centroïde gebaseerde clustering
Bij deze clustermethode worden clusters gevormd, maar gedefinieerd door een enkel centraal vectorpunt. Met behulp van het K-means clusteralgoritme wordt een centraal punt op de as gevonden met een gedefinieerde doelstelling. Vervolgens worden kleinere clusters verbonden met dit centrale punt zodat de afstand tussen de clusters en dit centrale punt wordt geminimaliseerd.
Een nadeel van deze clusteranalysetechniek is dat het aantal clusters, k-clusters, meteen aan het begin moet worden gedefinieerd, wat de gegevensanalyse en -representatie beperkt.
Op verdeling gebaseerde clustering
De distributiegebaseerde clusteringanalysemethode groepeert gegevens in objecten met dezelfde verdeling. Deze methode wordt het meest gebruikt statistische analyse methode. Het kenmerk van deze methode is eenvoudige aselecte steekproeftrekking om objecten uit een verdeling te verzamelen.
Dit model werkt het beste als er een verband moet worden weergegeven tussen attributen en objecten. Het nadeel van dit model is echter dat omdat objecten worden gegroepeerd op basis van vooraf gedefinieerde attributen, er een element van bias in de clustering kan zitten omdat elk object moet overeenkomen met een verdeling.
Clusteren op basis van dichtheid
De op dichtheid gebaseerde clustermethode is de vierde veelgebruikte clusteranalysetechniek, waarbij clusters worden gedefinieerd op basis van dichtheid in vergelijking met de totale gegevensset. De objecten in de schaarse gebieden zijn ruis en grenspunten, omdat deze typisch clusters scheiden op de grafische weergave.
DBSCAN is de meest gebruikte op dichtheid gebaseerde clustermethode. Een nadeel van deze methode is echter dat er een daling in dichtheid nodig is om het verschil tussen twee clusters te laten zien, wat vaak onnatuurlijk aanvoelt.
Voorbeelden van clusteranalyse
Clusteranalyse is een duidelijk voordeel en wordt veel gebruikt in verschillende industrieën, functies en onderzoeksgebieden. Om het nut van clusteranalyse beter weer te geven in onderzoek Laten we eens kijken naar de onderste twee voorbeelden.
Clusteranalyse in detailhandelmarketing
Merken gebruiken traditioneel clusteranalyse om onderzoek naar aankoopgedrag en trends te begrijpen door gebruik te maken van demografische segmentatie onder hun klantenbestand. Enkele factoren die meestal in overweging worden genomen zijn geografische locatie, geslacht, leeftijd, jaarlijks gezinsinkomen, enz.
Deze parameters laten zien hoe verschillende consumentengroepen andere aankoopbeslissingen nemen; detailhandelsgiganten gebruiken deze gegevens dus om parallellen te trekken over hoe ze deze doelgroepen moeten benaderen. Dit helpt ook bij het maximaliseren van de ROI op uitgaven terwijl het verminderen van klantenverloop .
Clusteranalyse in sportwetenschappen
Een andere alledaagse toepassing van clusteranalyse is op het gebied van sport. Gegevenswetenschappers, onderzoekers, artsen, teammanagement, scouts, enz. kijken hoe vergelijkbare spelers het doen in verschillende scenario’s en hoe effectief ze zijn in hun sport. Spelers worden ingedeeld naar lichaamstype, leeftijd, positie en soortgelijke criteria om hun effectiviteit te controleren.
Clusteranalyse met QuestionPro
Onderzoekers en merken hebben veel baat bij het bekijken en analyseren van de juiste gegevens. Een volwassen onderzoeksplatform Met QuestionPro kunt u onderzoeksgegevens verzamelen en geavanceerde analyses uitvoeren binnen de tool om u de inzichten te geven die er toe doen.
benutten QuestionPro is het mogelijk om uw klanten en andere onderzoeksobjecten beter te begrijpen en snel beslissingen te nemen die er toe doen. Maak vandaag nog gebruik van de kracht van de enterprise-grade research suite!