Vores services

Segment identifikation

Med en segmentidentifikation får du nem adgang til at genfinde dine segmenter, næste gang du laver markedsanalyse.

I et egentlig segmentstudie indgår der ofte 40-45 spørgsmål, der tilsammen skaber rammen for at danne segmenterne. Så mange spørgsmål er det ikke hensigtsmæssigt at skulle stille hver gang, du laver en analyse, hvor du gerne vil se hvordan segmenterne svarer.

Med segmentidentifikationen findes de 8-10 spørgsmål, der bedst predikterer segmenttilhørsforholdet. Det vil være naturligt, at det er blandt de oprindelige spørgsmål, at det reducerede sæt spørgsmål skal findes, men nogle gange vil helt almindelige demografiske data, som f.eks. køn, alder eller indkomst kunne hjælpe.

Det er selvfølgelig ikke helt så præcist som at stille alle spørgsmålene, men det er i sig selv en pragmatisk analyseform, så derfor vil man afveje præcision og antal spørgsmål nøje.

Præcision - 5 segmenter
Tilfældig
20%
2. parts data
65%
Data indsamlet til formålet
90%

Hvad skal du så forvente af præcision?

Hvis du har 5 segmenter, og du tildeler segmenttilhørsforholdet helt tilfældigt må det forventes at 20% klassificeres korrekt. Alt over 20% korrekt klasssificeret er i dette tilfælde derved en gevinst. Det handler om forarbejdet i segmenteringen. Hvis der er arbejdet med hypoteserne og spørgeskemaet, så vil du kunne opnå op mod 90% korrekt klassificeret, afhængig af hvor mange spørgsmål der inddrages

Det er vores erfaring at segmenter, der er lavet på baggrund af data indsamlet til andet formål er mindre robuste og sværere at klassificere. Hvis grundmodellen for segmentering er mindre robust, så bliver den reducerede model ofte med noget lavere præcision, omkring 40-65%. Det er stadig 2-3 gange så godt som tilfældig klassifikation, skal man huske.

Analysetypen hedder diskriminantanalyse - På næste side kan du læse lidt mere om det teoretiske grundlag.

Diskriminantanalysen opstiller modeller for gruppetilhørsforhold - lige præcis det vi har brug for, når vi skal finde ud af hvilket segment en ny given respondent tilhører.

Diskriminantanalysen er i familie med den lineære regresion. Den version vi bruger hos indsigt Nu hedder faktisk også LDA (lineær diskriminantanalyse). Det betyder at det er nogle af de samme forudsætninger der gør sig gældende, som man skal være påpasselig med at overholde, hvis det skal give et godt resultat.

Statistiske forudsætninger

Der er blandt andet krav om uafhængighed mellem variablene. Da selve segmenteringen blev lavet ved hjælp af faktorer, kan man afhjælpe eventuel afhængighed ved at bruge koefficienterne fra faktoranalysen og omregne variablene til en slags faktorscore.

Se segmentering indsigt

Den første vigtige ting er at diskriminantanalysen skal have et træningsdatasæt. Det vil være meget nærliggende at bruge datasættet fra den oprindelige segmentering hvor alle respondenter er klassificeret i hvert deres segment.

Typisk vil man derefter trække en tilfædig stikprøve af datasættet på omkring 80%, som bruges til at lave diskriminantanalysen. De resterende 20% bruges til at efterprøve den samlede models prædiktive evner.

Husk på, i træningsdatasættet ved vi allerede hvilket segment alle respondenterne tilhører, med diskriminantanalysen prøver vi at lave en simplere model, hvor der skal bruges færre spørgsmål til at klassificere dem i de rigtige segmenter. Du tænker måske det ikke lyder simpelt og vejen dertil er også kompliceret, men når først det hele er klar, så skal man fremovere blot køre respondenterne igennem en algoritme og ud kommer deres segment.

Vi arbejder med modellen indtil vi er tilfredse med dens evne til at klassificere korrekt. Det vil sige hvor mange af dem som rent faktisk tilhører Segment 1 bliver også klassificeret som Segment 1, hvor mange i Segment 2 bliver klassificeret som Segment 2 osv. Ved 5 segmenter er vi som nævnt tilfredse hvis vi når over 65%, men gerne højere naturligvis.

Outputtet fra diskriminantanalysen er i første omgang en række lineære regressionsmodeller, som udgør algoritmen. Det vil sige, der er en konstant og en beta-værdi for hvert af de 5-10 spørgsmål, som er bedst til at klassificere respondenter i de rigtige segmenter. Når vi får en ny respondent som har svaret på disse 5-10 spørgsmål, så er det simpelt at gange betaværdier fra modellen sammen med svarene. Typisk er svarene en 5-7 punkts skala, som er simpelt nok. Lidt sværere bliver det, hvis de er omregnet til faktorscorer som kan afhjælpe afhængighed mellem variablene.

For hvert segment er der altså en regression, som giver hver deres score ud fra de svar hver enkelt respondent har givet. Laveste score vinder, så en given respondent vil tilhøre det segment hvis regressionlining giver den laveste score.

I praksis vil det at være copy paste en række svar ind i et Excelark, hvor vi hos indsigt sørger for formlerne, så du får en enkelt kolonne med det rigtige segment.

Process for Segmentidentifikation - 1-2 uger

Overblik træningsdata

Hvis indsigt Nu har lavet segmenteringen, går det hurtigere - 1 uge.

Modelarbejde

Der laves modeller i intervallet 6-12 spørgsmål - 1 uge.

Levering

Der leveres en model og instrueres i brug - 1 dag

Deluxe

35.000Kr.
  • Grundig analyse
  • Sammenhæng ml antal variable og præcision
  • Excel model til klassifikation
  • Instruktion i brug af model
  • PowerPoint rapport
  • Mundtlig afrapportering

Interesseret?

Skriv dit navn og telefonnummer

Så kontakter vi dig om Segment identifikation.