Ovenfor så vi at litteraturen om krysskulturelle undersøkelser er relativt kritisk til å bruke numeriske skalaer. Svarskalaer er alltid en utfordring i spørreundersøkelser. Det finnes et utall av muligheter og måter å gjøre det på; blant annet med og uten tall, med og uten positive og negative verdier, med og uten midtpunkt og med og uten tekst for å beskrive verdiene.

Nedenfor gjengis noen generelle råd om de ulike typene, funn fra de kvalitative testene av ulike svarskalaer presenteres, og det begrunnes hvilke typer svarskalaer som er valgt i kjerneskjemaet (Verktøy 1).

Samtidig er det viktig å være oppmerksom på at forskning innen surveyfaget har vist at svarskalaer i flerspråklige undersøkelser gir store utfordringer dersom man har som ambisjon å lage gode oversettelser av svarskalaer som både ivaretar krav til ”riktig” semantisk innhold og måleegenskaper på tvers av skjemaspråkene. De fleste svarskalaer inneholder negasjoner og kvantifiseringer, og ulike språk legger ulike meninger i dette. En tilsynelatende ekvivalent oversatt versjon (ord for ord er likt oversatt i alle svaralternativene, fremstillingen av tallene og organiseringen av disse er helt likt) kan likevel medføre forandringer av innholdet eller forhold i skalaen*.

Når det gjelder flerkulturelle undersøkelser foreslås det noen ganger å benytte enkle numeriske dikotome skalaer (eks. enig/uenig eller ja/nei), for med det å redusere problemene med ulike tolkninger av mer kompliserte skalaer. Poenget er at dikotomier har samme betydning og innslagspunkt (cutting point) på alle språk, og at det gjør det lettere å bestemme hvor det sanne svaret befinner seg når det bare er to punkt på hver side av et midtpunkt, enn når det er plassert langs en løpende linje. Dette er også omdiskutert i litteraturen. Det viser seg at heller ikke slike dikotomier er ekvivalente, bla fordi direkte oversettelser ikke er det. Mellomkategorier kan også tolkes ulikt. I tillegg mister man presisjon. Dikotomier måler ikke styrken og ytterpunktene, bare retningen.

På den annen side kan vi si at visse fenomener er mer egnet til å måles på denne måten enn andre fenomener. Brukertilfredshetsundersøkelser måler erfaringer med og vurderinger av tjenester, og dette er ofte sammensatte fenomener, men ikke alltid. Spørsmål som måler erfaringer med svært konkrete fenomener (hvordan er det å forstå et informasjonsmateriale) kan være eksempel på spørsmål som er egnet til å utformes som dikotomier.

Nedenfor finner vi fire andre eksempler på utforming av svarkategorier. Det er vanskelig å gi generelle råd, fordi de ulike løsningene har fordeler og ulemper. Av eksemplene nedenfor er ingen ”perfekte”, men på den annen side er det mange som likevel benytter seg av dem.

I møtet i dag snakket vi om ting som er viktige for meg. 

  • Avkrysning 1:     helt enig     ganske enig     verken enig eller uenig ganske uenig     veldig uenig
  • Avkrysning 2:              
  • Tallskala:  Helt uenig  1 ---- 2 ---- 3 ---- 4 ---- 5  Helt enig
  • Visuell skala:
I møtet i dag
snakket vi om det
som er viktig for meg

<--------->
I møtet i dag
snakket vi ikke om det
som er viktig for meg

Alternativ 1 er godt i den forstand at man bruker ord til å beskrive de fem punktene på skalaen, i stedet for tall. Men dette forutsetter at forståelsen av ”ganske”, ”helt” osv er relativt ekvivalent, som vi var inne på over. Dessuten bør det kompletteres med en ”vet ikke” kategori, som visuelt er trukket lengst til høyre, men markert utenfor skalaen.

I en del slike undersøkelser brukes også alternativ 2, men dette alternativet har den store ulempen at det er vanskelig å tolke hva som egentlig ligger i smile/surefjesene. Det åpner for ulike tolkningsmuligheter, og kan sammenlignes med enkle svarskalaer som vi har skrevet om over. Spesielt uheldig er det om bruken av smilefjes oppfattes som å signalisere en nedlatende holdning til respondentene.

Alternativ tre og fire kan være godt egnet til bruk i undersøkelser der (noen av) respondentene har svake lese- og skriveferdigheter. På alternativ tre er det imidlertid problematisk at vi ikke har beskrivelser som uttrykker innholdet i de tre midterste kategoriene. Tolkning av tall varierer, som vi sa over.

Alternativ fire er hentet fra en metode som er utviklet til vurdering av terapisesjoner i psykisk helsevern. Metoden anvender en annen type skala: en linje mellom to motstående påstander, der respondenten skal krysse av et sted på linja som korresponderer med hvor enig vedkommende er i påstanden. Dette gir en visuell opplevelse av svaret som kan være gunstig når respondentene ikke er vant til eller i liten grad behersker skriftlige skjema. På den annen side mener mange forskere at dette er best egnet til å måle endringer over tid hos ett individ, men ikke til å måle på tvers av mange ulike grupper. Det er høyst subjektivt (og sannsynligvis utsatt for kulturforskjeller i tolkning og vurdering) hvordan man plasserer seg når man er (litt) positiv eller (litt) negativ, og det er bedre til å måle rangering enn til absolutte punkt. Dessuten vil det i papirversjon være svært arbeidskrevende å kode dataene. Derimot er det teknisk sett svært brukervennlig i websurveyer.

Les også i delkapittel 4.12:

Testresultater for skalaene

Så hvilken svarskala skal vi velge?

Et problem med ulike skalaer i forskjellige brukerundersøkelser?

Avkrysningsbokser

Åpne spørsmål
 


* Et enkelt eksempel er at forskjeller mellom tysk og engelsk gjør ”enig/uenig”-skalaer problematiske på tvers. I engelsk er det en distinksjon mellom ”not agreeing” og disagreeing”, mens det på tysk ikke finnes noe egentlig ekvivalens til ”disagreeing”. Dermed må en ”agree-disagree”-skala i tysk oversettelse enten bli ”agree-not agree” eller ”agree–reject” (hentet fra Harkness et al, i Presser et al., 2004).