onsdag 20 januari 2016

Stereotyper, ett tveeggat svärd

Läkaren använder kniven för att läka och hjälpa, mördaren använder den för att döda och förstöra.
Kniven i sig är således varken ond eller god, det är användningen av den som avgör vad som är beundransvärt eller förkastligt.

Stereotyper är verktyg

När verktyg används på fel sätt får det ofta oväntade och tråkiga konsekvenser, rätt använda kan de dock vara mycket bra hjälpmedel. Stereotyper har i vårt samhälle ett mycket dåligt rykte vilket förmodligen beror på att de har använts för fruktansvärda saker genom historien. Det betyder inte att stereotyper i sig behöver vara något dåligt, tvärtom är vi mer beroende av dem än vi tror. Betydelsen av stereotyp är i det är fallet en inre bild av en faktisk eller påhittad grupp där egenskaperna hos medlemmarna ofta är kraftigt förenklade. 

I många fall är det förbjudet enligt lag att behandla folk enbart utifrån en stereotyp. Detta är något som har utvecklat samhället och gjort det mer jämlikt och bättre för de flesta. Det jag talar om här är exempelvis att arbetsgivare ska anställa folk efter deras kompetens, att rätten ska döma oberoende av hudfärg och att du får rösta oavsett vilket kön du tillhör. Föreställningar om att vissa grupper är dummare, mer lögnaktiga eller i allmänhet mindre värda får alltså, enligt lag, inte påverka bedömningen av enskilda människor. Detta är självklart mycket positivt och leder till ett trevligare samhällsklimat. Det är som tur väl är även förbjudet att uttrycka nedvärderande åsikter gentemot vissa grupper som sådana.

Att lagarna i vissa andra delar av världen fortfarande tillåter diskriminering med hjälp av dessa stereotyper är såklart mycket tragiskt. Det är också tragiskt att diskriminering pågår dagligen hos oss trots att dessa lagar faktiskt finns. Dessa exempel visar på en felaktig användning av stereotyper som på alla sätt måste bekämpas. Men lösningen ligger omöjligen i att bekämpa stereotyperna som sådana.

Varför kategorisera?

Jag har skrivit i tidigare inlägg att vi har ett enormt behov av att ordna världen omkring oss i kategorier men att kategorisering av människor ofta är en dålig ide. Detta eftersom det lätt får tråkiga konsekvenser. Man måste dock vara medveten om att man inte kan plocka bort den typen av bedömningar utan att tappa något på vägen. Det är dessutom så satt de är mycket svåra att avstå ifrån. Ett sätt att visa detta är genom det så kallade taxiförarproblemet som ursprungligen sattes upp av Daniel Kahneman och Amos Tversky.

Tänk dig att det i din stad har skett en trafikolycka där den ena föraren har smitit från platsen. Det konstateras snabbt att det handlar om en taxibil och ett vittne kallas in till förhör. I staden finns bara två taxibolag där det ena kör blåa bilar och det andra kör gröna. Vittnet säger i förhöret att taxibilen absolut var blå. För rätten finns två fakta att ta hänsyn till.

1. 85 procent av alla taxibilar i staden är gröna och resten är blå

2. Vittnets tillförlitlighet har mätts och det visar sig att i liknande fall klarar han av att peka ut rätt färg i 80 procent av fallen.

Frågan är nu alltså vad sannolikheten är för att taxibilen verkligen var blå som vittnet påstår.


Här är det väldigt lätt att gå i fällan att bara koncentrera sig på att vittnet har rätt i 80 procent av fallen och därför uppskatta sannolikheten att bilen var blå till just 80 procent. Faktum är att man ofta helt bortser från den så kallade relativa frekvensen som i det här fallet talar om att 85 procent av alla taxibilar i staden är gröna. Man måste alltså ta hänsyn till all fakta och inte bara strunta i den gamla när det dyker upp ny information. Med hjälp av Bayesiansk statistik får man fram att sannolikheten att bilen var blå faktiskt bara är runt 41 procent, en väsentlig skillnad. Rätten har med andra ord starka skäl rent statistiskt att misstro vittnet i den här situationen.

Problemet är vi sällan tänker på det här sättet utan missar grovt när vi gör våra intuitiva skattningar. Vi bortser helt enkelt ifrån den relativa frekvensen eftersom det inte är uppenbart att den har någonting med fallet i fråga att göra.
Men det finns en situation där vi gör betydligt bättre bedömningar än ovan, det är när vi istället för relativa frekvenser får kausala relativa frekvenser. För att visa skillnaden kan man byta ut punkt 1 i problemet så att den istället ser ut så här:

1. Det finns lika många taxibilar av varje färg men de gröna är inblandade i 85 procent av olyckorna.

Här får man alltså information som direkt känns värdefull för den uppkomna situationen. Vi kan nu skapa oss en stereotyp av förarna i de gröna bilarna, de kör som idioter. Det är klasskillnad på att få veta att förarna i de gröna bilarna kör mer vårdslöst jämfört med att bara få veta hur många bilar av varje färg det finns totalt. Den informationen tycks inte ge oss speciellt mycket i det enskilda fallet.

När man har frågat folk i experiment visar det sig också att helt plötsligt uppskattar de sannolikheten betydligt bättre än de gjorde i den första versionen. Rent matematiskt är det naturligtvis ingen skillnad mellan påståendena men intuitivt är det mycket lättare att ta hänsyn till den senare informationen eftersom den helt enkelt känns relevant för fallet. Man ser nu den orsakskedja som vi så gärna vill hitta.

Detta gör att när vi avfärdar eller förbjuder stereotyper som är korrekta förlorar vi information på vägen. Vi gör bättre bedömningar om vi tänker i kausala relativa frekvenser än enbart i relativa frekvenser av statistiskt karaktär. Det är självklart så att för det allra mesta är det säkert befogat att betala priset av mindre information för att bevara enskildas rättigheter. Men man ska komma ihåg att det är aldrig fel att åtminstone känna till den här typen av svagheter i vårt statistiska tänkande. Värt att påpekas här är att rent felaktiga stereotyper naturligtvis enbart är av ondo och ingenting som hjälper oss att nå framgång i bedömningar av olika slag.

Skälet till att vi inte bör bekämpa stereotyper som sådana är alltså att de hjälper oss att strukturera upp världen och att de är princip omöjliga att bli av med. De ingår i det mönster vilket vår hjärna jobbar efter. Att tänka Bayesiansk är så oerhört mycket svårare än att tänka kausalt. Det som bör bekämpas är alltså, som jag skrivit tidigare, felaktiga stereotyper och felaktig användning av stereotyper. Gränserna är naturligtvis något oklara här men vetskapen om problemet är en bra början.


Att tänka intuitivt fel

Man kan såklart alltid fråga sig om det verkligen gör så mycket att vi inte exakt kan uppskatta sannolikheter i diverse tramsiga taxiexempel. Svaret här är förmodligen att oftast gör det absolut ingenting, vår intuition leder oss också för det allra mesta ganska nära sanningen. Problem uppstår bara när det är viktigt att det blir rätt och där bedömningarna riskerar att bli katastrofalt dåliga.

Jag tänkte därför visa på en situation av detta slag. Exemplet är hämtat från Deborah Bennets bok "Randomness"(boken är för övrigt lysande)

Tänk dig att du är läkare och att du känner till att en viss sjukdom drabbar 1 person på 1000. Du får också veta att det test som används för att upptäcka sjukdomen ger falska positiva svar i 5 procent av fallen. Ett falskt positivt svar betyder alltså att 5 procent har sjukdomen enligt testet trots att de egentligen är friska. Test är ju sällan 100 procent tillförlitliga. Den information vi har är således:

1. 1 av 1000 har sjukdomen

2. Testet ger 5 procent falska positiva svar

Frågan blir då om det kommer in en person som testar positivt för sjukdomen, vad är sannolikheten för att personen verkligen är sjuk?

I ett experiment gav man den här frågan till bland andra medicinstudenter på avancerad nivå. Ungefär hälften av de som svarade skrev att sannolikheten är 95 procent att personen verkligen hade sjukdomen. Intuitivt känns det självklart rimligt eftersom 5 procent gav falska positiva svar. Då borde det väl vara 95 procents chans att personen har sjukdomen på riktigt eller?  
Faktum är att det här är ett grovt och på gränsen till farligt misstag. Sannolikheten för att personen har sjukdomen ligger på runt 2 procent. Endast 18 procent svarade korrekt.

Detta handlade alltså om studenter som inom en snar framtid skulle ut och arbeta som läkare. Utan att kunna något om läkevetenskap kan man ju misstänka att behandlingen skiljer sig en del åt om risken är 95 procent jämfört med 2 procent. Läkare i det här fallet riskerar med andra ord att ge felaktiga behandlingar inte för att de är dåliga läkare utan för att de hade ett felaktigt statistiskt tänkande.

Till slut vill jag bara säga att detta troligtvis är ett generellt problem som vi alla har mer eller mindre av när vi tänker. Därför kan det vara bra att vara på sin vakt så fort någon hänvisar till statistik som stödjer deras syfte och på ytan dessutom verkar vara korrekt. Den så kallade magkänslan är oftast värdefull men den kan också snava ordentligt. Det kan vara värt att tänka på i det heta och uppskruvade debattklimat som nu råder, ett klimat där statistiska fakta kastas fram och tillbaka gärna i huvudhöjd på motståndarna.


Hälsningar
Johan


Förtydliganden angående exemplen

Taxiförarproblemet

I staden finns det 85 procent gröna taxibilar och 15 procent blåa. Vi tänker oss att det finns 100 bilar sammanlagt för enkelhetens skull. Vittnet säger att bilen var blå och han har rätt i 80 procent av fallen och fel i 20 procent.

Nu får man alltså börja att kombinera sannolikheterna eftersom vi har flera fakta. Av de 100 taxibilarna i staden är 15 blåa. Vittnet pekar korrekt ut dessa blåa bilar i 80 procent av fallen, det blir 12 bilar. Vittnet kommer dessutom att felaktigt peka ut 20 procent av de gröna bilarna som blåa, det blir 17 bilar. 17+12 är 29 bilar sammanlagt vilket talar om hur många bilar av 100 som vittnet pekar ut som blåa, oavsett om de är blåa eller inte. Av dessa 29 bilar pekar vittnet ut 12 st korrekt som blåa.
Sannolikheten för att bilen faktiskt var blå som vittnet påstår är således 12/29, drygt 41 procent.



Sjukdomsexemplet

1 på 1000 får sjukdomen och 5 procent får falska positiva svar. Vi utgår för enkelhetens skulle från att vi testar 1000 personer.

Även här får man börja att kombinera sannolikheterna. Av 1000 personer som testas kommer alltså endast 1 att vara sjuk. Dessutom kommer 5 procent av de 999 som är friska att få ett positivt svar. Sammanlagt kommer då ca 50 personer att tror att de har sjukdomen trots att de är friska plus den stackaren som faktiskt är sjuk. Sannolikheten för att någon som får det här tråkiga beskedet är sjuk blir således 1/51, knappt 2 procent.





      

Inga kommentarer:

Skicka en kommentar