lördag 5 april 2014

Kan vi veta och vill vi verkligen veta?

Vissa saker behöver upprepas, upprepas och upprepas, igen och igen. Vissa vetenskapliga ämnen har detta upprepande som sin kanske viktigaste uppgift. Kulturvetenskap är ett sådant ämne, som gång på gång återvänder till några centrala teman och visar att lösningar som förs fram på problem, bara är upprepningar av tidigare fåfänga försök att lösa ekvationer som inte har någon lösning. Människan fungerar så, det är en fundamental del av det mänskliga detta att å ena sidan önska sig saker och å andra att försöka hitta vägar att realisera önskningarna. Världen och vardagen blir till någonstans mellan vision och realisation. Det är aldrig så bra som vi önskar, men heller aldrig så dåligt som det skulle kunna vara. Det är så det är och det kan inte vara på något annat sätt. Den tanken måste upprepas och upprepas igen. Kunskap om kultur och kulturvetenskaplig kompetens handlar inte om fakta, inte i första hand. Där vårdas och utvecklas ingen kanon. Kulturvetenskap handlar mer om att skapa verktyg och om att hålla dem i ordning så att de finns där och kan användas när behovet uppstår.

Tankarna som inleder bloggposten aktiverades när jag till morgonkaffet läste dagens Under Strecket, om all den data som mänskligheten samlar på sig, all den information som finns samlad i världen och om konsekvenserna av detta. Texten är skriven av Håkan Lindgren och den inleds på följande sätt.
Datasopor är ett ord jag har blivit förtjust i. Det är ett ord som jag tror kommer att visa sig vara användbart för att förstå vad världen är på väg att bli. På samma gång är det en aning komiskt, eftersom det förenar något abstrakt och rent – data – med luktande gamla sopor. Ordet kopplar ihop en framtid vi strävar efter att göra oss en bild av med ett förflutet vi trodde att vi hade lämnat bakom oss: sopberg hör väl ihop med industrialismens konsumtionssamhälle, inte med vår skinande digitala framtid? Men om det alls är möjligt att bända med tanken och skymta lite framtid i förväg tror jag att man gör det genom sådana ord – ord som är paradoxala på rätt sätt, eftersom framtiden, sedd från vårt håll, skulle se paradoxal ut snarare än totalt främmande. Vi skulle tycka att den innehöll oväntade, absurda sammankopplingar av saker som redan är bekanta.
Även samtiden är paradoxal, tänker jag. Och texten av Lindgren är ett talande exempel på det. Dokumentationen av snart sagt allt vi människor gör och datamängden som sparas uppgår idag till 300 miljarder gigabyte, varav det mesta är skräp. Varför sparar vi all denna information, all denna data? För att vi kan och för att vi vill veta, allt som går att veta. Informationen ligger bara där och väntar på att ge oss svar. Och förväntningarna på dessa svar är enorma. Om vi bara kunde sortera informationen skulle vi kunna kontrollera samhället och framtiden. Detta är det ingen som säger sig rakt ut vilja, men det är den typen av önskningar som håller på att förverkligas genom insamlingen och sparandet. Fast det går inte att kontrollera verkligheten. Det är tanken som måste upprepas, och upprepas. Ju snabbare förändringens vindar blåser och ju mer tekniska framsteg som som görs, desto oftare och mer ihärdigt behöver tanken om att framtiden är och kommer att förbli en öppen fråga upprepas.
Den mängd digitala data som genereras av oss och om oss är enorm. 2009 uppskattade Library of Congress att lika mycket text, bild och ljud som de samlat in under sina första 200 år genererades varje kvart. Så sent som år 2000 var 75 procent av världens samlade data icke-digitala enligt McKinsey-rapporten ”Big data: The next frontier” – det vill säga tryckt text och analoga ljud- och videoinspelningar. 2007 hade andelen icke-digitala data krympt till sex procent, samtidigt som den totala datamängden under samma tid hade växt dramatiskt. Beräkningarna av hur mycket data som finns lagrat i världen skiljer sig åt, men alla diagram över utvecklingen visar samma sak: de pekar rakt uppåt. I artikeln ”Data science and predictions” uppskattar Vasant Dhar att världens samlade data uppgick till 15 exabyte 2008 (en exabyte är en miljard gigabyte). Nästa år, förutspår han, kommer datavolymen att vara 20 gånger större. Vi kan se början på en tsunami av data.
Vi håller på att drunkna i data och information och då är det inte längre en fördel, då blir det en nackdel. Det kommer upp en bild för mitt inre. Tänker på avslutningsscenen i den första filmen om Indiana Jones, där den försvunna Arken läggs i en trälåda och placeras i ett arkiv som växer ut i det oändliga när ljuset tänds och kameran zoomar ut. Det vi söker, informationen finns där, för den är arkiverad, men vi hittar den inte, för den drunknar i allt skräp som den omges av. När ska vi se, när ska vi acceptera denna fundamentala insikt och vända blicken mot det som är här och det som är nu? När ska vi lära oss se varandra och ta itu med det mödosamma arbetet att försöka förstå, istället för att fåfängt sträva efter att i detalj förklara? Hur många gånger till måste insikten upprepas? Vi söker och vill ha kontroll, men det slutar med att vi kontrolleras.
När alla företag hanterar stora mängder data börjar de likna underrättelsetjänster. Den riktade reklam som Google, Amazon och Facebook ägnar sig åt kallade Bruce Sterling, som höll inledningstalet på Transmediale, för ”surveillance marketing”. Hur bra den sortens marknadsföring fungerar har Charles Duhigg beskrivit i New York Times (”How companies learn your secrets”, 16/2 2012). En man skällde ut lågpriskedjan Target för att de skickade babyreklam till hans dotter. Ett par dagar senare bad han om ursäkt: hans dotter var faktiskt med barn. Target hade förstått det innan han visste det. Förändrade köpmönster gör att de kan identifiera gravida kunder och förutsäga när barnet kommer. Men det är inte integritetsriskerna jag vill fokusera på med den här artikeln, utan något annat.
Vi kontrollerar varandra och försöker skapa en värd utan överraskningar, utan att stanna upp och för en stund tänka på om det är en värld vi verkligen vill leva i. De flesta vill inte det utan gillar överraskningar. Men tänk om man kunde eliminera alla obehagliga överraskningar? Tänk om säger jag, innan det är för sent. En värld som är kontrollerad är en artificiell värld utan liv. För livet är dynamiskt, oförutsägbart och till stor del ett resultat av slumpen. Fast det glömmer vi konsekvent när begäret sätter in, när viljan att veta blir för stark. Då ser vi inte riskerna, bara allt det positiva, möjligheterna.
De senaste årens slagord är ”big data”. Big data är förhoppningen att kraftfulla datorer och allt mer sofistikerade sökalgoritmer ska kunna upptäcka dolda, tidigare oförutsägbara mönster inuti vår globala komposthög av data. Och visst finns det spännande samband att upptäcka. Vad är det säkraste tecknet på att en passagerare som har bokat en flygstol inte missar sitt flyg? Att han eller hon har beställt vegetarisk mat. En grupp forskare vid Bar-Ilan-universitetet i Israel har utvecklat ett dataprogram som med 80 procents träffsäkerhet kan avgöra om en text har skrivits av en man eller en kvinna (det handlar inte om vad som brukar kallas manligt och kvinnligt språk, utan om statistisk analys av småord som ”the”, ”of” och liknande, det vill säga mönster som är osynliga för mänskliga läsare).

Men hur vet vi att våra algoritmer hittar det viktigaste om vi släpper lös dem på ett material som är så stort att ingen kan överblicka det? Hur bedömer vi de svar som algoritmerna ger oss? Alldeles bredvid det associationsspår som algoritmen följer kan det finnas ett annat, ännu hetare spår som den aldrig upptäcker. Tänk er världens samlade digitala data som en stor från-prick-till-prick-teckning – ett universum av prickar om ni så vill. Fast i motsats till de numrerade prick-till-prick-teckningarna på tidningarnas pysselsidor finns det inga siffror och inget facit. Genom att associera mellan punkterna kan vi rita upp mängder av hyfsat övertygande och delvis helt motsägande bilder, men hur vet vi vilka resultat som är relevanta?
Hur vet vi, det är en annan fråga som måste upprepas och upprepas igen. Och inte bara frågan om hur vi vet, utan även frågan: Vill vi veta? Om och bär informationen finns där kommer den att användas, det kan vi vara alldeles säkra på. Därför måste vi tänka lite längre än näsan räcker, vilket det allt mer sällan finns tid för. Utbildning idag handlar om att så snabbt som möjligt överföra information. Effektivitet och kvalitet är slagorden och den kritiska medvetenheten glöms bort. Den kostar tid och pengar att utveckla och tillägna sig, men det är människans enda skydd mot verklighetens oförutsedda konsekvenser.
Anta att du ansöker om ett banklån, varpå banktjänstemannen låter en algoritm analysera ditt liv. Därefter säger algoritmen nej, och tjänstemannen kan inte förklara vad som ledde till avslaget. Han är beroende av algoritmen för att tolka alla data som banken har tillgång till – och som banken tror att den måste ha för att kunna fatta beslut – men han förstår inte varför algoritmen svarar som den gör. Eller så här: någonting i det dataspår du har lämnat efter dig gör att du flaggas som säkerhetsrisk och du hamnar på en ”no fly list”. Ingen kan tala om vilken kombination av var för sig oskyldiga faktorer som fick systemet att slå larm, kanske en kombination som firman som konstruerade algoritmen aldrig avsåg och aldrig hade kunnat förutse. Komplexiteten ökar risken för misstag.
Är detta en värld vi vill leva i? Låter det som en värld för människor. Tänker på sketchen från TV-programmet Little Britain, på den uttråkade expediten som säger: Computer says no, och som lämnar kunden ensam i sin frustration. Skrattet fastnar i halsen. Det finns en uppenbar risk att människan starka vilja att veta leder till något liknande och att vi underkastar oss den utvecklingen och de konsekvenserna. Det har hänt förr, att människan utsatt, inte sig själv, för jag har rent mjöl i påsen och inget att dölja, men andra för fruktansvärda saker bara för att rådande logik tvingat på samhället en eller annan åsikt. Det är skrämmande vad människor kan göra och gör mot varandra och insikten om det manar till försiktighet. Det kan hända, igen och igen. Och det är inte den enda risken, det finns andra också.
Google vill hjälpa oss att handskas med informationsöverflödet på nätet genom att ge oss personliga sökresultat, baserade på vad de vet om våra klickvanor. Följden blir att det som borde vara ett förutsättningslöst sökande smalnar av till en självbekräftande tunnel. Två av hans vänner googlade ”Egypten”, skriver Eli Pariser i boken ”The filter bubble” (2011); den ene fick länkar till protesterna på Tahrirtorget, medan den andre inte fick veta någonting om vad som pågick, eftersom sökalgoritmerna antog att han inte skulle vara intresserad. Den som bor i en filterbubbla liknar en person som fyllt sin lägenhet med 50 års samlade dagstidningar: någonstans i högarna finns det fantastiska saker att läsa, men han upptäcker dem aldrig, utan följer samma upptrampade stig mellan köket, sängen och toaletten.
Inte lika allvarligt, men nog så skrämmande. Och detta är ändå "bara" ett resultat av algoritmerna själva. För man in ett moment av makt i kalkylen blir bilden snabbt en helt annan. Tänk om någon tar kontrollen över informationen? Risken för det är uppenbar för ju mer information det finns och ju större är värdet av kunskapen är desto mer frestande är det att försöka. Och när det väl har skett finns ingen väg ut, då har livet på jorden förändrats radikalt. Vill vi inte ha det ena måste vi avstå från det andra. Det finns ingen medelväg där vi kan plocka russinen ur kakan. Livet, verkligheten och mänskligheten är en helhet, ett sammansatt och komplext paket som man får ta som den är, på gott och på ont.
När statistiken växte fram som en ny vetenskap under senare delen av 1700-talet visste den franske kungen inte hur många invånare Frankrike hade. Det måste ha varit otroligt spännande att för första gången få siffror på allt: medellivslängd, folkökning, opinionsundersökningar, köpvanor. Sedan dess har företag och myndigheter tänkt: om vi bara hade mer data! Från den tidens datasvält har vi hamnat i ett osannolikt överflöd, som om ett jägar- och samlarfolk öppnat dörren till ett varuhus med hyllor bort till horisonten. Men vi tänker fortfarande likadant. Står vi inför ett svårlöst problem? Tillsätt mer data! I ett läge där datamängden är på väg att bli vårt största problem behöver vi tänka annorlunda.
Det kan inte nog poängteras: Vi behöver tänka annorlunda! Mer information löser inga problem, eller det kanske löser några problem men det är till priset av nya problem. Och problemen som genereras av lösningarna på ursprungsproblemen är alltid fler, så ju mer vi jobbar på den här typen av lösningar, desto fler problem får vi. Och förr eller senare växer problemen oss över huvudet. Låt oss därför tänka om, och låt oss göra det snart. Så fort som möjligt och ju förr desto bättre. Vad ska vi med kunskapen till om den inte hjälper oss att bli bättre människor, om den gör oss till slavar för perfekta maskiner och algoritmer? Vem är du, vem är jag och vad händer när vi bygger en värld tillsammans? Låt oss stanna upp lite. Låt oss reflektera. Låt oss lära känna varandra lite bättre, innan vi samlar mer data. Det kommer att ta tid och det kommer att kosta pengar. Satsningar på humaniora är dyra, men det är bara för att vi räknar som vi gör. Insamling av information är billig i jämförelse. Men om vi drar ut tidsperspektivet lite är det uppenbart att det lägre priset idag kan komma att generera enorma kostnader längre fram och då är priset för satsningarna på humaniora inte så dyra längre.
Bakom de smarta historierna i Malcolm Gladwells artikelsamling ”What the dog saw” (2009) framträder ett dilemma som Gladwell aldrig lyfter upp till huvudtema. Så många av bokens texter handlar om omdömets problem. Han skriver om röntgenläkare som måste skilja tumörer från ofarliga cellförändringar och om finansanalytikerna som inte såg att Enron var en tickande bomb trots att hela den komplicerade bokföringen var tillgänglig. De har alla kommit till en punkt där de inser att mer data inte hjälper dem. De behöver ett omdöme som inte låter sig formuleras som en regel.
Förr eller senare komma vi till den punkt som beskrivs i citatet, till punkten där en människa måste avgöra hur informationen ska tolka. Samhället och kulturen är byggd av människor, för människor och om vi överger den principen har vi öppnat en ask som får Pandoras ask att framstå som ett Kinderägg i jämförelse. Vill vi verkligen det? Vill vi verkligen ha all information vi samlar på oss? Utan kompetens att hantera kunskapen och informationen är jag övertygad om att vi gör bäst i att hålla den dörren stängd. Om det nu inte redan är för sent ... Hur vet vi det?

2 kommentarer:

Björn Nilsson sa...

Klassiska problem för underrättelseorganisationer torde vara att man sitter på sådana mängder av information att man inte vet vad som är viktigt, vem som behöver informationen, att mängden gör data omöjliga att hantera vettigt - samt att det alltid finns viktiga pusselbitar som man aldrig hittar. Exempelvis den där ensamme bittre galningen som på egen hand bygger en bomb i garaget utan att tala om det för någon. Eller att institutionella faktorer gör att information inte används: revisorer eller inspektörer som är rädda om jobbet, som inte vill stöta sig med mäktiga intressen, slår inte gärna larm även om 'alla' kan se att något är fel. Till slut kommer man, trots alla datorer och smarta program, att leta där det är lättast att leta, inte där den verkligt viktiga informationen kan finnas.

Annars är väl väl genomförda opinionsundersökningar om partisympatier ett exempel på att det går att med små urval ändå få rätt träffsäkra prognoser. Något tusental personer i rätt urval av kön, ålder, bostadsort och en del andra faktorer kan visa hur flera miljoner människor kommer att rösta i valet. Men detta kräver väldigt mycket (och dyrbart antar jag) förarbete.

Eddy sa...

Visst går det att göra hyfsat träffsäkra prognoser, men vad säger de egentligen? Vi får bara reda på det som ska hända lite tidigare. Det är kunskap som passiviserar, som ger oss en falsk trygghet. Vill se ett tydligare fokus på det som är här och nu, på SKAPANDET av framtiden och på allas vår medverkan i det arbetet.

Du pekar på två viktiga skäl att tänker och jobba mer så: Delas att vi ändå inte kan hantera kunskapen, dels att det kostar en massa pengar.