torsdag 5. november 2009

Altut - Director's cut

Aftenposten er litt strengere på lengde enn Blogger.com, så jeg tenkte jeg skulle legge ut en slags «director's cut» av Altut.no-teksten som ble trykket i Aftenposten idag. Vil du ha den korte versjonen finner du den hos Aftenposten (Ca 4500 tegn). Nedenfor limer jeg inn den litt lengre versjonen (litt over 8000 tegn). Den har med litt flere eksempler, utdyper poengene hakket mer, og har med en fin referanse til Grunnlovens § 100 som det dessverre ikke ble plass til i versjonen i Aftenposten.


ALTUT - DIRECTOR'S CUT

Åpenhet er et grunnleggende demokratisk prinsipp. Ikke bare fordi det motvirker korrupsjon og avslører udemokratiske maktkonstellasjoner, men også fordi det bidrar til en bedre offentlig samtale. Disse to aspektene ved åpenhet gjenspeiles i to setninger i Grunnlovens § 100. Der står det (1) «Enhver har Ret til Indsyn i Statens og Kommunernes Akter og til at følge Forhandlingerne i Retsmøder og folkevalgte Organer.» og (2) «Det paaligger Statens Myndigheder at lægge Forholdene til Rette for en aaben og oplyst offentlig Samtale.»

Internett har revolusjonert potensialet for åpenhet. Den gamle modellen der statlige etater samlet inn og arkiverte data helt til en borger kom på døra og ba om innsyn, er historie. Et eksempel på dette er Altinn.no. Å lage en felles nettside for å forenkle innlevering av skjemaer til det offentlige gjør byråkratiet kjapt, trygt og billig. Altinn bør imidlertid få en tvilling som kan koordinere arbeidet med å få data ut. Etter modell fra amerikanske data.gov burde vi derfor opprette Altut.no, som kan koordinere arbeidet med å publisere offentlige data.

DIGITALISERT INFORMASJON

Den mest åpenbare grunnen til at offentlig informasjon bør digitaliseres og gjøres fritt tilgjengelig på internett er at det er billig. Elektronisk informasjon kan dupliseres kostnadsfritt. Når et dokument, en rapport eller en undersøkelse først er digitalisert kan man kopiere opp uendelig mange eksemplarer uten ekstra kostnader.

Det går an å gjennomføre en slik «kryssklipping» (på engelsk «mashup») av data manuelt, som da John Snow i 1854 avslørte smittekilden for et kolerautbrudd gjennom å tegne inn sykdomstilfeller på et kart. Slik kryssklipping er imidlertid mye enklere med datamaskiner som kan kombinere store datasett på sekunder, hvilket gjør fri tilgang til data langt mer presserende i en digital hverdag.

MULIGHETENE I KRYSSKLIPPING AV DATA

Det er egentlig bare fantasien som setter grenser for hva slags data som kan klippes sammen. I forkant av Stortingsvalget ble skattelistene kombinert med valglister for å se hvor høy inntekt listetoppene i de ulike partiene har. Etter valget ble resultatene brukt sammen med kart for å vise hvor de nye stortingsrepresentantene bor.

Hvorfor ikke kryssklippe værdata og valgoppslutning og se om regn styrker sofapartiet? Eller krysse valgresultatene med boligannonser for å finne et sted med det politiske tyngdepunktet du ønsker, tegnet inn i et fint kart som også viser luftforurensing og trafikkmengde?

INNHEGNINGSMENTALITETEN I EMBEDSVERKET

Det sentrale er at vi ikke vet hva folk kan finne på å bruke dataene til, og at byråkrater i Oslo ikke bør bestemme hva som skal være tillatt og ikke. Nettopp det var bakgrunnen for at P4 valgte å frigi sine trafikkdata. P4s valg er spesielt interessant ettersom P4 er en kommersiell aktør. Trafikanten, hvis eneste hensikt er å spre informasjon, tør nemlig ikke. De har riktignok lagt ut maskinlesbare trafikkdata for Oslo-området, men vilkårene er restriktive.

Den samme «innhegningsmentaliteten» ser vi hos Lovdata.no, som sletter gamle lover og fjerner dommer etter fire måneder. Det ikke lov å gjengi lovene andre steder, endre sideoppsettet, indeksere eller massenedlaste. For kommersiell utnyttelse av lovene kreves en særskilt avtale.

Det går derfor ikke an å bygge nye tjenester oppå disse dataene. Noen vil nok reagere på det å «tjene penger på norske lover», men lovene vil uansett være tilgjengelig direkte fra Lovdata.no. At en bedrift gjør dataene tilgjengelige i format noen er villig til å betale ekstra for er bra. Det er nettopp det som skjer når Aftenposten, VG og TV2 tjener penger på å vise valgresultatene i fine bokser. Ingen klager på det. Tvert imot har det vist seg å fungere godt. Premisset er selvsagt at alt uansett er fritt tilgjengelig på departementets hjemmesider, men nettopp fordi mediene konkurrerer om å lage de peneste grafene slipper departementet unna med å lage enkle tabeller.

STATENS KARTVERK

Det finnes en rekke eksempler på kryssklipping fra kart. Google har tjent mye på å gjøre det lett å kryssklippe data inn i deres kart. Google er imidlertid en kommersiell aktør, og kan når som helst begynne å ta seg betalt. Kartene til Statens Kartverk er dessuten av en langt høyere kvalitet. Selv om vi allerede har betalt for disse kartene både gjennom skatt og gjennom avgifter direkte til kartverket, må man imidlertid betale kartverket på nytt for å få dataene. Og når man først har betalt, er det få ting man har lov til å bruke dataene til.

Man kunne kanskje forklart dette gjennom kartverkets inntjeningsbehov, men salg av kart dekker bare en brøkdel av kartverkets driftskostnader. Verdien av det utallet av tjenester som kommer til å bli bygget på frie kartdata er langt større enn salgsverdien. Igjen er det inngjerdingsmentaliteten som hindrer en effektiv bruk av data på nettet.

Akkurat når det gjelder kart er det dessuten et poeng at oppdaterte kart kan bidra til å hindre ulykker som tilsammen koster samfunnet mange ganger det kartverket tjener på salg. Det Vegvesenet kaller «Ghost riders», altså mennesker som kjører i feil retning på motorveier, gjør det ofte fordi føreren følger en GPS med et utdatert kart. Videre vil alt fra ulykker med fritidsbåter til ulykker som Rocknes-forliset være lettere å unngå med bedre tilgjengelighet til kartdata.

HVA BØR FRIGIS?

«Kongen» blant de ikke-offentlige offentlige datasettene er åpenbart kartdata fra Statens Kartverk, men det finnes mange andre. Vegvesenet bør frigi veistatistikk, særlig knyttet til veistandard, fart, trafikkmengde og ulykker. Det bør publiseres geotagget data om olje- og gassinstallasjoner, mobilbasestasjoner, høyspentledninger og TV-master. Pollenvarsling og data om luftforurensing bør publiseres sammen med værdataene som alt ligger på yr.no, og alt fra NRKs arkiver bør legges ut på nettet til fri bruk.

Som nevnt bør lover og dommer frigis helt og fullt. Lovdata må gi opp den ødeleggende praksisen å slette dommene etter fire måneder og ha som målsetning å bli et nettsted for alle, ikke bare et bransjested for advokater. Det selvsagte i at valglister og resultater publiseres burde gjelde like mye for avstemninger i kommunestyre, fylkesting og storting, samt alle offentlige undersøkelser, rapporter, dokumenter og referater som finnes. Akkurat som Lovdata bør Trafikanten droppe sine strenge vilkår, og løsninger bør finnes for at trafikkdata fra hele landet kan bli publisert.

Ikke-aggreggert statistikk fra Statistisk Sentralbyrå, bibliotekkataloger, ordlister og bøyingsmønster, samt lister over beskyttede naturområder, bygninger og steder bør også frigis. Både for helsedata, skattelister, kjøretøyregisteret, eiendomsregisteret, Brønnøysundregisteret og folkeregisteret må det tas strenge forhåndsregler i forhold til personvern, men en mengde data fra disse registrene bør frigis.

TILRETTELEGGING

En rekke av disse dataene er alt eller blir snart frigitt, men ofte med strenge vilkår eller ikke maskinlesbart. For å oppnå maksimal effekt er det viktig at staten legger til rette for bruk. Første skritt bør være å opprette det koordinerende nettstedet Altut.no, der dataene publiseres i standardiserte, maskinlesbare formater. Videre må private aktører stå fritt til å bruke dataene som de ønsker, og ødeleggende vilkår som hos Lovdata må fjernes.

En av de første tingene Obama gjorde da han tok over som president i USA var å lansere nettstedet data.gov, som samler og koordinerer arbeidet med å frigjøre offentlige data. I England er de nå i ferd med å lansere nettstedet data.gov.uk. Teknisk sett er det nemlig fort gjort å lage en nettside som Altut, selv om det krever litt koordinasjon i forhold til formater. Utfordringen ligger i å motarbeide innhegningsmentaliteten, og det trengs det politisk vilje for å endre.

Tar den rød-grønne regjeringen ved fornyingsminister Rigmor Aasrud utfordringen?

2 kommentarer:

Harald sa...

Et større problem enn innhegningsmentaliteten er at kulturbevilgninger gis til forskere og forlag uten krav om å publisere digitalt åpent for alle.

Ordlister og bøyningsmønstre er tilgjengelig for nedlastning gratis, men krever registreringsskjema. Derimot er de største orbokprosjektene, er ikke tilgjengelig elektronisk, selv om brorparten av utgiftene er betalt finansiert av det offentlige (jfr. Håkon Wium Lies forsøk på å få Ibsens samlede skrifter frigitt).

Offentlighetsloven og Forvaltningsloven er viktigere og mer detaljert enn det grunnloven er på dette punktet. Den er skrevet med tanke på at "offentlighet" er at avisjournalister skal kunne bedrive gravejournalistikk i kommuneposten, ikke at webutviklere skal lage Hans Rosling-aktige nettsteder eller databaser av typen "maktbasen".


Lovdata sletter ikke høyesterettsdommer etter fire måneder, men putter dem bak en høy betalingsmur ("Lovdata pluss").

Bibliotekdata er i stor grad fri. NSD lagrer alle stortingsvoteringer siden 1800-tallet som datasett (tilgjengelig gratis for forskere).

Sverre sa...

Bra poenger. Problemet er jo i mange tilfeller ikke at dataene ikke er tilgjengelig, men at de er tilgjengelig på en så klønete måte at de i praksis er utilgjengelige.

Ser også at jeg bommet litt da jeg skrev at Lovdata sletter dommer etter fire måneder, men det fungerer jo litt på samme måte når de legger dommene bak en betalingsmur.