Mitä on avoin data?

Avoimella datalla tarkoitetaan julkishallinnolle, organisaatioille, yrityksille tai yksityishenkilöille kertynyttä tietoa, joka on avattu organisaation ulkopuolisillekin vapaasti ja maksutta hyödynnettäväksi.

Avoin data ei ole sama asia kuin julkinen tieto. Julkiseen tietoon kaikilla on pääsy, eli ihmiset pääsevät lukemaan tietoja esim. verkkosivuilta tai kaupungin kirjaamosta. Avoin julkinen tieto eli avoin data puolestaan tarkoittaa sitä, että kansalaiset ja yritykset voivat käyttää tietoja omiin tarkoituksiinsa tasavertaisesti julkisen hallinnon kanssa.

World Wide Webin kehittäjä, avoimen datan puolestapuhuja Tim Berners-Lee kertoo TED-puheessaan, miksi datan avaaminen on www:n kehityksen seuraava suuri harppaus.

Data on digitaalista raaka-ainetta: mm. tilastoja, taloustietoja, karttoja, kuvia, videotallenteita, 3D-malleja. Avoin data toteuttaa määritelmällisesti seuraavat ehdot:

  • Julkisuus: Datan on sisällettävä julkista tietoa, jotta se voidaan avata. Kenenkään yksityisyydensuoja tai yleinen turvallisuus ei saa vaarantua dataa avattaessa, eikä datassa saa olla esim. henkilötietoja tai liikesalaisuuksia.
  • Tekninen saatavuus: Data on avattu sellaisessa muodossa, että sitä on helppo käsitellä tietokoneohjelmistoilla. Ihmisen on helppo lukea PDF-dokumenteissa tai HTML-sivuilla olevaa tietoa, mutta sitä on vaikea lukea ohjelmallisesti. Datan koneelliseen tarkasteluun ja hyödyntämiseen sopivat esimerkiksi CSV-, XLS- tai XML-muodot sekä erilaiset rajapinnat suoraan datalähteeseen.
  • Maksuttomuus: Dataa voi käyttää maksutta. Maksuttomuus helpottaa erityisesti ensikosketuksen saamista dataan. Se mahdollistaa datan hyödyntämiseen liittyvät kokeilut ilman budjettibyrokratiaa.
  • Uudelleenkäytön sallivat käyttöehdot: Datan avaaja sallii aineiston uudelleenkäytön ja kertoo sen selkeästi datan yhteydestä löytyvillä käyttöehdoilla. Käyttöoikeuksien selvittäminen – käyttöehtojen puuttuessa – voi monesti olla niin työlästä, että datan hyödyntämisestä luovutaan.

Näiden neljän kriteerin lisäksi datan rakenne ja merkitys on kuvattava käyttäjille ymmärrettävästi. Kuvailu ei metadata auttaa käyttäjää hahmottamaan datan sisällön ja tulkitsemaan ja käyttämään dataa “oikein”.

Myös datan olemassaolon ja sijainnin tulee olla yleisesti tunnettu. Datan löydettävyyttä voidaan parantaa lisäämällä se julkiseen datakatalogiin. Pääkaupunkiseudun osalta julkisen sektorin avaamat datat kootaan HRI:n datakatalogiin.

Myös valtio ja muutamat suuret kaupungit ovat ryhtyneet avamaan julkisia tietovarantojaan avoimena datana, esimerkkeinä Open Data Tampere, Oulu Open Data ja Jyväskylän avoin data. Lisäksi on tarjolla avoimen datan verkoston avoin tukiverkosto www.avoindata.net, josta löytyy avoimeen dataan liittyviä kysymyksiä ja vastauksia. Siellä voi myös esittää datatoiveita.

Kansainvälinen ilmiö

Katso myösOpen Knowledge Foundationin määritelmä avoimelle datalle Lue lisää

Julkishallinnon datan avaaminen on kansainvälinen, Yhdysvalloista ja Isosta-Britanniasta käynnistynyt ilmiö, joka on levinnyt nopeasti. Avoin julkinen data on ajatusmalli, jossa julkissektorin, kansalaisten, verkkopalveluiden kehittäjien ja muiden datan käyttäjien vuorovaikutusta pyritään lisäämään sekä automatisoimaan yhteiskunnallisen hyvän lisäämiseksi.

 

Miksi avaisin datavarantojani?

avatar
Kirjoittaja
HRI
6 vuotta, 2 kuukautta sitten