SOTKAnet-indikaattoripankki mukaan soRvi-työkalupakkiin

SOTKAnet-indikaattoripankkiin on nyt saatavilla valmiit R-kieliset hakurutiinit soRvi-työkalupakkiin.

Terveyden ja hyvinvoinnin laitos (THL) avasi äskettäin avoimen koneluettavan rajapinnan SOTKAnet-indikaattoripankkiin. SOTKAnet tarjoaa ajantasaiseen kuntajakoon pohjautuvia tilastoja väestörakenteesta, hyvinvoinnista sekä sosiaali- ja terveyspalveluiden käytöstä vuodesta 1990 alkaen. Mukana on myös THL:n sairastavuusindeksi, johon on koottu tietoa useista rekistereistä keskeisten sairauksien esiintyvyydestä eri puolilla maata sekä ikävakioituina että absoluuttisina arvoina ja keskeisiä terveystilastoja Euroopan alueelta. Yhteensä yli 2 000 tilastoindikaattorin kokoelmaa voi selata SOTKAnetin portaalisivulla.

SOTKAnet

Indikaattoripankki SOTKAnet on THL:n tietopalvelu, joka tarjoaa kaikista Suomen kunnista keskeisiä väestön hyvinvointia ja terveyttä koskevia tietoja vuodesta 1990 alkaen.

SOTKAnetin rajapintakuvaus

Tietojen tehokas tutkimuskäyttö edellyttää kehittyneitä ja joustavia analyysivälineitä ja mahdollisuutta yhdistellä aineistoja sujuvasti muihin tietolähteisiin. R-kieli on tieteellisessä laskennassa suosittu avoimen lähdekoodin laskentaympäristö, johon on saatavilla laskenta- ja visualisointimenetelmien lisäksi käteviä välineitä keskeisten aineistojen automatisoituun hakuun, esikäsittelyyn ja yhdistelyyn. Suomalaisten tiedonlouhijoiden tarpeisiin vastaa erityisesti avoimen datan työkalupakki sorvi, joka tarjoaa automatisoituja välineitä 20 avoimelle kotimaiselle tietolähteelle.

Valmiit R-hakurutiinit SOTKAnetin hyvinvointi-indikaattoreille on nyt lisätty sorviin Louhoksen ja Opasnetin yhteistyönä. Voit selata koodia ja kokeilla esimerkkejä kartta- ja aikasarjavisualisoinneista ja SOTKAnetin yhdistämisestä Maanmittauslaitoksen avoimeen paikkatietoon helposti Opasnet-sivuston vuorovaikutteisessa palvelinsovelluksessa ennen paketin asentamista omalle koneelle.

Nuorisotyöttömyysaste Suomessa 1990-2012 (Lähde: SOTKAnet/Eurostatin Työmarkkinatilasto).

Kuva 1: Nuorisotyöttömyysaste Suomessa 1990-2012 (Lähde: SOTKAnet/Eurostatin Työmarkkinatilasto).

Huomionarvoista työssä on, että R-kirjaston avulla koko analyysiputken aineistojen lataamisesta ja esikäsittelystä yhdistelyyn, tilastolliseen testaukseen ja visualisointiin voi nyt automatisoida helposti ja läpinäkyvästi. Esimerkkinä Eurostatin Työmarkkinatilaston nuorisotyöttömyysaste Suomessa 1990-2012 (kuva 1) ja Suomen kuntien nettomuuton visualisointi THL:n ja Maanmittauslaitoksen (MML) aineistoista (kuvat 2-3). Täydet lähdekoodit esimerkkien toistamiseen löydät Datawikistä.

Kuntien nettomuutto 1000 asukasta kohden (Lähde: SOTKAnet/THL ja MML).

Kuva 2: Kuntien nettomuutto 1000 asukasta kohden (Lähde: SOTKAnet/THL ja MML).

Tieteellisen laskennan ja avoimen koneluettavan väestödatan saumaton yhdistäminen tarjoaa uusia välineitä kvantitatiiviseen yhteiskuntatutkimukseen. Erityisen lupaava on mahdollisuus eri lähteistä saatavien aineistojen laskennalliseen yhdistelyyn. Syvällisempi pureutuminen tietomassaan vaatii tarkempaa perehtymistä aihepiiriin ja hyviä tutkimuskysymyksiä. Laskentarutiinien automatisoinnin ansiosta tähän vapautuu nyt entistä enemmän aikaa ja laskennan automatisointi parantaa analyysien toistettavuutta, läpinäkyvyyttä ja luotettavuutta.

Kunnan väkiluku, nettomuutto ja työllisyys. Pienten kuntien nettomuuttoasteessa on enemmän suhteellista satunnaisvaihtelua. Huomattavinta nettomuutto on 103 asukkaan Sottungassa. (Lähde: SOTKAnet/THL).

Kuva 3: Kunnan väkiluku, nettomuutto ja työllisyys. Pienten kuntien nettomuuttoasteessa on enemmän suhteellista satunnaisvaihtelua. Huomattavinta nettomuutto on 103 asukkaan Sottungassa. (Lähde: SOTKAnet/THL).

Datan ja laskentavälineiden avoin saatavuus tuo nämä mahdollisuudet nyt ensi kertaa kaikkien kiinnostuneiden ulottuville – tutkimuskäytön lisäksi aineistoja voidaan hyödyntää vaikkapa opinnäytetöissä, järjestötoiminnassa tai datajournalismissa. Yhteisövetoinen hankkeemme etenee vapaaehtoispohjalta – tervetuloa mukaan!

SOTKAnetin tekninen toteutus ja käyttöoikeudet

SOTKAnetin avoin rajapinta on tarkoitettu tietojen noutamiseen erissä niiden jatkokäyttöä varten eri sovelluksissa; sitä ei ole tarkoitettu jatkuvaan verkon kautta tapahtuvaan käyttöön. Rajapinnan kautta saatua aineistoa käytettäessä on mainittava lähteenä Terveyden ja hyvinvoinnin laitos ja SOTKAnet sekä tarjottava linkki osoitteeseen http://www.sotkanet.fi. Kunkin aineiston osalta on mainittava erikseen tilaston tai indikaattorin tuottajataho. Aineistojen käyttöoikeudet riippuvat tilaston tuottajatahosta. Tarkempia tietoja aineistojen lisensoinnista, käyttöoikeuksista, viittauskäytännöistä, rajapinnan teknisestä toteutuksesta ja muista yksityiskohdista antaa SOTKAnet REST API.

Tekijöistä

SOTKAnetin R-rajapinta toteutettiin Louhos- ja Opasnet-tiimien yhteistyönä: hankkeeseen kontribuoivat Leo LahtiEinari Happonen, Jouni Tuomisto, Juuso Parkkinen ja Joona Lehtomäki. Louhos ja Opasnet kehittävät menetelmiä avoimen datan ja tieteellisen laskennan hyödyntämiseen tutkimuksessa, julkisessa keskustelussa ja päätöksenteossa.

Kirjoittaja: Leo Lahti (Helsingin ja Wageningenin yliopistot), akatemian tutkijatohtori ja soveltavan data-analyysin tutkija.