Tietopyynnön ja avoimen datan eroista lain kannalta

Tämä tulee nyt toistuvasti puheeksi eri keskusteluissa, niin kirjoitan lyhyen postauksen aiheesta:

  • Tietopyyntö (eng. FOIA (Freedom of Information Act) request) kohdistuu yksittäisiin asiakirjoihin. Julkisuuslain (Laki viranomaisten toiminnan julkisuudesta 1999/621) mukaan siihen on pakko vastata ja julkinen tieto antaa. Asiakirjoja tai tietoja voi toki olla monta, mutta ne on voitava yksilöidä. Laajemman aineiston (esim. avoin data) antaminen on lain mukaan harkinnanvaraista (= ei ole pakko antaa).

21§: ”Viranomainen voi pyynnöstä tuottaa ja luovuttaa eri käyttötarkoituksia varten automaattisen tietojenkäsittelyn avulla ylläpitämäänsä yhteen tai useampaan tietojärjestelmään talletetuista merkeistä muodostetun tietoaineiston, jos tietoaineiston luovuttaminen ei sen muodostamisessa käytettyjen hakuperusteiden, tietojen määrän tai laadun taikka tietoaineiston käyttötarkoituksen vuoksi ole vastoin sitä, mitä asiakirjan salassapidosta ja henkilötietojen suojasta säädetään.”

  • Avoin data (eng. open data) saa lainpohjaista pontta PSI-direktiivistä, jonka mukaan avoin data on viranomaisen myös pakko antaa. Tällöin käsite on tiedon uudelleenkäyttöpyyntö. Mutta kansallinen lainsäädäntö menee vielä toistaiseksi direktiivin edelle, eli Julkisuuslakia sovelletaan.

Lisäksi avoimen datan pitäisi lähtökohtaisesti olla julkaistavissa ja jaettavissa sekä vapaasti käsiteltävissä. Tietopyynnön tuloksena voi tulla esimerkiksi jopa salaisia asiakirjoja (asianosaiselle, valtuutetulle jne.), yksityiselämää koskevaa tietoa tai sellaisia henkilötietoja, joiden julkistaminen ja jakaminen on rangaistava teko (Rikoslaki 1889/39, 24. luku, 8§). Tietopyynnöllä tiedon siis saa, mutta sitä ei välttämättä saa jakaa. Työlääksi avoimen datan laatiminen tulee usein juuri siitä syystä, että sieltä on poistettava nämä levityskelvottomat tiedot.

Lähde: Jaatinen, Tanja. Muokkaako avoin data kansallista julkisuusperiaatetta? Teoksessa: Viestintäoikeus nyt. Viestintäoikeuden vuosikirja 2014.

Lue lisää PSI-direktiivistä: Valtionvarainministeriön avoimen tiedon ohjelma

(Mahdollisimman) avointa tutkimusta

Avoimuuden tuulet puhaltavat viranomaisten aineistoihin. Puhaltajia ovat erilaiset ideologiat, toimintaohjelmat, hankkeet sekä painostusryhmät. Aineiston saattaminen avoimeksi on mainio tapa vähentää ennakkoon tietopyyntöjen aiheuttamaa työtaakkaa virkamiehille.

Kaikkea aineistoa ei kuitenkaan voi laittaa julkiseksi esimerkiksi kansalaisten tietosuojan vuoksi. Lisäksi tiedon julkistaminen ja julkistetun tiedon ylläpitäminen vaativat työtä. Myöskään kaikki data ei ole ymmärrettävissä sellaisenaan ulkopuolisten silmissä, ja vaikka kaikki aineisto olisi avoimena datana jaettavissa, siitä voi silti tehdä tietopyyntöjä esimerkiksi mikäli haetaan jotain tarkoin yksilöityä, yksityiskohtaista  tietoa. Joka tapauksessa esimerkiksi Jyväskylän kaupungin avoimeksi saattama data on esimerkillistä toimintaa.

Tämäkin tutkimushanke pyrkii avoimuuteen. Hankkeen aineistoa tullaan säilyttämään Dataverse-ympäristössä, josta osia aineistosta pääsee kuka vain tarkastelemaan. Tutkimuksen tarkoitushan on kerätä tietoa, sen pohjalta luoda uutta tietoa ja jakaa sitä sitten edelleen. Kaikkeen aineistoon ei kuitenkaan kaikki pääse käsiksi. Tutkimukseen osallistuvat viranomaiset tulevat saamaan allekirjoitettavan informointi-lomakkeen, jossa kerrotaan, mitä aineistoa kerätään, miten sitä käsitellään ja säilytetään sekä missä muodossa jaetaan edelleen.

Dataversen aineistoon tulee sisältymään muun muassa:

  • Julkista aineistoa, jota ovat erityisesti erilaiset taulukoihin koodatut tiedot sekä niiden analyysit,
  • luottamuksellista aineistoa, esimerkiksi haastatteluja ja salaista aineistoa ei voine laittaa avoimeen jakoon mitenkään. Salaisia ovat esimerkiksi salassa pidettäviksi luokitellut asiakirjat, jotka tutkijat ovat saaneet tieteellistä tutkimusta varten mutta vain tutkimusryhmän jäsenet pääsevät niihin käsiksi.

Tietysti näiden luottamuksellisten ja salaistenkin aineistojen analyysit siten, että alkuperäinen lähde ja sen tunnusmerkit uupuvat, voidaan sitten tuoda myöhemmin avoimeksi aineistoksi Dataverseen. Kaiken tämän tavoitteena on, että:

  1. ulkopuoliset voivat arvioida tutkimusta paremmin, koska pääsevät käsiksi sen aineistoon,
  2. kerran kerätty aineisto olisi hyödynnettävissä uudestaan uusissa tutkimuksissa, joko omasta tai muiden toimesta. Näin kerätty data ei ole kertakäyttöistä vaan sen arvo vain kasvaa kasvamistaan.

(Dataversen aineistoa julkaistaan myöhemmin, mutta sen osoite on jo tiedossa: https://dvn.jyu.fi/dvn/dv/tietopyynnot )