This is a read only archive of pad.okfn.org. See the shutdown announcement for details.

Tutkimusdatan_julkaisun_hallinta Avoimen tieteen käytännöt tutkimustyössä
Avoimen tiedon kuntakiertue - Open Knowledge Roadshow 2013
Tampere 27.9. ja Turku 10.10.


===================
Julkaistu Blogiteksti
===================
http://fi.okfn.org/2013/10/25/miten-tutkijan-kannattaa-hallita-julkaisudataansa




To 10.10. Avoimen tieteen käytännöt tutkimustyössä (9:30 - 11:30)
Ilmoittautuminen: https://okroadshowturku.eventbrite.com/


Esittelyteksti Eventbriteen ja tapahtuman kutsuun:
Tule oppimaan ja keskustelemaan avoimen tieteen käytännöistä. Miten julkaisen avoimesti? Miten avaan tutkimusdatani? Miksi hylkäisin tiukasti lisensoidut ja kalliit analyysiohjelmistot ja siirtyisin käyttämään avoimia ohjelmistoja? Mitä iloa on avoimuudesta tieteessä? Mitä yksittäinen tutkija voi tehdä ja missä koko tieteen teon rakenteiden rahoituksesta tutkijoiden meritoitumiseen ja julkaisufoorumeihin täytyy muuttua? Näitä kysymyksiä pohditaan vertaisoppimistapahtumassa, jonka alkupuolella on tutkija Markus Kainun johdanto aihepiiriin. Tavoitteena on laittaa aluilleen avoimen tieteen toimintaa Turun seudun korkeakouluissa.

Ennakkotehtävä 1
Muokattavasta muistiosta osoitteesta: http://new.okfnpad.org/p/Tutkimusdatan_julkaisun_hallinta löydät kolme kysymystä johon toivomme teidän vastaavan jo ennen tilaisuutta:
* Kuka olet?
* Miten tutkijan tutkimusdatan hallinta liittyy sinun arkeesi?
* Mitä odotat keskustelulta?

Ennakkotehtävä 2





Ennakkotehtävä
Vastaa seuraavaan kolmeen kysymykseen, jotta saamme mahdollisimman hyvän lähdön huomenna perjantaina:

Kuka olet?
Antti  "Jogi" Poikola, Open Knowledge Finlandista. Olen ollut mukana  käynnistelemässä Open Science työryhmää, jonka tarkoituksena on koota  yhteen avoimesta tieteestä kiinnotuneita ihmisiä Suomessa. http://fi.okfn.org/wg/openscience/

Miten tutkijan tutkimusdatan hallinta liittyy sinun arkeesi?
Suunnittelen itse parhaillaan väitöskirjatutkijaksi ryhtymistä (aiheraakileena "dataintensiivinen kaupunkitutkimus" http://bit.ly/connected_city_fi  ) ja jo suunnitteluvaiheessa pyrin huomioimaan kaikki tutkijan  tiedonhallintaan liittyvät prosessit ja välineet niin, että voisin tehdä  omasta tutkimuksestani "avoimen tieteen" periaatteita noudattavan.

Mitä odotat keskustelulta?
Koska  olen itse vasta pre-aloittava tutkija (joskin minulla on parin vuoden  kokemus vuosilta 2006-2008 tutkijana työskentelystä), niin toivoisin  pääseväni sparrailemaan ajatuksia avoimesta tutkimuksen teosta ja  tutkimusdatan hallinnasta muiden ja mahdollisesti kokeneempienkin  tieteentekijöiden kanssa.


Kuka olet?
Markus Kainu, sosiaalipolitiikan tohtorikoulutettava Helsingin yliopiston Aleksanteri-instituutista & Turun yliopiston sosiaalitieteiden laitokselta. Edustan avoimeen tieteen saralla ns. pragmaattista koulukuntaa (ks. [Fescher & Friesike 2013] ( http://papers.ssrn.com/sol3/papers.cfm?abstract_id=2272036 ), eli olen etupäässä kiinnostunut siitä, miten avoimilla analyysimenetelmillä/softilla on mahdollista tehostaa tutkijoiden yhteistyötä jakamalla analyysikoodia sekä tekemällä omista analyyseistä ns. toistettavia. Sittemmin olen seurannut myös ns. demokraattisen koulukunnan keskustelua avoimen julkaisemiseen liittyen sekä ns. infrastruktuurikoulukunnan ajatuksian avoimen tieteen teknologisen arkkitehtuurin liittyen. Työskentelen humanistis-yhteiskuntatieteellisessä (YHT) tutkijayhteisössä ja pyrin sitä kautta pitämään esillä ns. ihmistieteiden näkökulmaa avoimen tieteen tekemisessä.

Miten tutkijan tutkimusdatan hallinta liittyy sinun arkeesi?
Käytän yhtäältä ns. tutkimusdatoja (muiden tutkimuskäyttöön keräämiä isoja kotitaloustason tulo-/kulutus-/asenneaineistoja) sekä toisaalta erilaisia tilastoja. Ns. tutkimusdatojen käyttö edellyttää yleensä melko raskasta lupaprosessia, jossa tarkasti määritetään mitä datalla saa tehdä ja kuka saa tehdä. Aineistojen salassapito on ehdotonta, mikä määrittää datan hallinnan: se pitää pitää salassa, mutta varmasti tallella. Näille datoille ominaista on kuitenkin laaja kansainvälinen käyttäjoukko, jonka kesken analyysikoodin jakaminen jakamisella olisi hirmuinen potentiaali. Sitä ei valitettavasti tapahdu, mutta yritän olla asiassa aloitteellinen <http://markuskainu.fi/r-tutorial/#eu-silc>

Eri maiden kansalaisten elinoloja kuvaavat tilastot ovat puolestaan olleet melko avoimia jo pidempään ja näiden "hallinnan" osalta olen pyrkinyt kehittämään työkaluja siihen, miten niiden käyttö käytännön analyyttisessä työssä olisi helpompaa.  Esimerkkinä tästä työn alla oleva rustfare-paketti <http://markuskainu.fi/rustfare/> r-kielelle, jonka avulla Venäjän tilastoviranomaisen maa- ja aluetason tilastoja on helpompaa hyödyntää.

Noin yleisesti suhtaudun melko huolellisesti tutkimusdatan hallintaan ja pyrin kehittämään sitä suoraviivaisemmaksi ja luotetettavammaksi ja rohkaisen muita tekemään samoin. Koen että tällä hetkellä YHT-tieteissä tämä ei ole kovin hyvällä tolalla.

Mitä odotat keskustelulta?
Odotan näkemyksiä eri tieteenalojen ja eri metodien käyttäjiltä, kuten miten harjoittaa avointa tiedettä tilanteessa jos vaikka haastatteluaineisto on luottamuksellista vs. täysin vapaan ja avoimen tutkimusdatan käytön tilanteessa.

Kuka olet?
Tuomas Mäkilä, 2012 ohjelmistotuotannon kehitysprosessien mallintamisesta väitellyt tekniikan tohtori. Tällä hetkellä työskentelen mm. ketterien menetelmien käyttöä sulautettujen järjestelmien kehityksessä ja lisätyn todellisuuden käyttöä museoympäristössä tutkivissa hankkeissa Turun yliopiston BID-yksikössä.

Miten tutkijan tutkimusdatan hallinta liittyy sinun arkeesi?
Tutkimustyössämme käsittelemme monipuolisesti tutkimusdataa kyselytutkimusten tuloksista yritysten sisäiseen dokumentointiin. Lisäksi tietyissä projekteissa tuotamme itse tietokoneohjelmistoja, jotka omalla tavallaan toimivat tutkimuksen kohteena, tutkimusdatana laajasti katsottuna ja tutkimustuloksina.

Mitä odotat keskustelulta?
Käytännön vinkkejä tutkimuksen työmenetelmien kehittämiseen. Turkulaisen avoimen tieteen yhteisön rakentamista.


Jatka tästä - kopioi otsikot pohjaksi ja lisää omat tietosi:



To 10.10. Avoimen tieteen käytännöt - Turku (MUISTIINPANOT)
Alustuksen materiaalit: https://github.com/muuankarski/avointiede2013

Esittäytymiskierros:
What it actually takes to make research data open

Ari PIkkarainen (Biologian laitos) - avoin tiede on uusi asia, avoimet analyysiohjelmistot kiinnostavat

Sami Majaniemi - tieteen teossa on paljon rakenteellisia ongelmia, palkitsemisjärjestelmät yms. on kehittyneet tukemaan yksinäisen taistelijan toimintamallia

Marja-Liisa Mäkelä (aikuiskasvatustiede) - kaikki kiinnostaa, ensimmäisen vuoden jatko-opiskelija

Marja Pirttivaara (Sitra) - Forum Virium Helsinki ja Helsinki Region Infoshare ohjausryhmässä mukana. Myös tiedon hyödyntäjä, miten tutkimusrahoittajan näkökulma. Kartata ja ihmisten oma dna-tieto kiinnostavat.

Kaisa Könnölä (BID) - Tutkimuksen teko ja avoin data uutta. BID:llä on paljon yritysyhteistyötä, tulee paljon salaista dataa, miten tämän yhdistäisi avoimeen tieteeseen.

Tuomas Mäkilä - Pragmaattinen lähtökohta avoimeen tieteeseen - tieteen historiassa, tieteen tekijöiden ja tutkimuksen määrä oli niin pieni, että ihmiset pystyivät tuntemaan toisensa ja kaikki journaalit voitiin tilata kirjastoihin. Nyt tilanne on räjähtänyt käsiin, niche-aloillakaan ei enää voida tuntea kaikkea alan tutkimusta ja tutkijoita - syntyy kuppikuntia ja guruja, tutkimuksen toistettavuus ja laatu kärsivät. Avoimet toimintamallit ja dialogin mahdollistaminen tarvitaan.


Markuksen alustus:
Pienet piirit - Markus referoi Antin aluilleen panemaa wikipedia-artikkelia http://fi.wikipedia.org/wiki/Avoin_tiede

Avoimen tieteen diskurssit: yhteiskunnallinen, demokraattinen, pragmaattinen, infrastruktuuri, impaktin mittaaminen (Fecher & Friesike. (2013) Open Science: One Term, Five Schools of Thought. http://papers.ssrn.com/sol3/papers.cfm?abstract_id=2272036) 

Määrälliseen tutkimukseen orientoitunut yhteiskunnallinen tutkimus usein: "Toistettavan tutkimuksen irvikuva - satojen megojen köntti, missä on tuhansia tiedostoja - varmaan täynnä virheitä"

Legacy-koodi synnyttää kuppikuntia "kultamunia muniva hanhi, jolla saadaan paljon julkaisuja"

Mikä valta yliopiston IT-hallinnolla on esim. työkalujen valintaan - pakotetaan ottamaan kaikenlaisia byrokraattisia softia, mutta kukaan ei pakota tai kannusta ottamaan käyttöön esim. hyviä analyysityökaluja.

(referenssi)tiedon haku ja louhinta - julkaisujen systemaattinen haku eri tietokannoista. (PubMed)

Journalistien ja muiden tulisi olla varovaisia, miten tulkitsevat dataa - tilastoharhat ovat yleisiä. Mutta esim. laskennallisilla menetelmillä jossain uudella aluevaltauksella voi mennä tieteellisissäkin artikkeleissa läpi virheellisiä tulkintoja.

Paikkatiedon ja aikasarjojen analysointi - R on erinomainen ympäristö näihinkin

Koodisanojen purkaminen tai välttäminen (Git, R, Latex, jne...)

Digital humanities: Mitä tarkoittaa arkistoille, kun ei olekaan enää fyysistä alkuperäiskappaletta (born digital)

Esimerkkejä

Ihmisen DNA-data on avoimena, koska NIH rahoittajana pakottaa, muiden

Negatiivisten tulosten julkaisu ja tutkimusprosessin auki kirjoittaminen


Yhteenveto, mitä ajatuksia heräsi:


  1. 5 Diskurssia
  2. Työvirta / työkalupakki "Markuksen demo" (pakottaa ajattelemaan tietyllä tavalla / data on irrallista prosessissa, mutta samalla luo lopputulokset)
  3. "datascientist on maailman seksikkäin ammantti" - ammattilainen tarvitsee keinoja datan hallinnointiin ja tietenkin datalukutaitoa


Jatko





Pe 27.9. Tutkimusdatan julkaisun hallinta (10:00 - 11:30)

Ennakkotehtävä

Vastaa seuraavaan kolmeen kysymykseen, jotta saamme mahdollisimman hyvän lähdön huomenna perjantaina:

Kuka olet?
Jukka Huhtamäki, tutkija Tampereen teknillisen yliopiston IISLabista. Toimin projektitutkijana ja valmistelen siinä sivussa myös omaa väitöskirjaani, joka käsittelee datalähtöistä visuaalista analytiikkaa, erityisesti verkostoanalyysiä. Olen kiinnostunut laajasti siitä, miten tietotekniikkaa saataisiin tuotua tutkijoiden ja muiden ihmisten avuksi (sen sijaan että sillä aiheutetaan lisää ongelmia). Uusi Tehdas on minulle mieluisa paikka ja onkin hienoa, että pääsen huomenna kanssanne miettimään avointa dataa, tietotekniikkaa ja tieteen tekemistä juuri siellä.

Miten tutkijan tutkimusdatan hallinta liittyy sinun arkeesi?
Monellakin tavalla. Ehdotin tämän tilaisuuden järjestämistä Troika-tapahtumassa mainittavista syistä: www.troikalearning.org/troika/40 . Omassa tutkimuksessani koostan, analysoin ja visualisoin dataa innovaatiotoiminnasta ja tieteestä ja törmään jatkuvasti siihen, että datan kerääminen ja käsitteleminen on hyvin hankalaa. Erilaisia tietokantoja on pilvin pimein ja harvaan niistä on helppoa pääsyä. Data on riekaleista ja esimerkiksi ihmisten yksilöinti hataralla pohjalla. Kuitenkin samaan aikaan datan perusteella tehdään erilaisia mittauksia, mm. arvioidaan laitosten ja yksilöiden tieteellistä tasoa.  

Mitä odotat keskustelulta?
Olisi hienoa jos löytäisimme esim. TOP-5 -listan ("Tee ainakin nämä") omia julkaisutietojaan paimentavan tutkijan avuksi. Parhaassa tapauksessa huominen tilaisuus toimii lähtölaukauksena meidän avoimesta tutkimustiedosta kiinnostuneiden ihmisten väliselle yhteistyölle. Tiesithän että avointa tiedettä puidaan jo FB-ryhmässä Open Science Finland: https://www.facebook.com/groups/241398182642057/?fref=ts

Kuka olet?
Tuija Sonkkila, datakuraattori Aalto-yliopiston kirjastosta. Työni liittyy toistaiseksi lähinnä bibliometriikkaan, mutta mahdollisesti jatkossa myös siihen mistä varsinainen työnimeni puhuu.

Miten tutkijan tutkimusdatan hallinta liittyy sinun arkeesi?
Tieteellisten kirjastojen tulevaisuus on jotakin muuta kuin mitä niiden arki nyt on. Maailmalta kantautuu esimerkkejä, miten juuri kirjastot organisaatioina ja yksikköinä ovat yliopistoissa niitä jotka ovat ottaneet konsultoivan ja/tai kuratoivan otteen tutkimusdatasta. En tiedä tapahtuuko Suomessa niin, mutta mahdollista se on. Tutkimusten mukaan yksi suurimpia esteitä tutkimusdatan saattamiseksi kaikkien käyttöön on siinä, ettei tutkijoilla ole aikaa (eikä korvamerkittyä rahoitusta) kaikkeen siihen, mitä se vaatii. Jos kirjasto voi tässä auttaa, niin parhaassa tapauksessa tutkijalle jäisi enemmän aikaa varsinaiseen tutkimustyöhön. Mikään hokkuspokkus-keino tämä ei tietenkään ole, monesta syystä. Kirjastot eivät Suomessa ole tutkimusyksiköitä toisin kuin esim. USA:ssa, eivätkä sen työntekijät ole tutkijoita, vaikka tieteellisissä kirjastoissa työskenteleekin runsaasti akateemisen loppututkinnon suorittaneita ihmisiä eri tieteenaloilta. Esimerkiksi omassa työtiimissäni on useita diplomi-insinöörin, kemistin ja biologin koulutuksen saaneita. Uskon kuitenkin siihen, että välittäjärooli soveltuisi hyvin tämän kaltaisille henkilöille. Eli, vastatakseni vihdoinkin itse kysymykseen: ei mitenkään juuri tässä ja nyt, mutta haluan oppia tuntemaan tutkijan arkea siltä osin kuin se liittyy tutkimusdatan keräämiseen, käsittelyyn, tallentamiseen ja jakeluun. Siihen en oikein jaksa uskoa, että kirjastot ryhtyisivät itse suurimittaiseen datan tallennuspalveluun; tähän on muita, niitä paljon pätevämpiä tahoja.

Mitä odotat keskustelulta?
Jukka kirjoittaa juuri tuolla yllä TOP-5 -listasta, ja sehän kuulostaa hyvältä. Olen jo jonkin aikaa ylläpitänyt miellekarttaa tieteen "ekosysteemistä". Karttaa voi käyttää vaikka keskustelun herättäjänä. Siitä huomaa ainakin sen, että mikään tiekartta se ei voi olla. Tarvitaan jotakin konkreettisempaa  http://www.mindmeister.com/227663566#

Kuka olet?
Antti Rousi, Tietoasiantuntija Aalto-yliopiston kirjastosta. Kuriositeettina mainittakoon, että teen myös väitöskirjaa kirjastotieteestä. Datan mahdollinen väitökseni ei kuitenkaan liity.

Miten tutkijan tutkimusdatan hallinta liittyy sinun arkeesi?
Olin viime kesän Purduen yliopiston kirjastossa vierailevana tutkijana. Siellä pyrin opiskelemaan paikallisia datapalveluja, jotka he ovat vieneet huomattavasti suomalaisia kirjastoja pidemmälle. Nyt teen kaikkeni luodaksi liikettä tällä kentällä. Jos en muuta saa aikaiseksi, niin jaan ainakin mieluusti kokemuksiani Purduesta.

Mitä odotat keskustelulta?
Toivoisin vahvistavani verkostoani liittyen avoimeen dataan. On hienoa tavata asiasta innostuneita ihmisiä myös täällä pohjoisessa.

Kuka olet? 
Markku Lintinen, jatko-opiskelija TTY:n tuotantotekniikan laitoksella. Tutkimusaihepiirini on dataintensiivinen päätöksenteko. Kokemustaustani on sulautettujen järjestelmien tuotekehityksestä ja dataintensiivisistä laatumenetelmistä (Six Sigma). Tutkimuksellani haluan lisätä ymmärrystä siitä, miten tuotekehityksessä (ja muuallakin) voitaisiin päätöksenteon tueksi tuoda sellainen analyysiosaamisen ja välineiden yhdistelmä, että ne voisivat tilanteissa oikeasti tarjota apua.  
 
Miten tutkijan tutkimusdatan hallinta liittyy sinun arkeesi?
Työni alkaa olla siirtymässä monografiaväitöskirjan kirjoittamisen alkamiseen. Aineistoa on kertynyt enemmänkin kokemustaustan lähteiden kautta kuin tavanomaisten akateemisten lähdekanavien kautta. Kohdallani päivän aihepiiri on tässä vaiheessa enemmän sen ymmärtämistä, miten toisten relevantti tieto löydetään kuin sitä, miten hallitaan omien ajatusten jakelua.

Mitä odotat keskustelulta?
Tuijan mindmapista löytyi erittäin kiinnostavaa tietoa. (Myös kosketuspintaa tämänkin viikon omaan agendaan - R-ympäristön opetteluun ja web-julkaisemisen peruspalikoihin.) 
Joudun valitettavasti jättämään väliin odotetun Tampereelle tulon ja tämänkin keskustelun. Toivotan teille antoisaa ajatustenvaihtoa ja toivon mahdollisuutta olla jatkossa yhteydessä. 

Jatka tästä - kopioi otsikot pohjaksi ja lisää omat tietosi:

Kuka olet? 
Juha Nurmi, tuleva jatko-opiskelija ja nykyinen tutkija TTY:n matematiikan laitoksen IISlabista. Tuleva väitöskirjan aihe liittyy semanttisen datan hallintaan ja ontologioiden automaattiseen hallintaan. Olen myös ohjelmistokehittäjä, hakkeri ja internet-palveluiden toteuttamisen harrastelija.

Miten tutkijan tutkimusdatan hallinta liittyy sinun arkeesi?
Toivottavasti liittyy pian, kun jatko-opinnot pääsevät alkuun :)

Mitä odotat keskustelulta?
Oman tutkijaprofiilin kehittäminen ja oman julkaisudatan hallinta olisi hyvä saada haltuun.

Kuka olet?
Miten tutkijan tutkimusdatan hallinta liittyy sinun arkeesi?
Mitä odotat keskustelulta?


"Asialista" - miten käytämme ajan parhaalla mahdollisella tavalla hyödyksi:

Vaihtoehto 1

  1.  Esittely (1 minuutti per osallistuja?)
  2. Kuka olet?
  3. Miten tutkijan tutkimusdatan hallinta liittyy sinun arkeesi?
  4. Mitä odotat keskustelulta?
  5. ...sitten...
    1. Voitaisiin esimerkiksi käydä ryhmissä läpi (esim. 2x10 minuuttia)
      1. nykytilaa ja 
      2. toiveita tulevalle
      3. ja vetää lopuksi ajatukset yhteen reilun mittaisella ryhmäkeskustelulla

Vaihtoehto 2 (Avoimen tieteenteon workflow)

Yksi mahdollisuus olisi tarkastella ja kollektiivisesti kasata työkalujen ja työtapojen kokoelmaa, joka tukisi avointa tutkimusprosessia. Alla on eri lähteistä kasattu kollaasi tutkimushankkeen elinkaaren eri vaiheista aina aiheen täsmentämisestä hankkeen päättämiseen ja datan arkistointiin. Paketti on sen verran iso, että koko kokonaisuuteen yksi Troikka ei varmaankaan riitä, mutta jos voisi laittaa hommaa vaikka aluilleen kysymällä: "Millaiset olisi avoimen tieteen toimintatavat ja työkalut tutkimusprojektin eri vaiheissa?"

Hyvä lista, Jogi! On toki syytä huomioida kutsussa mainittu rajaus tutkijan julkaisutietojen hallintaan. Siihenkin tuo listalla tuo hyvän jäsennyksen. Kalvoista olisi apua! Ja aluksi on tosiaan hyvä käydä läpi mikä ihmisiä erityisesti kiinnostaa - tarkemmin jokin tietty asia (esim. omien julkaisujen tietojen ylläpitäminen) vai avoimen tieteen ote yleisemmin.


Tutkimusprojektin elinkaaren eri vaiheet - kollaasi useista lähteistä

Lähteitä:


Tutkimusongelman täsmentäminen

Toteutuksen suunnittelu

Rahoitus: haku ja päätös

Toteutus

Päättäminen

-----------------------------------------------
MUISTIINPANOT
----------------------------------------------

Kirjoitetaan blogijulkaisu lopuksi

ks. alla blogitekstin hahmottelua


Miten omat julkaisut pitäisi kirjata ja mihin?

Sitaattitietokantoja:

Tutkijoiden "some-palveluita":
http://www.academia.edu/
https://www.researchgate.net

Identifiointi / clamauspalveluita:

Datan yms. julkaisualustoja:


Julkaisufoorumi-hanke: 

Avoimempia julkaisukanavia?

Yhteiskunta- ja kulttuuritieteet

Reproducability




-----------------------------------------------
ESITTELYTEKSTI TROIKASSA
-----------------------------------------------

http://www.troikalearning.org/troika/40

Akateemisiin julkaisuihin liittyviä verkkopalveluja ja sovelluksia riittää. Thomson Reutersin Web of Science,  Google Scholar  ja monet muut palvelut tarjoavat tutkijalle mahdollisuuden oman  julkaisuluettelonsa ylläpitämiseen ja julkaisutietojen tarkastamiseen ja  korjaamiseen. Tutkijan on ainakin jollakin tasolla syytä tiedostaa eri  palvelujen vahvuudet, koska hänen "akateemista suorituskykyään" mitataan  ehkä entistäkin useammin artikkeleiden välisiin viittauksiin  perustuvilla mittareilla. Suorituskyky näyttäytyy todellista pienempänä  jos julkaisut eivät yhdisty mittaajien käyttämissä aineistossa tutkijaan  oikein. Tietenkin on myös mielenkiintoista tietää ketkä viittaavat  artikkeleissaan tutkijan artikkeleihin. Ja viittausten määrään on  varmasti mahdollista vaikuttaa sillä, miten hyvin julkaisut ovat  näkyvillä ResearchGatessa ja vastaavissa "tutkijoiden some-palveluissa".

Myös mahdollisuudet julkaisutietojen analyysiin esimerkiksi  verkostoanalyysin keinoin kiinnostavat ainakin tietoteknisesti  suuntautuneita tutkijoita. Miten julkaisudataekosysteemin eri palvelut  tukevat julkaisudatan analyysiä, siis bibliometriikkaa?

Troika pidetään osana Open Knowledge Roadshown ohjelmaa Tampereella.  Roadshown kautta tähän troikaan on ilmoittautunut periaatteessa täysi  määrä ihmisiä, mutta käytännössä mukaan sopii varmasti edelleen. 





===================
blogitekstin hahmottelua
===================

Otsikko: Miten tutkijan kannattaa hallita julkaisudataansa?

Akateemisiin  julkaisuihin liittyviä verkkopalveluja ja sovelluksia riittää. Thomson  Reutersin Web of Science,  Google Scholar  ja monet muut palvelut  tarjoavat tutkijalle mahdollisuuden oman  julkaisuluettelonsa  ylläpitämiseen ja julkaisutietojen tarkastamiseen ja  korjaamiseen. Kokonaan oma maailmansa on julkaisujen taustalla olevan tutkimusdatan, lähdekoodin yms. hallinta http://www.tdata.fi/tutkimusdatan-hallinta ja mahdollisuuksien mukaan julkaiseminen avoimesti. Sekä julkaisujen, että tutkimusdatan avoimuuden eteen on asioita, joita yksittäiset tutkijat voivat (ja on siuositeltavaa) tehdä, mutta molemmissa myös tutkimusyhteisöillä- ja organisaatioilla, kuten yliopistoilla on oma toimintaroolinsa.

Kuva: https://docs.google.com/drawings/d/1H0p_IJUtsr0ySofildijF68aTGi3GaRnWSLxpyT23dA/edit?usp=sharing

Tampereella 27.9.2013 osana avoimen tiedon kuntakirtuetta järjestettiin vertaisoppimistapahtuma Troika aiheesta "Miten tutkijan kannattaa hallita julkaisudataansa?"
http://www.troikalearning.org/cgi-bin/tl.cgi/troika/40 tässä keskustelun yhteenvetona tutkijoille suunnattua ohjeistusta julkaisujen osalta.



Vaikka oletkin tällä hetkellä Suomalaisen Yliopiston jäsen ja sinulla on paikallinen tutkijaprofiili yliopiston tutkimustietojärjestelmässä (CRIS = current research information system), niin se ei riitä. Tiede on globaalia, sinä olet osa sitä ja sinulla on sekä historiaa että tulevaisuutta Yliopiston ulkopuolella. Joudut näkemään hieman vaivaa ja tekemään päällekkäistä päivitystyötä, mutta se kannattaa.

Huolehdi siis, että

- sinut ja työsi identifioituvat vain ja vain sinuun: hanki sekä ResearcherID http://www.researcherid.com/ että ORCID http://orcid.org/. Vahvista molemmissa palveluissa omat julkaisusi ja anna palveluiden siirtää tiedot ristiin toinen toisilleen. ResearcherID on luultavasti se, jonka perusteella sinut tunnetaan ja tutkimustasi mitataan kotiyliopistossa. ORCID taas on avoimen tieteen vaihtoehto. 

- tuloksesi tunnistetaan: kun julkaiset artikkelin, dataa tai koodia, saat siihen pysyväisluonteisen tunnisteen kuten DOI http://en.wikipedia.org/wiki/Digital_object_identifier, ArXiv ID http://arxiv.org/help/arxiv_identifier, PMID (PubMedID) http://en.wikipedia.org/wiki/PubMed#PubMed_identifier tai URN http://en.wikipedia.org/wiki/Uniform_resource_name. Varmista, että palvelu kertoo, millä tavalla tuotokseesi viitataan. 

- kerrot mitä olet tehnyt: pidä yllä ajantasaista CV:tä, portfoliota tai blogia sekä Yliopistossa että jossakin muualla. Google Scholar http://scholar.google.fi/ on yksi mahdollisuus CV:ksi, mutta myös täysin itse ylläpidetty sivusto tai blogi voi olla hyvä vaihtoehto. Eräs varteenotettava lisuke on tehdä profiili ImpactStory-palveluun http://impactstory.org/. ImpactStory kerää tietoa - termi on altmetriikka - siitä, missä verkkopalveluissa ja paljonko työsi on saanut vastakaikua: ladattu, tallennettu, tweetattu jne. Jotta altmetriikkaa kerääntyy, työssäsi on oltava DOI, PMID tai yksilöivä URL. Toinen kahdesta tällä hetkellä altmetriikkaa keräävästä palvelusta on Altmetric.com http://www.altmetric.com/. Se eroaa ImpactStorysta siinä, että se on voittoa tavoitteleva yritys (ja kerää metriikkaa hieman eri lähteistä), joten ImpactStory on avoimen tieteen kannalta ehkä luontevampi vaihtoehto.

Tutkijan työ on sekä itsenäistä että yhteisöllistä, riippuen tieteenalasta ja henkilökohtaisista ominaisuuksista. Tällä hetkellä suuntaus on kohti kansainvälisempiä ja suurempia tutkimusryhmiä. Sitä toivovat sekä rahoittajat että yliopistot, koska tutkimukset ovat osoittaneet että näin saadaan kerättyä enemmän näkyvyyttä, enemmän viittauksia ja sitä kautta enemmän rahoitusta. Vaikka kaikki tämä vaikuttaakin pelkältä hallintovirkamiehen ja tiedepolitiikan märältä unelta, niin siinä on myös toinen puoli: mitä avoimemmin olet esillä, sitä enemmän sinulla on mahdollisuuksia solmia kontakteja, saada ideoita, kehittyä tutkijana, ratkaista ongelmia yhdessä toisten kanssa. Mitä enemmän tutkimuksesi sivuaa maailman Todella Isoja Ongelmia, sitä luultavampaa on, että et pääse eteenpäin yksin.

Kuinka paljon sitten kannattaa panostaa kaikkeen siihen yhteisölliseen meininkiin, jota verkko tarjoaa? Näitähän riittää kuten academic.edu http://www.academia.edu/, researchgate.net http://www.researchgate.net/, Mendeley http://www.mendeley.com/, Google+ http://plus.google.com, LinkedIn http://linkedin.com/-  ja päälle vielä oman tieteenalan erityisfoorumit yms. Tähän ei luonnollisesti ole yhtä oikeaa vastausta. Liiallista sitoutumista yhteen palveluun kannattaa kuitenkin välttää; palveluja syntyy ja kuolee melko tiuhaan tahtiin. Kevyt osallistuminen muutamaan eri palveluun ei vie liikaa aikaa itse tieteen tekemiseltä ja pitää sinut ajan tasalla siitä, missä mennään. Jos pieni fraasi sallitaan niin: oman tieteenalan valtavirrassa on syytä yrittää uida sen verran kun rahkeita riittää, mutta virran vietäväksi ei pidä heittäytyä; monitieteisyys ja tieteenalojen välisten raja-aitojen rikkominen on toivottavaa.

Paitsi tutkimusjulkaisuun, myös tutkimusdataan voi nykyään jo viitata myös. Datalla on monia ilmenemismuotoja raakadatasta (ns. mikrodata) yhdistelyjen (aggregate) kautta erilaisiin kuvauksiin. Datan tallennuspaikaksi ei kannata valita pelkästään oman Yliopiston levypalvelua tai laboratorion palvelinta, puhumattakaan omaa PC:tä. Avoimen tieteen hengessä ja tullaksesi huomatuksi,  data kannattaa tallentaa myös johonkin julkisempaan data-arkistoon kuten Figshare http://figshare.com/, Dryad http://datadryad.org/ tai Zenodo http://www.zenodo.org/. Suomessa CSC - Tieteen tietotekniikan keskus on käynnistänyt IDA-nimisen tallennuspalvelun http://www.csc.fi/sivut/ida, johon on yliopistokohtaiset levytilakiintiöt. Palvelun kehittymistä on syytä seurata, sillä CSC tähtää pitkäaikaissäilytykseen eli datallesi taataan käytännössä ikuinen koti. 

Jos tutkimuksesi sivuaa yhteiskuntatieteitä, Yhteiskuntatieteellinen tietoarkisto on hyvä pitää mielessä http://www.fsd.uta.fi/fi/. Mikään varsinainen avoimen datan arkisto se ei kuitenkaan ole. Omalla tieteenalallasi saattaa lisäksi olla vakiintuneita data-arkistoja, kysy kolleegoilta. 

Tutkimusrahoittajat kuten Suomen Akatemia http://www.aka.fi/fi/, TEKES http://www.tekes.fi/ ja EU ec.europa.eu/research/horizon2020/ edellyttävät, että rahoitusta hakiessa on oltava aineistonhallintasuunitelma. Sanahirviö viittaa dataan. Vaatimus datan avoimuudesta on myös yleistymässä.

Kaikkea dataa ei saa kuitenkaan noin vain laittaa avoimeksi. Tutustu tutkimuseettisiin sääntöihin ja niihin sopimuksiin, joihin olet sitoutunut dataa kerätessäsi. Datan anonymisointipalveluja odotellessa sinun on itse huolehdittava siitä, ettei henkilöitä ja dataa pysty yhdistämään toisiinsa ilman henkilön lupaa. 

Tutkimus on julkaistava, vasta silloin siitä tulee tiedettä. "Avoimen tieteilijän" roolimallia hakiessasi voit miettiä, mikä näistä sopii sinulle parhaiten ja mihin pyrit:

- perinteinen ura: tarjoat tutkimustasi arvostettuihin kansainvälisiin tiedelehtiin ja konferensseihin riippumatta siitä noudattavatko ne avoimen julkaisemisen periaatteita vai eivät. Yliopistot mittaavat suoriutumistasi mittareilla ja asteikoilla (mm. JulkaisuFoorumi http://www.tsv.fi/julkaisufoorumi/ ), jotka suosivat toistaiseksi tätä mallia. Siitä syystä avoimen tieteen saralla on tähän mennessä ollut enemmän idealistista puhetta kuin varsinaisia tekoja. Muna ja kana. 

- keskitie: kuten perinteinen ura mutta sillä erotuksella, että jos vain mahdollista, harrastat rinnakkaisjulkaisemista ja avaat dataa. Rinnakkaisjulkaiseminen tarkoittaa sitä, että tallennat artikkelin myös Yliopiston julkaisuarkistoon tai vaikka ArXiv-palveluun. Verkkopalvelusta SHERPA/RoMEO http://www.sherpa.ac.uk/romeo/ voi tarkistaa, salliiko tiedelehti tämän. Useimmat sallivat jo. 

- pioneeri: julkaiset vain lehdissä, jotka noudattavat avoimen julkaisemisen periaatteita. Etsit myös uusia tapoja sekä tieteen tekemiseen että julkaisemiseen. Lehti on historiallinen tapa paketoida tiedettä, mutta ajat muuttuvat. Vertaisarvioidut tekstit eivät välttämättä tarvitse lehteä ympärilleen vaan ne pystyvät välittämään tutkimustulokset muutoinkin. Uusia tapoja tehdä tiedettä on ratkaista ongelmia yhteisöllisesti ja siten, että tutkimustulokset ovat toistettavissa. Esimerkki yhteisöllisyydestä on matemaatikkojen  Polymath Project http://polymathprojects.org ja toistettavuudesta IPython Notebook http://ipython.org/notebook.html ja R-ohjelmointiympäristön sovellukset http://en.wikipedia.org/wiki/Knitr, joissa yhdistetään teksti ja koodi.

Mitä avoimelle tieteelle, datalle ja julkaisemiselle sitten tulee käymään? Muuttuuko mikään? Richard Poynder haastattelee blogissaan Open and Shut? neurogenetiikan professori Björn Brembsiä http://poynder.blogspot.fi/2013/09/bjorn-brembs-on-state-of-open-access.html Brembs ehdottaa samaa mistä keskusteltiin OK Roadshow Tampereen http://fi.okfn.org/roadshow/ tilaisuudessa Tutkimusdatan julkaisun hallinta 27.9.2013. Tapahtuisiko muutos, jos yliopistokirjastot perustaisivat tasokkaan, vertaisarvioidun, avoimen julkaisusarjan ja saisivat sen nostettua Julkaisufoorumi-luokituksen korkeimmalle tasolle?

[ Näihin voi linkata jos vaikuttaisi olevan hyötyä: https://docs.google.com/spreadsheet/ccc?key=0AvfW9KgU1XzhdC16b3dReTVjSl9IaDFHd3BlVDFoaXc#gid=0 ja http://www.mindmeister.com/227663566# ]