torstai 27. kesäkuuta 2019

Pari kommenttia tuoreesta Wikipedia-plagioinnista uutisointeineen – kirjailija ollut asialla ennenkin

Helsingin Sanomat julkaisi uutisen tuoreesta tapauksesta, jossa Wikipediaa oli plagioitu osaksi ammattimaisen kustantajan tietokirjaa. Muutama kommentti itsekin sekä kustannettuja tietokirjoja kirjoittaneena että Wikipediaa vuosituhannen alkupuolelta muokanneena:

1. HS:n uutinen on otsikoitu HS-analyysiksi, vaikka kyseessä on ennemminkin uutinen ilman analyysiä. Tai ainakin itselle jäi epäselväksi, missä se analyysi siellä on.

2. Uutinen on otsikoitu Suomalainen tietokirjailija jäi taas kiinni Wikipedia-lainailusta – sotkuun olisi ratkaisu, mutta kustantajia ei tunnu kiinnostavan. Uutisessa kerrataan – tämän tuoreen tapauksen lisäksi – pari tämän vuosikymmenen tietokirjaplagiointitapausta: Talentumin Virtuaalimaine-kirja johon oli copy-pastailtu tavaraa toisen gradusta sekä tuoreempi Saamelaisten mytologia -kirja, johon oli päätynyt (sic) tekstiä Wikipediasta. Tämän jälkeen väitetään, että
Tietokirja-alalla siis on kasvava ongelma.
Onkohan näin? Suomessa julkaistaan vuosittain toistakymmentätuhatta kirjaa (joista 5000-6000 on tietokirjoja), ja tällä vuosikymmenellä kolme on jäänyt kiinni plagioinnista. En pitäisi tätä vielä "alan ongelmana" enkä kasvavana sellaisena. Kun oikein pinnistän, muistan vain yhden tapauksen näiden lisäksi, ja sekin oli viime vuosikymmenellä ja ainakin uutisoinnin perusteella jäi epäselväksi, oliko plagiointia tapahtunut vai ei. Ylen lyhyessä uutisessa mainitaan, että Kirjailijaliitto ei ota kantaa tapaukseen, mutta suhtautuu yleensä epäilevästi palgiointisyytteisiin - ne kun ovat viime vuosian lisääntyneet.

3. Sitten tämä "ratkaisu joka ei kustantajia tunnu kiinnostavan" on tietenkin plagiaatintunnistusjärjestelmä:
Yksi Suomen johtavista plagiarismin asiantuntijoista on Ilona IT -yrityksen myyntijohtaja Risto Korhonen.
En tunne Risto Korhosta eikä minulla ole mitään häntä vastaan, mutta minulle jäi epäselväksi, millä perusteella häntä nimitetään "yhdeksi suomen johtavista plagiarismin asiantuntijoista"? Siksikö, että hän myy softaa, jolla voi tunnistaa plagiaatteja? Korhonen on kyllä kirjoittanut ihan järkeviä plagiaatintunnistuksesta toiseenkin suuntaan: kun suomalaisia kirjoja ei syötetä TurnitInin järjestelmään, niiden plagioimisesta ei narahda automaattitunnistuksessa. Itselle tulee termistä plagioinnin asiantuntija mieleen ensimmäisenä Erja Moore, ja varmaan tätä muutkin ovat akateemisesti tutkineet.

Se mikä jutusta puuttuu, on hintalappu. Mitä ko. järjestelmän käyttö kustantajille maksaisi? Jos kyse on isosta rahasummasta ja koska plagiointiongelma on näin pieni, niin ei maksane vaivaa?

Sitten muutama huomio tapauksesta ja sen uutisoinnista yleensä. Asiasta uutisoi ensimmäisenä mediana Kainuun Sanomat. Jutussa pyörii sama levy kuin mytologiakirjassakin (lihavoinnit minun):
Tekijä oli vähän liian huonosti kopioinut tiettyjä asioita Wikipediasta. Olisi pitänyt tuottaa vähän enemmän, muokata tekstiä, Readme.fi-kustantamon kustantaja Ari Sahanen kommentoi.
Ja
KIRJAN kirjoittanut filosofian tohtori ja dosentti Nieminen myöntää tehneensä asiassa virheen. 
- Ne ovat jääneet vahingossa sinne, hän viittaa kopioituihin kohtiin.
Nieminen kertoo hänellä olleen epäselvyyksiä sen kanssa, miten Wikipediaa lainataan.
 
- Se on oudompi minulle, kun ei sieltä niin helposti näy sitä kirjoittajaa varsinaisesti, Nieminen vertaa Wikipediaa lähteenä tieteellisiin teksteihin. 
Hän pitää ongelmallisena, että Wikipedia-sivuilla lähteet ovat vasta artikkelin lopussa.

Millä tavalla tämä on ongelmallista? Suurin piirtein kaikissa julkaisuissa lähteet ovat vasta artikkelin (tai kirjan tai kirjan luvun) lopussa. Jotenkin tapauksessa maistuu hätävalheen maku. Toisen pään sisään on mahdoton nähdä, mutta tämä haisee vahvasti perinteiseltä "Wikipedia on vapaata sisältöä joten sitä saa käyttää ihan vapaasti ihan miten vain". Asia ei ole näin, vaan sisältö on julkaistu vapaalla lisenssillä, eli sisältöä saa käyttää vapaasti, kunhan noudattaa artikkelin lopussa olevia lisenssiehtoja.

Tässä kohtaa voisi osoitella vähän mediankin suuntaan: mytologiakirjaa koskevassa uutisoinnissa kuten myöskään tämän tapauksen uutisoinnissa ei mainita sanallakaan sanaa lisenssi. Mielestäni pitäisi. Wikipedian käyttämisestä tietokirjan pohjana tai osana voi tietenkin olla monta mieltä, mutta jos joku niin haluaa tehdä, niin sen voi tehdä myös oikein ja vastuullisessa uutisoinnissa kerrotaan myös tämä oikea tapa.

Se, että tohtoritason ihminen vetoaa epäselvyyteen Wikipedian lainaamisessa, on vähintäänkin erikoista. Pelkkä googlaus "miten Wikipediaa lainataan" löytää ensiosumina kaksi sivua:

jotka kertovat selkokielellä oikeastaan kaiken olennaisen siitä miten tällaiset "mokat" vältetään.

Toinen tapauksen uutisoinnissa huomiota herättänyt asia on, että koko plagioinnin laajuus on jätetty pimentoon (poikkeus: Iltalehti). Eniten kiinnostaa, oliko kopioitu muutama lause ja oliko Wikipediaa mainittu lähteenä. Minulla ei ole kirjaa käsissäni, mutta tapauksesta on – ei kovin yllättävästi – ollut keskustelua Wikipedian omalla keskustelufoorumilla. Kahvihuoneen kautta löytyy Tekijänoikeudet-sivu, jossa keskustelua käytiin jo toukokuussa. Pari sitaattia (joista ensimmäinen vastaakin suurimpiin ihmettelyihini):
  • "Huomasin nopeasti, että kirja on merkittävältä osalta suoraa kopiota suomenkielisen Wikipedian artikkeleista, siis sivukaupalla copypastea. Osa siitä on minun tänne kirjoittamaani artikkelitekstiä, osa muiden tuttujen käyttäjien, osa ip-käyttäjien. Mitään mainintaa Wikipediasta lähteenä en kirjasta ole löytänyt."
  • Viimeisessä sähköpostiviestissään minulle 14.6. kustantaja kertoi todenneensa ettei kirjan teksti ollutkaan kirjailijan omaa tekstiä, eikä kirjailijan vastaus ollut tyydyttävä. 
Olin jo ehdottamassa että kirjailijan muukin tuotanto kannattaa käydä läpi plagioinnin osalta – Huhtasaarikin jäi kiinni vain ja ainoastaan sen takia että jatkuva plagiointi blogikirjoituksissa pisti uteliaan kansalaisen selvittämään, mahtoiko tämä ruma tapa olla käytössä jo opiskeluaikoina. Pikkukaupungin poliisina työskennellyt isoisänikin sanoi, että moni rikollinen jää kiinni siksi että ei osaa lopettaa "silloin kun on vielä voitolla". Pätee niin näpistelijöihin kuin vakavampiinkin rikollisiin.  Samalta kirjailijalta on ilmestynyt ainakin Lapin luonto luo outoa taikaa ja Poro. No, tätä kirjoittaessani wikipediaanit olivat jo panneet toimeksi:
  • Tästä Porotohtorin matkassa -kirjasta vielä. Mihin silmäni osuvatkin, siellä on Wikipediaa käytetty lähteenä tai suoraan kopioitu. Pitää katsoa artikkelien versioita vuosilta 2015 tai 2016. Esim. Egyptiä ja pyramidia käsittelevät osiot on kirjoitettu ainakin osin Wikipedian artikkelien pohjalta. Pyramidi-artikkelin johdannosta (esim. vuoden 2015 lopun versiosta) on suoraan kopioitu peräkkäisiä virkkeitä. Jos nämä satunnaisesti valitsemani esimerkit ovat yhtään edustavia, tässä kirjassa on kymmeniä lukuja, jotka on kirjoitettu Wikipedian pohjalta. 
Että semmoista. Kohu paisuu, ja aiheesta.

Lisäys klo 22.05:

  • Kirjoitin että Toinen tapauksen uutisoinnissa huomiota herättänyt asia on, että koko plagioinnin laajuus on jätetty pimentoon. Löysin positiivisen poikkeuksen: Iltalehti. Toistaiseksi tapauksesta ovat siis uutisoineet (Ampparit-haun perusteella) Kainuun Sanomat, Kaleva, IS, IL ja HS.
  • Unohdin mainita konkreettisen esimerkin tuolla keskustelussa mainitusta yhdestä ongelmasta mikä liittyy Wikipedian käyttöön lähteenä (etenkin ilman lähdeviitettä): kirjoitin edellisessä blogissani tapauksesta, jossa ilmeisesti lisensiaatintutkimukseen on päätynyt lähteetön tieto Wikipediasta. Tapaus tuli ilmi kun olin lisäämässä lähdeviitettä yhteen lauseeseen Wikipediassa. Ja kuten kaikista relevanteista asioista, tästäkin on XKCD-sarjakuva.

Ei kommentteja:

Lähetä kommentti