Vai pikemminkin…

Tämä teksti levisi internetissä syyskuussa 2003. Kuulin siitä ensimmäisen kerran, kun eräs toimittaja otti 16. syyskuuta yhteyttä kollegaani Sian Milleriin ja yritti jäljittää alkuperäistä lähdettä. Sitä on välitetty eteenpäin monta kertaa, ja kuten useimmat internet-meemit, se on muuttunut matkan varrella. Se vaikutti minusta mielenkiintoiselta – varsinkin kun sain version, jossa mainittiin Cambridgen yliopisto! Työskentelen Yhdistyneessä kuningaskunnassa Cambridgessa sijaitsevassa Cognition and Brain Sciences Unit -yksikössä, joka on lääketieteellisen tutkimusneuvoston yksikkö ja johon kuuluu suuri ryhmä, joka tutkii, miten aivot käsittelevät kieltä. Jos Cambridgessa on tehty uutta tutkimusta lukemisesta, ajattelin, että minun olisi pitänyt kuulla siitä jo aiemmin…
Olen kirjoittanut tämän sivun yrittäessäni selittää tieteen tämän meemin takana. Siinä on totuuden elementtejä, mutta myös asioita, jotka kielen psykologiaa tutkivat tiedemiehet (psykolingvistit) tietävät virheellisiksi. Hämmästyttävintä on, että tuoreessa artikkelissa osoitettiin 11 prosentin hidastuminen, kun ihmiset lukevat sanoja, joiden sisäiset kirjaimet on järjestetty uudelleen:

Raeding Wrods With Jubmled Lettres There Is a Cost
Keith Rayner, Sarah J. White, Rebecca L. Johnson, and Simon P. Liversedge
Psychological Science, 17(3), 192-193

Vaikka samaan aikaan ihmiset ovat melko usein tietämättömiä näistä kirjoitusvirheistä, ja 11 prosentin kustannus on pienempi kuin mitä havaittaisiin kirjainten korvaamisesta tai ulkoisten kirjainten järjestyksen muuttamisesta. Meemissä on siis joitain totuuden elementtejä, mutta se on kokonaisuudessaan väärä.

Aion purkaa meemin rivi kerrallaan havainnollistamaan näitä seikkoja ja viittaamaan siihen, mikä on mielestäni relevanttia tutkimustietoa kirjainjärjestyksen roolista lukemisessa. Jälleen kerran, tämä on vain minun näkemykseni lukemisen tutkimuksen nykytilasta, kun se liittyy tähän meemiin. Jos olet sitä mieltä, että olen unohtanut jotain tärkeää, kerro minulle .

1) aoccdrnig to a rscheearch at Cmabrigde Uinervtisy… Cambridgen yliopistossa tehdyn tutkimuksen (sic) mukaan

Britanniassa Cambridgessa on useita ryhmiä, jotka tekevät tutkimusta kielestä. On ryhmä, jossa työskentelen (Cognition and Brain Sciences Unit), on myös ryhmiä Kokeellisen psykologian laitoksella, erityisesti Centre for Speech and Language (jossa työskentelin). Kielentutkijoita on myös fonetiikassa, englannin ja soveltavan kielitieteen tutkimuskeskuksessa ja Anglia Ruskinin yliopistossa.

Tietääkseni Yhdistyneessä kuningaskunnassa Cambridgessä ei ole ketään, joka tekisi tällä hetkellä tutkimusta tästä aiheesta. Cambridgessa, MA:ssa, USA:ssa saattaa olla ihmisiä, jotka ovat vastuussa tästä tutkimuksesta, mutta en tiedä heistä. Jos tiedätte muuta, kertokaa minulle.

Päivitys:

Olen löytänyt www-sivun, joka jäljittää alkuperäisen demonstraation kirjainten satunnaistamisen vaikutuksesta Graham Rawlinsoniin. Graham kirjoitti kirjeen New Scientistiin vuonna 1999 (vastauksena Saberi & Perrotin artikkeliin (Nature, 1999) lyhyiden puhekatkelmien kääntämisen vaikutuksesta). Siinä Graham sanoo:

Tämä muistuttaa minua väitöskirjastani Nottinghamin yliopistossa (1976), joka osoitti, että sanojen keskellä olevien kirjainten satunnaistamisella oli vain vähän tai ei lainkaan vaikutusta taitavien lukijoiden kykyyn ymmärtää tekstiä. Itse asiassa eräs nopea lukija huomasi vain neljä tai viisi virhettä A4-sivun sekavasta tekstistä.

On mahdollista, että internetin tarjoaman julkisuuden myötä tohtori Rawlinsonin tutkimusta luetaan tulevaisuudessa laajemmin. Niille, jotka haluavat siteerata tätä omassa tutkimuksessaan, täydellinen viite on:

Rawlinson, G. E. (1976) The significance of letter position in word recognition. Julkaisematon väitöskirja, Psykologian laitos, Nottinghamin yliopisto, Nottingham UK.

Päivitys 2:

Graham on ystävällisesti lähettänyt minulle yhteenvedon väitöskirjatyöstään.

Tämä on selvästi väärin. Vertaa esimerkiksi seuraavia kolmea lausetta:

1) Vheclie epxledod at a plocie cehckipont near the UN haduqertares in Bagahdd on Mnoday kilinlg the bmober and an Irqai polcie offceir

2) Big ccunoil tax ineesacrs tihs yaer hvae hvae seezueqd the inmcoes of mnay pneosenirs

3) A dootcr has aimttded the magltheuansr of a tageene ceacnr pintaet who deid aetfr a hatospil durg blendur

Kaikki kolme lausetta satunnaistettiin meemin kuvaamien ”sääntöjen” mukaisesti. Ensimmäinen ja viimeinen kirjain ovat pysyneet samassa paikassa ja kaikkia muita kirjaimia on siirretty. Epäilen kuitenkin, että kokemuksesi on sama kuin minun, eli tekstit muuttuvat asteittain vaikeaselkoisemmiksi. Jos jäät jumiin, alkuperäiset lauseet on liitetty tämän artikkelin loppuun.

Toivottavasti nämä demonstraatiot ovat saaneet sinut vakuuttuneeksi siitä, että joissakin tapauksissa voi olla hyvin vaikeaa saada tolkkua lauseista, joissa sanat ovat sekaisin. On selvää, että ensimmäinen ja viimeinen kirjain eivät ole ainoa asia, jota käytät tekstiä lukiessasi. Jos näin todella olisi, miten erottaisit toisistaan sellaiset sanaparit kuin ”suola” ja ”slat”?

Luettelen seuraavaksi joitakin tapoja, joilla tämän meemin kirjoittaja(t) on mielestäni saattanut (ovat saattaneet) manipuloida sekaisin olevaa tekstiä, jotta se olisi suhteellisen helposti luettavissa. Tämän tarkoituksena on myös luetella tekijöitä, jotka mielestämme voisivat olla tärkeitä määriteltäessä sekalaisen tekstin lukemisen helppoutta tai vaikeutta yleensä.

Lukemisen psykologiassa käydään kuitenkin edelleen hyvin todellista keskustelua siitä, mitä tietoa tarkalleen ottaen käytämme lukiessamme. En tiedä, kuinka paljon tästä kirjallisuudesta tohtori Rawlinson oli tietoinen väitöskirjaansa tehdessään, mutta uskon, että sekava teksti tarjoaa siistin havainnollistuksen joistakin tietolähteistä, joita pidämme nykyään tärkeinä. Käyn läpi joitakin tutkimuksia, joita on tehty tämän osoittamiseksi.

3) rset voi olla toatl mses ja voit sitll raed sen wouthit porbelm… loput voi olla totaalista sekasotkua ja voit silti lukea sen ongelmitta

Tämä lause on, kuten muukin demonstrointi, silmiinpistävän helppolukuinen huolimatta siitä, että se on sekaisin. Kuten edellä on nähty, kaikki samalla tavalla vääristyneet lauseet eivät ole yhtä helppolukuisia kuin tämä. Mikä tekee tästä lauseesta niin helpon? Kollegani ja minä olemme ehdottaneet seuraavia ominaisuuksia:

1) Lyhyet sanat ovat helppoja – 2- tai 3-kirjaimiset sanat eivät muutu lainkaan. Ainoa mahdollinen muutos 4-kirjaimisissa sanoissa on keskimmäisten kirjainten järjestyksen vaihtaminen, mikä ei aiheuta liikaa vaikeuksia (ks. 4).

2) Toiminnalliset sanat (the, be, and, you jne.) pysyvät samoina – enimmäkseen siksi, että ne ovat lyhyitä sanoja, ks. (1). Tämä todella auttaa lukijaa säilyttämällä alkuperäisen kieliopillisen rakenteen ja auttamalla hahmottamaan, mikä sana todennäköisesti tulee seuraavaksi. Tämä on erityisen tärkeää sekavan tekstin lukemisessa – ennustettavissa olevat sanat ovat tässä tilanteessa helpommin luettavissa.

3) Tämän lauseen 15 sanasta 8 on edelleen oikeassa järjestyksessä. Lukijana et ehkä kuitenkaan huomaa tätä, koska monet ehjänä pysyneistä sanoista ovat funktiosanoja, joita lukijat eivät yleensä huomaa lukiessaan. Esimerkiksi kun ihmisiä pyydetään havaitsemaan yksittäisiä kirjaimia lauseessa, he jättävät todennäköisemmin huomaamatta kirjaimia funktiosanoissa.

Healy, A. F. (1976). Havaintovirheet sanalla The: Evidence for reading units larger than letters. Journal of Experimental Psychology: Human Perception & Performance, 2, 235-242.

4) Vierekkäisten kirjainten transpositiot (esim. porbelm for problem) on helpompi lukea kuin kauempana olevat transpositiot (esim. pborlem). Tiedämme tutkimuksesta, jossa ihmiset lukevat tietokoneen näytöllä hyvin lyhyesti esitettyjä sanoja, että sanojen ulkokirjaimet ovat helpommin havaittavissa kuin keskimmäiset kirjaimet – mikä vahvistaa yhden meemissä esiintyvän ajatuksen. Tiedämme myös, että sanojen keskellä olevien kirjainten sijaintitietoa on vaikeampi havaita ja että ne virheet, joita tehdään, ovat yleensä transpositioita.

McCusker, L. X., Gough, P. B., Bias, R. G. (1981) Word recognition inside out and outside in. Journal of Experimental Psychology: Human Perception and Performance, 7(3), 538-551.

Yksi selitykseksi tälle lukusysteemin ominaisuudelle on se, että se johtuu siitä, että ulkopuolisen kirjaimen asento sekoittuu huonommin viereisiin kirjaimiin. Ulkokirjain voi liikkua vain yhteen suuntaan, ja vierekkäisiä kirjaimia, jotka voivat ”peittää” ulkokirjaimen, on vähemmän. Molemmat näistä ominaisuuksista ilmenevät hyvin luontevasti neuroverkkomallissa, jossa kirjaimet tunnistetaan eri paikoissa keinotekoisella verkkokalvolla.

Shillcock, R., Ellison, T.M. & Monaghan, P. (2000). Eye-fixation behavior, lexical storage and visual word recognition in a split processing model.Psychological Review 107, 824-851.

Richard Shillcockin ja kollegoiden esittämä selitys ehdottaa myös toista mekanismia, joka voisi olla toiminnassa meemissä. He ehdottavat sanojen tunnistamisen mallia, jossa jokainen sana on jaettu kahtia, koska verkkokalvolla oleva informaatio jaetaan aivojen kahden aivopuoliskon välillä, kun luemme. Joissakin heidän mallinsa simulaatioissa Richard Shillcock simuloi kirjainten sekoittumisen vaikutusta sanan kummassakin puoliskossa. Näyttää siltä, että kirjainten pitäminen sanan sopivalla puoliskolla vähentää sekoitetun tekstin lukemisen vaikeutta. Tätä lähestymistapaa käytettiin edellä olevan esimerkin (1) luomisessa, mutta ei esimerkkien (2) tai (3) luomisessa.

5) Mikään niistä sanoista, joissa kirjaimet on järjestetty uudelleen, ei luo toista sanaa (wouthit vs. witohut). Tiedämme olemassa olevasta työstä, että sanat, jotka voidaan sekoittaa vaihtamalla sisäkirjaimia (esim. salt ja slat), ovat vaikeampia lukea. Helposti luettavan sekoitetun sanan tekemistä kannattaa siis välttää tekemästä muita sanoja.

Andrews, S (1996) Lexical retrieval and selection processes: Effects of transposed-letter confusability. Journal of Memory and Language, 35(6), 775-800.

6) Käytettiin transpositioita, jotka ennakoivat alkuperäisen sanan äännettä (esim. toatl vs. ttaol for total). Tämä auttaa lukemisessa, sillä usein kiinnitämme huomiota sanojen ääntämiseen myös silloin, kun luemme merkityksen vuoksi:

Van-Orden, G. C. (1987) A ROWS is a ROSE: Spelling, sound, and reading. Memory and Cognition, 15(3), 181-198.

7) Teksti on kohtuullisesti ennustettavissa. Esimerkiksi lauseen ensimmäisten sanojen perusteella voi arvata, mitä sanoja on tulossa seuraavaksi (vaikka sanan kirjaimista saataisiin hyvin vähän tietoa). Tiedämme, että asiayhteydellä on tärkeä merkitys vääristyneen tai kohinassa esitetyn puheen ymmärtämisessä, sama pätee todennäköisesti myös kirjoitettuun tekstiin, joka on sekoitettu:

Miller, G. A., Heise, G. A., & Lichten, W. (1951). Puheen ymmärrettävyys testiaineiston kontekstin funktiona. Journal of Experimental Psychology, 41, 329-335.

4) Tihs is bcuseae the huamn mnid deos not raed ervey lteter by istlef, but the wrod as a wlohe… Tämä johtuu siitä, että ihmismieli ei lue jokaista kirjainta yksinään sanaa kokonaisuutena.

Tässä lauseessa esitetään kaksi ajatusta. Pohjimmiltaan kirjoittaja on oikeassa, ihmiset eivät tavallisesti lue sanan jokaista kirjainta erikseen – paitsi suhteellisen harvinaisessa aivovamman jälkeisessä tilassa, jota kutsutaan kirjain kirjaimelta lukemiseksi, kuten seuraavassa kuvataan:

Warrington, E.K., & Shallice, T. (1980). Sanamuotoinen lukihäiriö. Brain, 103, 99-112.

On myös näyttöä siitä, että kokonaisen sanan muodon informaatiolla on tärkeä rooli lukemisessa. Esimerkiksi ”CaSe MiXiNg” hidastaa lukemista huomattavasti:

Mayall, K., Humphreys, G.W., & Olson, A. (1997). Häiriö sanan vai kirjaimen käsittelyssä? Kirjainten sekoittumisvaikutusten alkuperä. Journal of Experimental Psychology: Learning, Memory, & Cognition, 23, 1275-1286.

Mutta koska ”sanan muoto” sisältää tietoa sisäisten kirjainten sijainnista (erityisesti silloin, kun ne sisältävät nousevia ja laskevia elementtejä), sanan muoto häiriintyy siirroista.

Kirjoitettujen sanojen lyhyiden esitysten jälkeen ihmiset ovat usein parempia arvaamaan, minkä sanan he näkivät, kuin arvaamaan yksittäisiä kirjaimia kyseisessä sanassa (”Sanan paremmuusvaikutus”):

Reicher, G. M. (1969) Perceptual recognition as a function of meaningfulness of stimulus material. Journal of Experimental Psychology. 81(2), 275-280.

Tämä osoitus ei kuitenkaan tarkoita, että lukemiseen ei kuuluisi mitään yksittäisten kirjainten tasolla tapahtuvaa prosessia. Tuoreessa Nature-lehdessä julkaistussa artikkelissa esitetään uusi todiste kirjaintason prosesseista sanojen lukemisessa:

Pelli, D. G., Farell, B., Moore, D.C. (2003) The remarkable inefficiency of word recognition, Nature, 423, 752-756.

Tässä artikkelissa Pelli ja kollegat osoittavat, että lukiessaan sanoja, jotka on vääristetty esittämällä kukin kirjain visuaalisessa kohinassa (kuten epäkunnossa oleva televisio), lukijat eivät suoriudu yhtä hyvin kuin ”ideaalinen havainnoitsija”, joka pystyy tunnistamaan sanat pelkän muodon perusteella. Sen sijaan heidän osallistujansa suoriutuvat vain yhtä hyvin kuin he voisivat, jos he tunnistaisivat sanoja niiden yksittäisten kirjainten perusteella.

Keskustelu siitä, luemmeko yksittäisten kirjainten vai kokonaisten sanojen perusteella, ei ole vielä läheskään päättynyt. Demonstraatiot sekalaisten tekstien lukemisen helppoudesta tai vaikeudesta näyttävät todennäköisesti näyttelevän tärkeää roolia tämän prosessin ymmärtämisessä. Esimerkiksi:

Perea, M., & Lupker, S. J. (2003). Aktivoiko jugde COURTin? Transponoidun kirjaimen sekoitettavuusvaikutukset naamioidussa assosiatiivisessa primingissä. Memory and Cognition.

Toinen erittäin relevantti artikkeli, joka juuri osui silmiini, on tämä:

Perea, M., & Lupker, S. J. (2003). Transposed-letter confusability effects in masked form priming. Teoksessa S. Kinoshita ja S. J. Lupker (toim.), Masked priming: State of the art (s. 97-120). Hove, UK: Psychology Press.

Mitä Perea ja Lupker tekivät, oli esittää sanoja leksikaalista päätöstä varten (onko tämä oikea sana?) ja mitata vasteajat painaa yhtä kahdesta painikkeesta (kyllä/ei). Näitä kohdesanoja edeltää hyvin lyhyt esitys (50 sekuntia) toisesta kirjainjonosta, joka on naamioitu ja siten näkymätön osallistujille. Tämän naamioidun sanan vaikutus vastausaikoihin voidaan kuitenkin osoittaa. Esimerkiksi vastausajat ovat nopeampia, jos USHER:n edellä on ”uhser” kuin jos sitä edeltää ”ushre”. Toisin sanoen keskimmäisten kirjainten siirrot ”pohjustavat” viereistä sanaa enemmän kuin ulompien kirjainten siirrot. Sama ilmiö, joka on aikaisemman demonstraation ytimessä.

Olisin kiitollinen kaikista kommenteista ja ehdotuksista, joita ihmisillä on tästä sivusta, asiantuntemuksen tasosta riippumatta. Yritän päivittää tälle sivulle lisää tietoa internet-meemistä ja siihen liittyvästä lukemiseen liittyvästä työstä, jos ihmisiä kiinnostaa. Ehkä jonain päivänä Cambridgen yliopistossa on tutkijaryhmä, joka tekee tieteellisen läpimurron tutkimalla sekalaisen tekstin lukemista…

Muut kommentit:

1) Ted Warring postasi linkin algoritmiin, joka on ihmistä paljon parempi sekalaisen tekstin purkamisessa. Tämä ei ehkä yllätä – en varmasti ole ainoa, joka on käyttänyt tietokoneohjelmaa erityisen rasittavan anagrammin ratkaisemiseen.

2) Bruce Murray Auburnin yliopistosta, Alabamasta, USA:sta, viittaa seuraavaan sitaattiin, joka edustaa tutkimussuuntausta, joka osoittaa, että oikeinkirjoitusvirheet (ja kirjainten siirrot) häiritsevät lukuprosessia:

”Riippumatta siitä, mikä on semanttista, syntaktista tai ortografista ennustettavuutta, silmä näyttää prosessoivan yksittäisiä kirjaimia …”. Aikuisten lukijoiden silmänliikkeiden häiriöt viittaavat siihen, että visuaalinen järjestelmä pyrkii havaitsemaan pienimmätkin kirjoitusvirheet.”

(teoksesta Adams, M. J. (1990) Beginning to Read: Thinking and Learning About Print. Cambridge, MA: MIT Press, s. 101)

Tässä on mielenkiintoinen seikka, nimittäin se, että subjektiivinen vaikutelma vaikeudesta, jonka ihminen saa lukiessaan sekavaa tekstiä, voi olla aivan erilainen kuin objektiivisempi lukemisvaikeuden mittaus, joka saadaan käyttämällä eye-trackeria (laite, joka mittaa silmien liikkeiden mallia, kun ihmiset lukevat painettua tekstiä).

Bruce huomautti myös, että alkuperäinen teksti ja jonkin verran siitä käytyä keskustelua on julkaistu ”Urban Legends Reference Page” -sivulla.

3) Peter Hebels on tehnyt Visual Basic -ohjelman sekoitettujen tekstien luomiseen. Kuten hän sanoo:

Olen tehnyt mukavan avoimen lähdekoodin ohjelman Visual Basicilla, tämä ohjelma voi tehdä kirjainten satunnaistamisen automaattisesti puolestasi. Se satunnaistaa vain sanan keskimmäiset kirjaimet, se ei muuta ensimmäisen ja viimeisen kirjaimen paikkaa, myös erikoismerkit kuten pilkut ja pisteet eivät vaikuta. Voit ladata ohjelman ja lähdekoodin täältä:

http://home.zonnet.nl/hebels13/letterreplacer.zip

Tarvitset Visual Basic -ajotiedostot järjestelmääsi, jos haluat ajaa suoritettavan tiedoston, näiden tiedostojen asennus löytyy täältä:

http://download.microsoft.com/download/vb60pro/install/6/Win98Me/EN-US/VBRun60.exe

4) Clive Tooth on löytänyt ehkä kaikkein epäselvimmän sekavan lauseen (käyttäen sanoja, kuten ”salt”, josta tulee ”slat”, kun se siirretään)

”The sprehas had ponits and patles”

Tämä saattaisi tulla seuraavanlaisena…

Spreheillä oli pitoneja ja laattoja.

Spärheillä oli pontteja ja laskoksia.

Serapeilla oli pintoja ja terälehtiä.

Sfääreillä oli pinoita ja paletteja.

Sfääreillä oli potinoita ja peltoja.

Clive luettelee joitakin epämääräisempiä sanoja tässä mahdollisten lukutapojen joukossa:

palets: paleae (ruohonkukan osa)

peltas: kilvet

pinots: viinirypäleet

potins: kupariseokset

sphaers, sphears: molemmat vanha muoto ’pallot’

5) Stephen Sachs on kirjoittanut CGI-skriptin, joka sekoittaa tekstiä. Syötä vain tekstisi www-sivulle ja paina painiketta, niin saat uuden sekoitetun tekstin.

Kiitokset:

Kiitokset Maarten van Casterenille, Kathy Rastlelle ja Tim Rogersille tätä sivua koskevista kommenteista ja ehdotuksista.

Esimerkkilauseet:

1) Ajoneuvo räjähti maanantaina Bagdadissa YK:n päämajan lähellä sijaitsevalla poliisin tarkastuspisteellä surmaten pommittajan ja irakilaisen poliisin

2) Suuret kunnallisveronkorotukset tänä vuonna ovat puristaneet monien eläkeläisten tuloja

3) Lääkäri on myöntänyt tappaneensa teini-ikäisen syöpäpotilaan, joka kuoli sairaalassa tapahtuneen lääkemokauksen seurauksena.

Kaikki nämä tulivat BBC:n uutisista 22. syyskuuta 2003.

Vastaa

Sähköpostiosoitettasi ei julkaista.