Or rather…
Ten tekst krążył w Internecie we wrześniu 2003 roku. Po raz pierwszy dowiedziałem się o nim, gdy dziennikarz skontaktował się z moją koleżanką Sian Miller 16 września, próbując namierzyć oryginalne źródło. Był on przekazywany dalej wiele razy i jak większość internetowych memów, po drodze mutował. Uderzyło mnie to jako interesujące – zwłaszcza gdy otrzymałem wersję, w której wspomniano Uniwersytet Cambridge! Pracuję w Cognition and Brain Sciences Unit w Cambridge, w Wielkiej Brytanii, jednostce Medical Research Council, w której skład wchodzi duża grupa badająca, jak mózg przetwarza język. Jeśli istnieje nowy kawałek badań nad czytaniem, które zostały przeprowadzone w Cambridge, pomyślałem, że powinienem słyszeć o tym wcześniej…
Pisałem tę stronę, aby spróbować wyjaśnić naukę stojącą za tym memem. Są w tym elementy prawdy, ale także pewne rzeczy, które naukowcy badający psychologię języka (psycholingwiści) wiedzą, że są błędne. Najbardziej uderzające jest to, że niedawna praca wykazała 11% spowolnienie, gdy ludzie czytają słowa ze zmienionym porządkiem wewnętrznych liter:
Raeding Wrods With Jubmled Lettres There Is a Cost
Keith Rayner, Sarah J. White, Rebecca L. Johnson, and Simon P. Liversedge
Psychological Science, 17(3), 192-193
W tym samym czasie jednak ludzie dość często nie są świadomi tych błędów ortograficznych, a koszt 11% jest mniejszy niż obserwowany w przypadku wymiany liter lub zmiany kolejności zewnętrznych liter. Tak więc, meme ma pewne elementy prawdy w nim, ale jest fałszywy w całości.
Mam zamiar rozbić meme, jedna linia na raz, aby zilustrować te punkty, wskazując na to, co myślę, że jest odpowiednie badania na temat roli kolejności liter na czytanie. Ponownie, jest to tylko mój pogląd na obecny stan badań nad czytaniem, jak to się odnosi do tego meme. Jeśli uważasz, że przegapiłem coś ważnego, daj mi znać.
1) aoccdrnig do rscheearch w Cmabrigde Uinervtisy … Według badań (sic) na Uniwersytecie Cambridge
W Cambridge, w Wielkiej Brytanii jest wiele grup prowadzących badania nad językiem. Jest grupa, w której ja pracuję (Cognition and Brain Sciences Unit), są też grupy w Departamencie Psychologii Eksperymentalnej, zwłaszcza w Centrum Mowy i Języka (gdzie kiedyś pracowałem). Istnieją również badacze języka w Phonetics, Centrum Badań nad Językiem Angielskim i Lingwistyką Stosowaną oraz na Anglia Ruskin University.
Do mojej wiedzy, nie ma nikogo w Cambridge UK, kto obecnie prowadzi badania na ten temat. Być może są ludzie w Cambridge, MA, USA, którzy są odpowiedzialni za te badania, ale ja o nich nie wiem. If you know different, please let me know .
Update:
I’ve found a www page that tracked down the original demonstration of the effect of letter randomisation to Graham Rawlinson. Graham napisał list do New Scientist w 1999 roku (w odpowiedzi na artykuł Saberi & Perrot (Nature, 1999) na temat efektu odwracania krótkich fragmentów mowy). W nim Graham mówi:
To przypomina mi o moim doktoracie na Uniwersytecie w Nottingham (1976), który wykazał, że randomizacja liter w środku słów miał mały lub żaden wpływ na zdolność wykwalifikowanych czytelników do zrozumienia tekstu. Rzeczywiście jeden szybki czytelnik zauważył tylko cztery lub pięć błędów w A4 stronie tekstu muddled.
To możliwe, że z rozgłosem oferowanych przez internet, że badania Dr Rawlinson może być szerzej czytać w przyszłości. Dla tych, którzy chcą przytoczyć to w ich własnych badań pełne odniesienie jest:
Rawlinson, G. E. (1976) Znaczenie pozycji litery w rozpoznawaniu słów. Unpublished PhD Thesis, Psychology Department, University of Nottingham, Nottingham UK.
Update 2:
Graham bardzo uprzejmie przesłał mi streszczenie swojej pracy dyplomowej.
Jest to wyraźnie błędne. Dla przykładu, porównaj następujące trzy zdania:
1) A vheclie epxledod at a plocie cehckipont near the UN haduqertares in Bagahdd on Mnoday kilinlg the bmober and an Irqai polcie offceir
2) Big ccunoil tax ineesacrs tihs yaer hvae seeezueqd the inmcoes of mnay pneosenirs
3) A dootcr has aimttded the magltheuansr of a tageene ceacnr pintaet who deid aetfr a hatospil durg blendur
Wszystkie trzy zdania zostały wylosowane zgodnie z „zasadami” opisanymi w memie. Pierwsza i ostatnia litera pozostały w tym samym miejscu, a wszystkie pozostałe zostały przesunięte. Podejrzewam jednak, że Twoje doświadczenie jest takie samo jak moje, czyli że teksty stają się stopniowo coraz trudniejsze do odczytania. Jeśli utkniesz, oryginalne zdania są wklejone na dole tego artykułu.
Mam nadzieję, że te demonstracje przekonały cię, że w niektórych przypadkach może być bardzo trudno nadać sens zdaniom z pomieszanymi słowami. Najwyraźniej pierwsza i ostatnia litera nie jest jedyną rzeczą, której używasz podczas czytania tekstu. Gdyby tak było naprawdę, jak odróżniłbyś pary słów takie jak „sól” i „listwa”?
Zamierzam wymienić kilka sposobów, w jaki moim zdaniem autor (autorzy) tego meme mógł manipulować pomieszanym tekstem, aby uczynić go stosunkowo łatwym do czytania. Będzie to również służyć do listy czynników, które naszym zdaniem mogą być ważne w określaniu łatwość lub trudność czytania jumbled text w ogóle.
Jest jeszcze bardzo realna debata w psychologii czytania, jednak o tym, co dokładnie informacje używamy podczas czytania. Nie wiem, jak wiele z tej literatury Dr Rawlinson był świadomy w czasie jego tezy, ale myślę, że pogmatwany tekst zapewnia zgrabną ilustrację niektórych źródeł informacji, które teraz uważamy za ważne. I’m going to review some of the research that has been done to demonstrate this.
3) the rset can be a toatl mses and you can sitll raed it wouthit porbelm… the rest can be a total mess and you can still read it without problem
This sentence is, like the rest of the demonstration, strikingly easy to read despite being jumbled. Jak zauważyłeś powyżej, nie wszystkie zdania zniekształcone w ten sam sposób są tak łatwe do odczytania jak to. Co sprawia, że to zdanie jest tak łatwe? Moi koledzy i ja zaproponowaliśmy następujące właściwości:
1) Krótkie słowa są łatwe – 2 lub 3 literowe słowa nie zmieniają się w ogóle. Jedyna zmiana, jaka jest możliwa w słowach 4-literowych, to zamiana kolejności środkowych liter, co nie sprawia zbyt wiele trudności (patrz 4).
2) Słowa funkcyjne (the, be, and, you itd.) pozostają takie same – głównie dlatego, że są to krótkie słowa, patrz (1). To naprawdę pomaga czytelnikowi, zachowując strukturę gramatyczną oryginału, pomagając ci zorientować się, jakie słowo jest prawdopodobnie następne. Jest to szczególnie ważne przy czytaniu pomieszanego tekstu – słowa, które są przewidywalne będą łatwiejsze do odczytania w tej sytuacji.
3) Z 15 słów w tym zdaniu, jest 8, które są nadal w prawidłowej kolejności. Jednak jako czytelnik możesz tego nie zauważyć, ponieważ wiele z tych słów, które pozostały nienaruszone, to słowa funkcyjne, na które czytelnicy nie zwracają uwagi podczas czytania. Na przykład, kiedy ludzie są proszeni o wykrycie pojedynczych liter w zdaniu, są bardziej skłonni do przeoczenia liter w słowach funkcyjnych.
Healy, A. F. (1976). Błędy detekcji na słowie The: Dowody na czytanie jednostek większych niż litery. Journal of Experimental Psychology: Human Perception & Performance, 2, 235-242.
4) Transpozycje sąsiednich liter (np. porbelm dla problem) są łatwiejsze do odczytania niż bardziej odległe transpozycje (np. pborlem). Z badań, w których ludzie czytają słowa przedstawione bardzo krótko na ekranie komputera, wiemy, że zewnętrzne litery słów są łatwiejsze do wykrycia niż litery środkowe – co potwierdza jedną z idei obecnych w memie. Wiemy również, że informacja o pozycji liter w środku słów jest trudniejsza do wykrycia i że te błędy, które są popełniane, mają tendencję do transpozycji.
McCusker, L. X., Gough, P. B., Bias, R. G. (1981) Word recognition inside out and outside in. Journal of Experimental Psychology: Human Perception and Performance, 7(3), 538-551.
Jednym z wyjaśnień tej właściwości systemu czytania jest to, że wynika ona z faktu, że pozycja zewnętrznej litery jest mniej łatwo pomylić z sąsiednimi literami. Istnieje tylko kierunek, w którym litera zewnętrzna może się poruszać, a także jest mniej liter sąsiednich, które mogą „zamaskować” literę zewnętrzną. Obie te właściwości wyłaniają się bardzo naturalnie z modelu sieci neuronowej, w którym litery są identyfikowane w różnych pozycjach w sztucznej siatkówce.
Shillcock, R., Ellison, T.M. & Monaghan, P. (2000). Eye-fixation behaviour, lexical storage and visual word recognition in a split processing model.Psychological Review 107, 824-851.
Konto zaproponowane przez Richarda Shillcocka i współpracowników, sugeruje również inny mechanizm, który może działać w meme. Proponują oni model rozpoznawania słów, w którym każde słowo jest podzielone na pół, ponieważ informacja na siatkówce jest podzielona między dwie półkule mózgu, kiedy czytamy. W niektórych symulacjach ich modelu, Richard Shillcock symuluje efekt pomieszania liter w każdej połowie słowa. Wydaje się, że utrzymywanie liter w odpowiedniej połowie słowa zmniejsza trudność czytania pomieszanego tekstu. Takie podejście zostało użyte w generowaniu przykładu (1) powyżej, ale nie dla (2) lub (3).
5) Żadne ze słów, w których zmieniono kolejność liter, nie tworzy innego słowa (wouthit vs witohut). Z istniejących prac wiemy, że słowa, które mogą być mylone przez zamianę wewnętrznych liter (np. sól i listwa) są trudniejsze do odczytania. Aby stworzyć łatwe do odczytania pomieszane słowo, należy więc unikać tworzenia innych słów.
Andrews, S (1996) Lexical retrieval and selection processes: Effects of transposed-letter confusability. Journal of Memory and Language, 35(6), 775-800.
6) Transpozycje zostały użyte, które zachowują dźwięk oryginalnego słowa (np. toatl vs ttaol dla total). To pomoże w czytaniu, ponieważ często uczęszczamy do dźwięku słów, nawet podczas czytania dla znaczenia:
Van-Orden, G. C. (1987) A ROWS jest ROSE: Pisownia, dźwięk, i czytanie. Memory and Cognition, 15(3), 181-198.
7) Tekst jest w miarę przewidywalny. Na przykład, biorąc pod uwagę kilka pierwszych słów w zdaniu, można się domyślić, jakie słowa będą następne (nawet z bardzo małą ilością informacji o literach w słowie). Wiemy, że kontekst odgrywa ważną rolę w rozumieniu mowy, która jest zniekształcona lub prezentowana w hałasie, to samo jest prawdopodobnie prawdziwe w przypadku tekstu pisanego, który został pomieszany:
Miller, G. A., Heise, G. A., & Lichten, W. (1951). The intelligibility of speech as a function of the context of the test materials. Journal of Experimental Psychology, 41, 329-335.
4) Tihs is bcuseae the huamn mnid deos not raed ervey lteter by istlef, but the wrod as a wlohe…. Dzieje się tak dlatego, że ludzki umysł nie czyta każdej litery sam przez słowo jako całość.
W tym zdaniu sugerowane są dwie idee. Zasadniczo autor ma rację, ludzie nie czytają każdej litery w słowie indywidualnie – z wyjątkiem stosunkowo rzadkiego stanu po urazie mózgu znanego jako czytanie „litera po literze”, jak opisano w następujących:
Warrington, E.K., & Shallice, T. (1980). Word-form dyslexia. Brain, 103, 99-112.
Istnieją również dowody sugerujące, że informacja w kształcie całego słowa odgrywa ważną rolę w czytaniu. Na przykład, „CaSe MiXiNg” znacząco spowalnia czytanie:
Mayall, K., Humphreys, G.W., & Olson, A. (1997). Zakłócenia w przetwarzaniu słów czy liter? The origins of case-mixing effects. Journal of Experimental Psychology: Learning, Memory, & Cognition, 23, 1275-1286.
Jednakże, ponieważ „kształt słowa” zawiera informacje o położeniu wewnętrznych liter (zwłaszcza gdy zawierają one elementy wstępujące i zstępujące), kształt słowa będzie zakłócony przez transpozycje.
Po krótkich prezentacjach słów pisanych, ludzie są często lepsi w odgadywaniu, jakie słowo widzieli, niż w odgadywaniu poszczególnych liter w tym słowie („efekt wyższości słowa”):
Reicher, G. M. (1969) Perceptual recognition as a function of meaningfulness of stimulus material. Journal of Experimental Psychology. 81(2), 275-280.
Jednakże ta demonstracja nie implikuje, że czytanie nie obejmuje żadnego procesu, który zachodzi na poziomie poszczególnych liter. Niedawny artykuł w Nature przedstawia nowy kawałek dowodu na procesy na poziomie liter w czytaniu słów:
Pelli, D. G., Farell, B., Moore, D.C. (2003) The remarkable inefficiency of word recognition, Nature, 423, 752-756.
W tym artykule Pelli i współpracownicy pokazują, że podczas czytania słów, które zostały zniekształcone przez prezentację każdej litery w wizualnym szumie (jak w nieostro nastawionym telewizorze), czytelnicy nie radzą sobie tak dobrze jak „idealny obserwator”, który może rozpoznać słowa tylko na podstawie ich kształtu. Zamiast tego, ich uczestnicy radzą sobie tak dobrze, jak mogliby, gdyby rozpoznawali słowa na podstawie ich poszczególnych liter.
Jasno widać, że debata na temat tego, czy czytamy używając informacji z poszczególnych liter, czy z całych słów, jest daleka od zakończenia. Demonstracje łatwości lub trudności czytania pogmatwanych tekstów wydają się odgrywać ważną rolę w naszym rozumieniu tego procesu. Na przykład:
Perea, M., & Lupker, S. J. (2003). Does jugde activate COURT? Transposed-letter confusability effects in masked associative priming. Memory and Cognition.
Innym niezwykle istotnym artykułem, który właśnie wpadł mi w oko jest ten:
Perea, M., & Lupker, S. J. (2003). Transposed-letter confusability effects in masked form priming. In S. Kinoshita and S. J. Lupker (Eds.), Masked priming: State of the art (pp. 97-120). Hove, UK: Psychology Press.
To, co zrobili Perea i Lupker to przedstawienie słów do decyzji leksykalnej (czy to prawdziwe słowo?) i pomiar czasów reakcji na naciśnięcie jednego z dwóch przycisków (tak/nie). Te docelowe słowa są poprzedzone bardzo krótkimi prezentacjami (50msec) innego ciągu liter, który jest zamaskowany, a więc niewidoczny dla uczestników. Jednakże, wpływ tego zamaskowanego słowa może być pokazany na czas odpowiedzi. Na przykład, czasy odpowiedzi są szybsze, jeśli USHER jest poprzedzone przez „uhser” niż jeśli jest poprzedzone przez „ushre”. To jest, środkowe transpozycje liter „prime” sąsiedniego słowa więcej niż extrerior transpozycje liter. To samo zjawisko, które jest sednem wcześniejszej demonstracji.
Będę wdzięczny za wszelkie komentarze i sugestie, które ludzie mają na tej stronie, niezależnie od poziomu wiedzy. Postaram się zaktualizować tę stronę o więcej informacji na temat memów internetowych, a także na temat powiązanej pracy nad czytaniem, jeśli ludzie są zainteresowani. Może pewnego dnia znajdzie się grupa naukowców z Uniwersytetu Cambridge, którzy dokonają naukowego przełomu, badając czytanie pogmatwanego tekstu…
Inne komentarze:
1) Ted Warring zamieścił link do algorytmu, który jest znacznie lepszy od człowieka w odszyfrowywaniu zakodowanego tekstu. To chyba nie jest zaskakujące – jestem pewien, że nie jestem jedyną osobą, która użyła programu komputerowego do rozwiązania szczególnie wymagającego anagramu.
2) Bruce Murray z Auburn University, Alabama, USA wskazuje na następujący cytat jako reprezentatywny dla linii badań pokazujących, że błędna pisownia (i transpozycje liter) zakłócają proces czytania:
„Niezależnie od semantycznej, składniowej lub ortograficznej przewidywalności, oko wydaje się przetwarzać poszczególne litery …. Zakłócenia w ruchach oczu dorosłych czytelników wskazują, że system wzrokowy ma tendencję do wychwytywania najmniejszych błędów ortograficznych.”
(z Adams, M. J. (1990) Beginning to Read: Thinking and Learning About Print. Cambridge, MA: MIT Press, s. 101)
Jest tu interesująca kwestia, która polega na tym, że subiektywne wrażenie trudności, które dostaje się od czytania pomieszanego tekstu może być zupełnie inne od bardziej obiektywnej miary trudności czytania uzyskanej za pomocą eye-trackera (urządzenia, które mierzy wzór ruchów oczu wykonanych, gdy ludzie czytają tekst drukowany).
Bruce wskazał również, że oryginalny tekst i niektóre dyskusje zostały zamieszczone na „Urban Legends Reference Page”.
3) Peter Hebels stworzył program Visual Basic do generowania pogmatwanych tekstów. Jak mówi:
Zrobiłem fajny program open source w Visual Basic, ten program może zrobić randomizację liter automatycznie dla Ciebie. Randomizuje tylko środkowe litery w słowie, nie zmienia miejsca pierwszej i ostatniej litery, również znaki specjalne takie jak przecinki i okresy nie są dotknięte. Możesz pobrać program i źródło tutaj:
http://home.zonnet.nl/hebels13/letterreplacer.zip
Będziesz potrzebował plików Visual Basic runtime, aby być w systemie, jeśli chcesz uruchomić plik wykonywalny, instalacja dla tych plików można znaleźć tutaj:
http://download.microsoft.com/download/vb60pro/install/6/Win98Me/EN-US/VBRun60.exe
4) Clive Tooth znalazł to, co może być najbardziej niejednoznaczne zdanie jumbled (używając słów takich jak „salt”, które staje się „slat” po transpozycji)
„The sprehas had ponits and patles”
To może wyjść jako…
Szerpowie mieli pitony i talerze.
Kształtowniki miały punkty i plisy.
Serafowie mieli pinoty i płatki.
Szafarze mieli pinoty i palety.
Szafarze mieli potiny i peltas.
Clive wymienia niektóre z bardziej niejasnych słów w tym zestawie możliwych odczytań:
palety: paleae (część kwiatu trawy)
peltas: tarcze
pinots: winogrona
potiny: stopy miedzi
sphaers, sphears: obie stare formy 'sfer’
5) Stephen Sachs napisał skrypt CGI do mieszania tekstu. Po prostu wpisz swój tekst na stronie www i naciśnij przycisk, aby otrzymać nowo zakodowany tekst.
Podziękowania:
Podziękowania dla Maartena van Casterena, Kathy Rastle i Tima Rogersa za komentarze i sugestie dotyczące tej strony.
Przykładowe zdania:
1) Pojazd eksplodował na policyjnym punkcie kontrolnym w pobliżu siedziby ONZ w Bagdadzie w poniedziałek, zabijając zamachowca i funkcjonariusza policji irackiej
2) Duże podwyżki podatku komunalnego w tym roku zmniejszyły dochody wielu emerytów
3) Lekarz przyznał się do nieumyślnego spowodowania śmierci nastoletniego pacjenta chorego na raka, który zmarł po pomyłce w związku z lekami w szpitalu.
Wszystkie te pochodzą z BBC News na 22 września 2003.
.