Как мы читаем Никонов Владимир скачать бесплатно. Читать он-лайн.

E-mail:
Пароль:
	Запомнить
	Войти
	Амнезия? Я новичок

Как мы читаем (Никонов Владимир)

автор: Никонов Владимир категория: Скорочтение ← Саморазвитие

Переводы исследований о том, как мы читаем. Наука распознавания слов. Какой шрифт разборчивее? Чтеине Солв с Прыгающими Буквами. Куда смотрят глаза при чтении. Как работают глаза при чтении.

Об авторе: Автор проектов: • Найди своего мастера - b17.ru • Электронная библиотека «Куб» - koob.ru• Скорочтение и тренировка памяти - yugzone.ru • Майнд машины - mindmachine.ru еще…

С книгой «Как мы читаем» также читают:

Предпросмотр книги «Как мы читаем»

Как мы читаемПодборка исследований

Перевод: Владимир Никонов "b17.ru"b17.ru

"mindmachine.ru/"mindmachine.ru

o "1-3" h z u "" Наука распознавания слов h 2
"" Введение h 2
"" Модель #1: форма слова h 2
"" Модель #2: последовательное буквенное распознавание h 5
"" Модель #3: параллельное буквенное распознавание h 6
"" Исследование перемещения окна h 8
"" Исследование границ h 10
"" Возвращаемся к форме слова h 11
"" Моделирование нейронных сетей h 14
"" Заключение h 17
"" Какой шрифт разборчивее: с засечками или без засечек? h 21
"" Введение h 21
"" 1. Определения h 21
"" 2. Факты h 23
"" Аргументы в пользу шрифта с засечками h 24
"" Аргументы в пользу шрифта без засечек h 25
"" 3. Выводы h 26
"" Чтеине Солв с Прыгающими Буквами h 28
"" Как работают глаза при чтении h 31
"" Куда смотрят глаза при чтении h 33
Наука распознавания слов
Кевин Ларсон (Kevin Larson) Advanced Reading Technoogy, Microsoft Corporation "microsoft.com/typography/ctfonts/wordrecognition.aspx" microsoft.com/typography/ctfonts/wordrecognition.aspx Июль 2004
Введение
Очевидные факты за последние 20 лет трудов в области когнитивной психологии указывают на то, что для распознавания слова мы используем буквы, из которых оно состоит.
Многие печатники и другие энтузиасты текста, которых я встречал, настаивают на том, что мы узнаем слова по контуру, образуемому формой слова. Некоторые из них использовали термин боума (bouma) как синоним слова «форма», хотя я не был знаком с этим термином.
Термин появился впервые в книге Пола Санджера (Pau Saenger) 1997 года «Пробелы между словами: истоки чтения про себя» (Space Between Words: The Origins of Sient Reading). Из нее я, к своему огорчению, узнал, что мы распознаем слова по их форме, и что «современные психологи называют этот образ «формой Боума» (Bouma shape).
Данный документ составлен с точки зрения психологов, занимающихся проблемами чтения. В специализированных журналах приводятся данные, полученные в результате десятков экспериментов, имеющих четко спланированные задания, так что каждый желающий может воспроизвести любой эксперимент и получить те же результаты. Этот труд был изначально представлен в виде лекции на конференции в Ванкувере в сентябре 2003 года.
Цель данного труда — обзор истории развития темы: почему психологи перешли от модели распознавания слова по форме слова к распознаванию слова по форме буквы; другая цель — помочь читателю прийти к такому же выводу самостоятельно.
Этот труд охватывает массу тем при относительно небольшом объеме. По ходу изложения материала я буду представлять эксперименты и модели частично, так как боюсь, что полное изложение материала утомит читателя. Если вы хотите получить более детальную информацию, обратитесь к ссылкам, приведенным в конце материала, там также приведен список дополнительной литературы для тех, кто заинтересуется отдельными темами.
Я начну с описания трех главных категорий моделей распознавания слов: модели формы слова, последовательной и параллельной моделей буквенного распознавания. Я приведу здесь характерные данные для наглядного представления каждой модели. После разбора образцов всех моделей я попробую оценить каждую модель с точки зрения ее соответствия приведенным данным. И наконец, я освещу новейшие исследования в области распознавания слов и опишу более детальную модель, популярную в среде психологов в последнее время.
Модель #1: форма слова
Это модель распознавания слов, согласно которой слово распознается как целостная единица.
Это самая старая модель, встречающаяся в литературе по психологии, гораздо старше самой этой литературы. Основная идея такова, что мы видим слова скорее как цельные, завершенные паттерны, чем как набор отдельных букв.
Некоторые утверждают, что информация, используемая для распознавания слова, есть паттерн с выступающими штрихами (прим. штрихи букв, выступающие: у прописных букв – за верхнюю линию прописных (ЁЙ), у строчных – за верхнюю линию строчных (бёйф)), свисающими штрихами (штрихи прописных и строчных букв, свисающие за нижнюю линию шрифта (ДЩЦруфцу)) и без таковых.
Другая формулировка предлагает использование контура слова.
Рисунок 1: Распознавание формы слова с использованием паттерна с выступающими штрихами, свисающими штрихами и без таковых.
Рисунок 2: Распознавание формы слова с использованием его контура.
Паттерны слова узнаваемы для нас как образ, потому что мы видели каждый из них много раз.
Джеймс Каттел (James Catte, 1886 год) первым из психологов предложил рассмотреть эту модель распознавания слов. Каттел признан независимым основателем такой области, как психолингвистика, которая включает в себя и научное изучение чтения.
Каттел поддерживал модель формы слова, потому что она давала самое лучшее объяснение имеющимся экспериментальным данным.
Каттел открыл замечательный эффект, который сегодня мы называем "Эффектом превосходства слова". Он показывал человеку букву и слово очень короткий промежуток времени (5-10 мс) и обнаружил, что человек более точно узнает слова, чем буквы.
Он пришел к выводу, что испытуемый более точен в узнавании слов за короткий промежуток времени потому, что слова представляют собой цельные узнаваемые единицы.
По современным стандартам исследование Каттела выглядит небрежным, но тот же самый эффект был получен в 1969 году Райхером (Reicher). Он показывал цепочки букв – половину времени реальные слова, половину нет – на очень короткий промежуток времени.
Испытуемого спрашивали, есть ли в этой цепочке конкретная буква или две буквы, например, D или K. Райхер обнаружил, что человек лучше запоминает, скажем, букву D в контексте слова WORD, чем в контексте ORWD (несуществующее слово).
Этот факт поддерживает модель формы слова, потому что именно слово позволяет человеку быстро узнать знакомую форму. Когда человек узнал форму, он логически приходит к выводу о существовании в этом слове конкретной буквы даже после того, как увидел это слово.
Второй ключевой фактор экспериментальных данных в поддержку модели формы слова – то, что текст, написанный строчными (маленькими) буквами читается быстрее, чем тот же текст, записанный прописными (заглавными) буквами.
Вудворт (Woodworth, 1938 год) первым доложил об этом открытии в своем учебнике «Экспериментальная психология» (Experimenta Psychoogy), написанном без постороннего влияния. Это открытие недавно было подтверждено Смитом (Smith, 1969 год) и Фишером (Fisher, 1975 год).
Участников эксперимента просили прочитать сопоставимые отрывки из текста, половина из них была написана заглавными буквами, а половина стандартным образом, строчными буквами.
В каждом исследовании скорость прочтения стандартного текста была на 5-10% выше, чем скорость прочтения текста, написанного заглавными буквами.
Это также склоняет в пользу модели формы слова, потому что текст, написанный строчными буквами, приводит в действие паттерны с выступающими штрихами, свисающими штрихами и без таковых.
Когда текст представлен только заглавными буквами, все буквы – одного размера, а это затрудняет восприятие и, соответственно снижает скорость.
Примеры ошибок, пропущенных при корректуре текста, демонстрируют третий ключевой фактор в пользу модели формы слова.
Участникам эксперимента было предложено прочитать несколько абзацев текста и в то же время отмечать грамматические ошибки. Отрывок был тщательно составлен таким образом: он содержал равное количество двух типов ошибок — ошибки, при которых сохраняются паттерны с выступающими штрихами, свисающими штрихами и без таковых, в другом случае неверное написание приводило к изменению в форме слова — к изменению паттернов с выступающими штрихами, свисающими штрихами и без таковых.
Если слово test – это правильно написанное слово, tesf – пример неверного написания, но слово сохраняет форму; а слово tesc являет собой пример неправильного написания при измененной форме слова.
Модель формы слова предполагает, что в словах, имеющих схожую форму труднее заметить различие в написании, нежели в словах с различающейся формой, так как одинаковая форма скорее введет вас в заблуждение.
Хабер и Шиндлер (Haber & Schinder, 1981 год) и Монк и Хьюлм (Monk & Hume, 1983 год) обнаружили, что в словах с одинаковой формой человек оставляет незамеченными в два раза больше ошибок, чем в словах с различной формой.
Слово, выбранное для эксперимента: testПроцент незамеченных ошибокСлово со схожей формой (tesf)13%Слово с отличающейся формой (tesc)7%Рисунок 3: В слове с неправильным написанием, но одинаковой формой ошибка оставалась незамеченной гораздо чаще.
Четвертый фактор, наглядно подтверждающий действенность модели формы слова – это то, что трудно читать текст в альтернативных вариантах.
Случай ATeRnAtInG – буквы изменяются от заглавных к строчным несколько раз. Модель формы слова предполагает, что это трудно для чтения, потому что в этом случае мы имеем паттерн с выступающими штрихами, свисающими штрихами и без таковых, отличающийся от нормального паттерна этого слова, написанного строчными буквами.
Случай альтернативного написания слова оказался даже более сложным для чтения, чем варианты написания только строчными или только заглавными буквами, что доказывает ряд исследований.
Смит (Smith, 1969 год) доказал, что такое написание значительно замедляет скорость чтения текста. Мэйсон (Mason, 1978 год) также демонстрировал, что в таком случае требуется больше времени, чтобы назвать слово. Поллацек, Уэлл и Шиндлер (Poatsek, We, & Schinder, 1975 год) показали, что поиск соответствия в данном случае затруднен, и Мэйер и Гутшера (Meyer & Gutschera, 1975 год) доказали, что распознавание такой категории форм замедлено.
Модель #2: последовательное буквенное распознавание
Самой недолгоживущей моделью распознавания слов оказалась модель чтения слова буква за буквой последовательно слева направо.
Гоф (Gough, 1972 год) предложил эту модель, потому что она проста для понимания и гораздо более проверяемая, чем модель формы слова.
Суть этой модели в том, что распознавание слова, т.е. его поиск в имеющемся ментальном лексиконе, приравнивалось к процессу поиска слова в словаре. Вы начинаете поиск с первой буквы, потом переходите ко второй, потом к третьей и т.д., пока не распознаете все слово.
Эта модель согласуется с открытием Шперлинга (Spering, 1963 год), что буквы можно распознавать со скоростью 10-20 мс на букву.
Шперлинг показывал участникам эксперимента цепочку случайно выбранных букв на очень короткие промежутки времени и спрашивал, содержится ли в этой цепочке конкретная буква. Он обнаружил, что если человеку дать 10 мс времени на букву, он успешно справится с заданием. Например, если заданная буква была на четвертой позиции, и эта цепочка из букв демонстрировалась в течение 30 мс, участник не мог успешно выполнить задание, но если время было увеличено до 40 мс, он успешно справлялся с заданием. Гоф заметил, что скорость 10 мс на букву соответствует типичной скорости чтения 300 слов в минуту.
Модель последовательного буквенного распознавания также позволяет предполагать, что более короткие слова распознаются быстрее более длинных.
То, что распознавание более длинных слов требует более длительного времени – неоспоримый факт.
Для того, чтобы распознать слово из 5 букв, требуется больше времени, чем чтобы распознать слово из 4 букв; а слово из 6 букв потребует больше времени для распознавания, чем слово из 5 букв. Модель последовательного буквенного распознавания предполагает, что именно так и должно происходить, тогда как модель формы слова вовсе не предполагает такого явления.
В самом деле, согласно модели формы слова более длинные, но обладающие уникальными паттернами слова должны распознаваться легче, чем более короткие.
Модель последовательного буквенного распознавания оказалась несостоятельной потому, что она не позволяет объяснить "Эффект превосходства слова".
Эффект превосходства слова означает, что читатель способен быстрее идентифицировать буквы в контексте слова, чем по отдельности, тогда как модель последовательного буквенного распознавания предполагает, что буква, расположенная, например, на третьей позиции в слове требует в 3 раза больше времени для распознавания, чем отдельно взятая буква.
Модель #3: параллельное буквенное распознавание
Модель, которую большинство психологов в последнее время считают самой точной, это модель параллельного буквенного распознавания.
Эта модель предполагает, что буквы, из которых состоит слово, распознаются одновременно, а информация, полученная путем распознавания букв, позволяет распознать слово.
Это весьма активная область исследований, и существует много специфических моделей, соответствующих по сути данной категории. Мы здесь рассмотрим одну популярную формулировку этой модели.
Рисунок 4 демонстрирует типичную активацию, основанную на модели параллельного распознавания слов. В этом примере читатель распознает слово work. Каждый буквенный символ распознается одновременно.

Рисунок 4: параллельное буквенное распознавание
Первый шаг операции – идентификация индивидуальных черт каждой буквы, таких как горизонтальные и диагональные линии и изгибы. Детали этого уровня не критичны для наших целей. Эти отличительные черты отсылаются затем на уровень идентификации буквы, где каждая из букв рассматриваемого слова распознается одновременно.
Уровень распознавания буквы отсылает затем активацию на уровень идентификации слова. Буква W, занимающая первую позицию на уровне идентификации букв, отсылает активацию ко всем словам, в которых буква W занимает первую позицию (WORD и WORK). Буква O, находящаяся на второй позиции на уровне идентификации букв, отсылает активацию ко всем словам, в которых буква O занимает вторую позицию (FORK, WORD и WORK). Тогда как FORK и WORD получают активацию от трех из четырех букв, слово WORK получает максимальную активацию, потому что в нем активируются все 4 буквы, таким образом, это и есть распознаваемое слово.
Уже более 100 лет известно, что когда мы читаем, наш взгляд не скользит плавно по странице, а скорее совершает прыжки от слова к слову. Мы фиксируем взгляд на каждом слове на определённый период времени, грубо говоря, это 200-250 мс, затем делаем баллистическое движение к следующему слову.
Эти движения называются саккады и обычно занимают 20-35 мс. Большинство саккад – это движения, направленные вперед и охватывающие от 7 до 9 букв, но 10-15% всех саккад являются регрессивным движением или движением, направленным назад.
Большинство читателей в процессе чтения не имеют представления о частоте регрессивных саккад. Место фиксации взгляда не является случайным.
Взгляд никогда не фиксируется между словами и обычно фиксируется слева от середины слова. Взгляд фиксируется и не на всех словах; короткие слова и особенно служебные слова часто пропускаются.
В момент каждой фиксации мы распознаем ограниченное количество информации. Фовеа (центральная ямка - небольшое углубление, находящееся в центре желтого пятна сетчатой оболочки глаза), которая четко является центром нашего видения, позволяет видеть только 3-4 буквы влево и вправо от точки фиксации при чтении на нормальном расстоянии.
Острота зрения резко уменьшается в парафовее (это область сетчатки, непосредственно окружающая фовеу), которая охватывает 15 - 20 букв влево и вправо от точки фиксации.
Исследования движения глаз, которые мы здесь вкратце обсудим, указывают на то, что существуют 3 зоны визуальной идентификации. Читатели собирают информацию со всех трех зон в каждой точке фиксации.
Самая близкая к точке фиксации зона – та, где имеет место распознавание слова. Эта зона обычно достаточно велика, чтобы охватить все зафиксированное слово, и часто включает в себя меньшие служебные слова, расположенные вправо от зафиксированного слова.
Следующая зона распространяется на несколько букв после зоны распознавания слова, и читатель получает предварительную информацию о буквах, расположенных в этой зоне.
Последняя зона распространяется приблизительно на 15 букв после точки фиксации. Информация, получаемая из этой отдаленной зоны, используется для идентификации длины предстоящего к прочтению слова, а также для определения позиции следующей точки фиксации.
Рисунок 5 представляет диаграмму точек фиксации типичного читателя.
Рисунок 5: Саккадические движения глаз
Например, на рисунке 5 лучшей точкой фиксации является буква s в слове Roadside. Читатель может распознать слово Roadside, первичную информацию о первых нескольких буквах в слове joggers, также как и получить полную информацию о длине слова joggers.
Более интересная точка фиксации – это слово sweat. В данной точке фиксации как слово sweat, так и слово pain достаточно короткие для полного распознавания, тогда как первичную буквенную информацию мы получаем для слова and.
Поскольку and является часто встречающимся служебным словом, полученной информации достаточно, чтобы совсем пропустить это слово. Информацию о длине слова мы собираем на протяжении всего пути к слову angry, которое стало следующей точкой фиксации.
Существуют 2 экспериментальные методологии, которые стали критичными для понимания момента фиксации: это парадигма перемещения окна и парадигма исследования границ.
Эти парадигмы позволяют изучать читателей в процессе обычного чтения. При этом также используются трекеры с датчиками движения глаз и компьютеры для выполнения манипуляций с текстом, когда читатель осуществляет саккады.
Во время выполнения саккады читатель функционально слеп. Читатель не заметит, что текст был изменен, если изменение было произведено раньше, чем он закончил выполнять саккаду.
Исследование перемещения окна
В технике перемещения окна мы ограничиваем объем видимого текста до определенного количества букв вокруг точки фиксации, а все другие буквы на этой странице заменяем буквой x.
Задание читателей – просто читать страницу текста. Интересный эксперимент: сделать наоборот, т.е. заменить буквой x все буквы в области фиксации, но это очень мешает читателю. Если только по 3 буквы влево и вправо от точки фиксации заменить буквой x, то скорость чтения падает до 11 слов в минуту.
Макконки и Райнер (McConkie & Rayner, 1975 год) изучили, сколько нужно охватывать букв вокруг точки фиксации, чтобы обеспечить нормальный процесс чтения.
Рисунок 6 демонстрирует момент, что видит читатель, если он читает отрывок, и его взгляд при этом зафиксирован на второй букве е в слове experiment. Если читателю представлены 3 буквы после точки фиксации, то он не увидит всего слова, и его средняя скорость чтения замедлится до 207 слов в минуту. Если читателю открыть 9 букв после точки фиксации, он увидит слово experiment целиком и часть следующего слова was.
Размер окна ПредложениеСкорость чтения3 буквыAn experimxxx xxx xxxxxxxxx xx207 слов в минуту9 буквAn experiment wax xxxxxxxxx xx308 слов в минуту15 буквAn experiment was condxxxxx xx340 слов в минутуРисунок 6: Линейное соотношение между количеством букв, доступных в перемещающемся окне, и скоростью чтения.
С 9 буквами скорость чтения умеренно замедлена. Если же читателю открыть 15 букв после точки фиксации, скорость чтения так же высока, как будто перемещения окна не было вовсе. В рамках 15 букв существует линейное отношение между количеством букв, доступных читателю, и скоростью чтения.
Из этого исследования стало ясно, что диапазон нашего восприятия примерно 15 букв. Это очень интересно, т.к. средняя длина саккады 7-9 букв, т.е., грубо говоря, половина диапазона восприятия.
Это говорит о том, что пока читатель распознает слова в области фовеи, он использует дополнительную информацию, что дает возможность продолжать чтение.
Следует отметить, что мы используем только информацию справа от точки фиксации, и что информация, находящаяся слева от зафиксированного в данный момент слова совершенно не используется.
На рисунке 6, где точкой фиксации избрана вторая буква e в слове experiment, если слово An передвинуть, это не замедлит дальнейшую скорость чтения.
Метод перемещающегося окна демонстрирует важность букв при чтении, но имеет и слабые места.
Модель формы слова также предполагает, что скорость чтения снизится, если исчезнет информация о форме слова. Модель формы слова предполагает и то, что процесс чтения всегда будет значительно улучшен, если информация о форме слова в целом будет восстановлена. Как выяснилось, это не соответствует действительности.
Рисунок 7 демонстрирует скорость чтения, когда доступны 3 буквы (прим. от точки фиксации на второй e, учитываются пробелы). Она примерно равна скорости чтения, когда доступно слово целиком. Это верно, даже при том, что в целом слове в среднем на 0.7 больше доступных для восприятия букв. Когда фиксируемое слово и следующее за ним слово полностью доступны, скорость чтения равна скорости при варианте, когда доступны 9 букв.

Размер окнаПредложениеСкорость чтения3 буквыAn experimxxx xxx xxxxxxxxx xx207 слов в минуту1 слово (3.7 букв)An experiment xxx xxxxxxxxx xx212 слов в минуту9 буквAn experiment wax xxxxxxxxx xx308 слов в минуту2 слова (9.6 букв)An experiment was xxxxxxxxx xx309 слов в минуту15 буквAn experiment was condxxxxx xx340 слов в минуту3 слова (15 букв)An experiment was conducted xx339 слов в минутуРисунок 7: Полная информация о слове не повышает скорости чтения.
Скорость чтения также эквивалента, когда доступны 3 слова или 15 букв. Это означает, что скорость чтения не обязательно повышается, если все последующие слова доступны целиком; такие же значения скорости чтения имеют место, когда доступны всего несколько букв.
Поллацек и Райнер (Poatsek & Rayner, 1982 год) использовали парадигму перемещающегося окна для сравнения скорости чтения, когда пробелы между словами были заменены буквой x. Выяснилось, что длина саккад короче, когда информация о пробелах между словами недоступна.
Исследование границ
Исследование границ (Райнер (Rayner, 1975 год)) – еще одна инновационная парадигма, использование которой сделали возможным трекеры и компьютеры.
Посредством исследования границ мы можем проанализировать, какую информацию читатель использует внутри диапазона восприятия (15 букв), но за пределами зафиксированного слова.
Рисунок 8 иллюстрирует, что читатель видит в рамках данного исследования.

Рисунок 8: Цепочка букв ebovf после пересечения границы изменяется на chart в период совершения саккады.
Читая слова The od captain, читатель совершает обычный процесс чтения. Когда читатель доходит до слова put, ключевое слово становится доступным в пределах диапазона фиксации читателя. В этом примере ключевое слово ebovf. Когда читатель совершает саккаду от put к ebovf, саккада пересечет невидимую границу, что станет сигналом к изменению в тексте. Прежде чем саккада завершена, текст будет изменен на правильный вариант, в данном случае несуществующее слово ebovf будет заменено на chart. Читатель всегда фиксирует взгляд на правильном для данного предложения варианте слова.
Критичное слово в данном исследовании представлено в разных вариантах, включая идентичный контрольный вариант (chart); вариант, при котором сохранена форма слова и совпадают несколько букв (chovt); вариант с несхожей формой слова, несколько букв совпадают (chyft); и вариант со схожей формой слова, ни одна буква не совпадает (ebovf).
Время фиксации слов как до, так и после границы было измерено. Время фиксации до границы совпадает как в случае с контрольным правильным вариантом, так и во всех трех экспериментальных вариантах.
После границы скорость чтения выше в контрольном варианте (chart); на втором месте по скорости вариант со схожей формой слова и несколькими совпадающими буквами (chovt); на третьем месте – вариант, когда только несколько букв совпадают (chyft); и самая медленная скорость при условии, когда сохранена только форма слова, ни одна буква не совпадает (ebovf).
Это означает, что читатель собирает информацию о буквах в рамках диапазона фиксации, даже когда целое слово не распознано.
chartИдентичное слово (контрольный вариант)210 мсchovtСхожая форма слова, несколько букв совпадают240 мсchyftНесхожая форма слова, несколько букв совпадают280 мсebovfСхожая форма слова, ни одна буква не совпадает300 мсРисунок 9: Относительная скорость в различных вариантах при исследовании границ.
Наличие одинаковых букв сыграло важную роль для времени фиксации. Но это не умаляет роль формы слова, так как комбинация, при которой совпадает форма слова и имеются одинаковые буквы, ускоряет распознавание слова.
Райнер (Rayner, 1975 год) пошел еще дальше и исследовал, что случится, если все буквы основного слова сделать заглавными (CHART). Такой вариант исключает роль формы слова, но полностью сохраняет информацию о буквах. Выяснилось, что время фиксации такое же, как в контрольном варианте!
Это доказывает, что мы при чтении от саккады к саккаде мы сохраняем не визуальную информацию о форме слова, или даже о форме буквы, а, вероятнее всего, абстрактную информацию о том, какие буквы последуют далее.
Литература о движении глаз демонстрирует, что для узнавания слова мы используем информацию о буквах, так как чем больше букв нам доступно, тем выше качество чтения. От саккады к саккаде мы объединяем абстрактную информацию о буквах, чтобы усилить процесс чтения, поэтому с периферии мы собираем именно информацию о буквах. И, наконец, мы используем информацию о пробелах между словами при планировании следующей саккады.
Возвращаемся к форме слова
До сих пор я представлял здесь факты в поддержку модели распознавания слова; факты, противоречащие модели последовательного распознавания слова; и данные о движении глаз, которые противоречат модели формы слова, поддерживая в то же время модель параллельного буквенного распознавания.
В этом разделе я повторно исследую данные, которые использовались в поддержку модели формы слова, чтобы проверить, является ли она неконгруэнтной по отношению к модели параллельного буквенного распознавания.
Самое мощное свидетельство в пользу модели формы слова – это, пожалуй, эффект превосходства слова, который демонстрирует, что буквы могут быть точно распознаны скорее в контексте слова чем по отдельности; например, участники эксперимента были более точны в узнавании буквы D в контексте слова WORD, чем в контексте несуществующего слова ORWD (Reicher, 1969 год).
Это свидетельствует в пользу модели формы слова, т.к. читатель скорее распознаёт знакомую форму слова и логически приходит к выводу о присутствии заданной буквы в слове после окончания демонстрации символов, тогда как несуществующее слово может быть прочитано только по буквам.
Макклелланд и Джонсон (McCeand & Johnson, 1977 год) продемонстрировали, что причиной проявления эффекта превосходства слова является не узнавание формы, а, скорее всего, существование регулярных буквенных комбинаций.
Псевдослова не являются словами английского языка, но обладают фонетической регулярностью, которая позволяет легко их произносить. Слова mave и rint – два примера псевдослов. Т.к. псевдослова не имеют смыслового содержания и читателю раньше не встречались, они не должны иметь знакомую форму.
Макклелланд и Джонсон обнаружили, что буквы распознаются быстрее в контексте псевдослов (mave), чем в контексте несуществующих слов (amve). Это доказывает, что эффект превосходства слова обусловлен регулярными комбинациями букв, а не формой слова.
Самое слабое свидетельство в поддержку формы слова это то, что текст, написанный строчными буквами, читается быстрее текста, написанного заглавными буквами. Это всецело вопрос практики.
Большинство людей имеют опыт чтения текстов, написанных преимущественно строчными буквами, поэтому и качество чтения таких текстов у них высокое, благодаря практике. Если человека заставить читать большое количество текстов, написанных заглавными буквами, его скорость чтения постепенно увеличится до уровня скорости чтения обычных текстов, т.е. написанных строчными буквами.
Даже при чтении текстов, представленных в виде своего зеркального отражения, с практикой возможно увеличение скорости чтения (Колерс и Перкинс (Koers & Perkins, 1975 год)).
Габер и Шиндлер (Haber & Schinder, 1981 год) заметили, что читатели пропускают в два раза больше ошибок в заданиях по корректуре текста, если ошибка не приводит к изменению формы слова (tesf, 13% пропусков), чем когда ошибка приводит к изменению формы слова (tesc, 7% пропусков).
Этот результат выглядит убедительным до тех пор, пока вы не начинаете понимать, что разрушается и форма слова, и форма буквы. В ходе исследования сравнивались ошибки, которые приводили к изменению и формы слова, и формы буквы, с ошибками, которые не приводили ни к изменению формы слова, ни к изменению формы буквы. Паап, Ньюсом и Ноэль (Paap, Newsome, & Noe, 1984 год) определили соотношение значимости формы слова и формы буквы и выяснили, что в целом этот эффект обуславливается формой буквы.
Рисунок 10 представляет пример слова than в каждом из четырех вариантов: перемещения одинаковой и различной формы слова, и одинаковой и различной формы буквы.
thanОдинаковая форма словаРазная форма словаОдинаковая форма буквыtban15% пропущенных ошибокtnan19% пропущенных ошибокРазная форма буквыtdan8% пропущенных ошибокtman10% пропущенных ошибокРисунок 10: Влияние формы слова и формы буквы на количество пропущенных ошибок при корректуре текста.
Как у Габера и Шиндлера, участники исследования пропускали ошибку в случае с одинаковой формой слова и одинаковой формой буквы (tban, 15% пропусков) гораздо чаще, чем в случае с различной формой слова и формой буквы (tman, 10% пропусков).
Два промежуточных варианта с разной формой слова при одинаковой форме буквы (tnan, 19% пропусков) и с одинаковой формой слова при разной форме буквы (tdan, 8% пропусков) являются разъясняющими.
Статистически доказано, что количество пропущенных ошибок при корректуре текста значительно больше, когда форма букв одинаковая (tban и tnan), по сравнению с вариантами, когда форма букв разная (tdan и tman).
В то же время не существует статистически доказанной разницы между вариантами с одинаковой формой слова (tban и tdan) и разной формой слова (tnan и tman), больше ошибок пропускается в варианте с разной формой слова.
Эта тенденция остро противоречит выводам более ранних исследований.
Последним фактором, подтверждающим модель формы слова, является то, что текст, представленный в альтернативном варианте (когда одно слово написано частично строчными, частично заглавными буквами – ATeRnAtInG), читается медленнее, чем текст, написанный либо только строчными, либо только заглавными буквами.
Этот фактор поддерживает модель формы слова, так как читатель способен быстро узнать знакомый паттерн слова, написанного целиком строчными/заглавными буквами, тогда как слово, написанное альтернативным способом, имеет совершенно нестандартную форму.
Адамс (Adams, 1979 год) опроверг данное утверждение, исследуя влияние альтернативного написания как на слова, которые, будучи написаны нормальными строчными/заглавными буквами, должны иметь знакомые читателю паттерны, так и на псевдослова, которые не должны иметь знакомые паттерны в любой форме, т.к. читатель никогда раньше не встречал такую последовательность букв.
Адамс обнаружил, что как слова, так и псевдослова одинаково подвергаются искажению альтернативным написанием. Поскольку на псевдослова также влияет альтернативное написание, следует считать, что причиной данного эффекта является не форма слова.
Дальнейшее исследование свидетельств в поддержку модели формы слова продемонстрировало, что аргументация в пользу данной модели не так убедительна, как это выглядело раньше.
Эффект превосходства слова обусловлен последовательностью букв, а не формой слова. Текст, написанный строчными буквами, читается быстрее текста, написанного заглавными буквами, благодаря практике.
Схожесть формы букв влечет за собой большее количество пропущенных ошибок при корректировке текста, нежели схожесть формы слов. И на скорость чтения псевдослов также влияет альтернативное написание. Все эти открытия скорее имеют больше смысла в рамках модели чтения параллельного буквенного распознавания, чем в рамках модели формы слова.
В следующем разделе я опишу активную область в направлении исследования модели параллельного буквенного распознавания. Существует множество моделей чтения в рамках модели параллельного буквенного распознавания, но в одном труде все модели обсудить невозможно. Моделирование нейронных сетей, которое иногда называют связующим моделированием или параллельной распределенной обработкой, имеет особое значение для продвижения нашего понимания процессов чтения.
Моделирование нейронных сетей
При моделировании нейронных сетей мы используем простые, низкоуровневые механизмы мозга, которые, как известно, используются мозгом для моделирования сложного поведения человека.
Два следующих основных биологических принципа известны уже достаточно давно. Маккалок и Питтс (McCuoch & Pitts, 1943, 1947г.г.) показали, что нейроны суммируют данные, полученные от других нейронов. На рисунке 11 показано крошечное двухмерное поле нейронов (темные треугольники) и, что более важно, множество входных и выходных соединений для каждого нейрона.
Рисунок 11: Поле нейронов и синапсов в коре головного мозга.
По современным оценкам каждый нейрон в коре головного мозга имеет 4000 синапсов. Каждый синапс имеет базовый уровень коммуникации между нейронами и может либо увеличивать этот уровень коммуникации, что означает возбудительное событие, либо понижать уровень коммуникации, что означает запрещающее событие.
Когда нейрон получает больше возбудительной, чем запрещающей информации, он становится активным.
Другой ключевой биологический принцип таков: процесс обучения основан на модификации синаптических связей (Гебб (Hebb, 1949 год)). Когда от синапса поступает важная информация, связь между двумя нейронами становится физически сильнее, а когда информация от другого синапса менее важна, синапсис ослабевает или вообще умирает.
Первой широко известной моделью чтения, созданной путем моделирования нейронных сетей была Интерактивная модель активации Макклелланда и Румельхарта (McCeand & Rumehart, 1981 год).
Диаграммы на рисунке 12 показывают, как работает эта модель.
Рисунок 12: Интерактивная модель активации Макклелланда и Румельхарта: несколько элементов, соседствующих с элементом буквы Т, находящейся на первой позиции в слове, и их взаимосвязи.
Читатель обрабатывает букву T на первой позиции в слове. Поток информации здесь начинает поступать снизу, где расположены визуальные определители элементов буквы. Два знака слева активны (см. рисунок №12), т.к. они соответствуют элементам заглавной буквы Т, тогда как три знака справа не активны, т.к. не соответствуют элементам буквы.
Каждый знак на уровне визуальных определителей элементов связан с каждым знаком на уровне определителей буквы. Буквы, которые мы здесь видим, относятся только к первой букве слова.
Связи между уровнем визуальных определителей элементов и буквенным уровнем все являются либо возбудительными (представлены стрелочками на конце соединения), либо запрещающими (представлены кружочками на конце соединения).
Буквы А, Т и S получили возбудительную активацию от двух левых определителей элементов букв, т.к. все три имеют перекладину на верхушке (по крайней мере, в данном шрифте на рисунке).
Запрещающие связи между каждой из этих букв приводят к тому, что буква Т имеет самую высокую степень активации, т.к. здесь мы видим самый большой приток возбудительной активации. Элементы буквы T пошлют затем возбудительную активацию ко всем словам, которые начинаются с буквы T, и запрещающую активацию ко всем другим словам.
Когда элементы слова получают сигнал активации, они посылают запрещающую активацию ко всем другим словам, возбудительная активация возвращается к элементам буквы от букв, из которых состоит слово, и запрещающая активация ко всем другим буквенным элементам. Буквы, расположенные не на первой позиции, нужны для распознавания того, какое именно слово, начинающееся с буквы Т, читается в данный момент.Одно из преимуществ моделирования нейронных сетей заключается в том, что оно достаточно точное, что позволяет программировать его на компьютере и тестировать. Интерактивная модель активации объясняет даже то поведение человека, для которого она не была специально создана. Например, если человеку показать поврежденные символы, как на рисунке 13, он с легкостью определит, что поврежденное слово WORK, но и компьютерное моделирование данной модели также может решить эту задачу.
Рисунок 13: Это поврежденное изображение человек легко прочитает как WORK.
Компьютерное моделирование не претендует на решение проблем визуального восприятия, оно, скорее, указывает, какой из визуальных элементов задействован для каждой буквенной позиции.
Из компьютерного моделирования следует, что четвертой позиции соответствует вертикальная линия слева, перекладина в середине и диагональ, направленная вниз и вправо.
Рисунки 14 и 15 показывают уровни активации определенных элементов буквы и слова по прошествии времени.

Рисунок 14: Уровень активации по прошествии времени для буквенных элементов на четвертой позиции в слове.
Время в компьютере измеряется в периодах активации. Рисунок 14 показывает ранний этап активации, равно восходящей к элементам букв k и r. Это происходит потому, что визуальная информация поддерживает обе эти буквы, тогда как элементы буквы d остаются без поддержки. В ранние периоды элементы буквы получают активацию только от визуальных символов, но позже активация обеспечивается элементами слова.
Рисунок 15 показывает активацию на примере четырех слов: work, word, weak и wear.

Рисунок 15: Уровень активации по прошествии времени для элементов слова.
Т.к. первые три буквы слова не искажены, буквенные элементы с легкостью распознаются как буквы w, o и r для первых трех позиций соответственно.
Эти буквы обеспечивают раннюю активацию для слов work и word, но не для слов weak и wear. Затем элементы слова начинают возвращать активацию обратно на уровень буквенных элементов, указывая, что четвертая буква должна быть k или d. Так как k – уже активный буквенный элемент, тогда как d - неактивный, элемент k усиливается далее. Это позволяет букве k и слову work продолжать активацию и посылать запрещающую активацию к своим соперникам, букве r и слову word.
Подобные паттерны активации также могут объяснить эффект превосходства слова.
Заключение
Учитывая, что все известные мне психологи, занимающиеся исследованием процессов чтения, поддерживают ту или иную версию модели параллельного буквенного распознавания, как получается, что все печатники, которых я знаю, утверждают, что мы читаем с помощью определения формы слова целиком?
Здесь имеет место грандиозное взаимонепонимание. Документ Боума (Bouma), который чаще всего цитируется, не поддерживает модель формы слова. Боума (1973 год) демонстрировал участникам эксперимента слова и непроизносимые цепочки букв в стороне от точки фиксации и измерял возможность назвать первую и последнюю буквы.
Он обнаружил, что: A) Наиболее успешно распознаются буквы, расположенные справа, а не слева от точки фиксации. B) Когда мы концентрируем внимание справа от точки фиксации, легче распознается последняя, а не первая буква слова. Эти данные объясняют, почему мы стремимся выбирать точку фиксации слева от центра слова.
Боувис и Боума (Bouwhuis & Bouma, 1979 год) дополнили труд Боума (1973 год) не только открытием возможности распознавания первой и последней букв слова, но и букв, расположенных в середине слова.
Они использовали это открытие для разработки модели распознавания слова, основанной на возможности распознавания каждой букв, из которых состоит слово. Они пришли к выводу, что "форму слова … можно представить как последовательность букв, каждая из которых расположена на определенной позиции". Эта модель распознавания слов напрямую повлияла на модель нейронной сети Маклелланда и Румельхарта (McCeand & Rumehart), рассмотренную нами ранее, которая также использует влияние позиции буквы в слове на вероятность успешного распознавания слова.
Модель формы слова больше не представляется жизнеспособной моделью распознавания слова.
Масса научно доказанных фактов утверждают, что мы распознаем буквы, из которых состоит слово, а затем используем эту визуальную информацию для распознавания слова. В дополнение к перцепционной информации мы также используем контекстуальную информацию для распознавания слова в процессе чтения, но это не имеет отношения к форме слова, поэтому модель формы слова не выдерживает конкуренции с параллельным буквенным распознаванием. Очевидно, что читаемость и разборчивость шрифта не следует оценивать по его способности качественно воспроизводить форму боума.
Почему я написал эту статью Я психолог, работавший на Microsoft в разных ролях с 1996 года. В 2000 году я получил степень доктора философии в области когнитивной психологии от Техасского университета в Остине за исследования по теме распознавания слова и изучения навыков чтения. Я присоединился к группе CearType в 2002 году, чтобы принять участие в развитии научного понимания преимуществ технологии CearType и других технологий чтения, имеющих целью максимальное совершенствование экранного чтения.
В течение первого года моей работы в группе я провел серию лекций на имеющие отношение к данному вопросу психологические темы, причем некоторые из них вызвали жесткое несогласие со стороны группы. В основе спора лежало убеждение, принятое всей группой, что мы распознаем слова по контуру слова, тогда как я был уверен, что мы распознаем отдельные буквы. В начале моей карьеры философа в области чтения я никогда не встречал модель чтения, которая использовала бы форму слова как перцепционную единицу, и не знал психологов, которые бы работали над такой моделью. Но оказалось, что данная модель чтения имеет очень длинную историю, с которой я был просто не знаком.
Ссылки
Adams, M.J. (1979). Modes of word recognition. Cognitive Psychoogy, 11, 133-176.
Bouma, H. (1973). Visua Interference in the Parafovea Recognition of Initia and Fina Letters of Words, Vision Research, 13, 762-782.
Bouwhuis, D. & Bouma, H. (1979). Visua word recognition of three etter words as derived from the recognition of the constituent etters, Perception and Psychophysics, 25, 12-22.
Catte, J. (1886). The time taken up by cerebra operations. Mind, 11, 277-282, 524-538.
Fisher, D.F. (1975). Reading and visua search. Memory and Cognition, 3, 188-196.
Gushko, R.J. (1979). The organization and activation of orthographic knowedge in reading aoud. Journa of Experimenta Psychoogy: Human Perception and Performance, 5, 674-691.
Gough, P.B. (1972). One second of reading. In Kavanagh & Mattingy’s Language by ear and by eye. Cambridge, MA: MIT Press.
Haber, R.N. & Schinder, R.M. (1981). Errors in proofreading: Evidence of syntactic contro of etter processing? Journa of Experimenta Psychoogy: Human Perception and Performance, 7, 573-579.
Hebb, D.O. (1949). The organization of behavior. New York: Wiey.
Mason, M. (1978). From print to sound in mature readers as a function of reader abiity and two forms of orthographic reguarity, Memory and Cognition, 6, 568-581.
Koers, P.A. & Perkins, D.N. (1975). Spatia and ordina components of form perception and iteracy. Cognitive Psychoogy, 7, 228-267.
McCeand, J.L. & Johnson, J.C. (1977). The roe of famiiar units in perception of words and nonwords. Perception and Psychophysics, 22, 249-261.
McCeand, J.L. & Rumehart, D.E. (1981). An interactive activation mode of context effects in etter perception: Part 1. An account of basic findings. Psychoogica Review, 88, 375–407.
McCuoch, W.S. & Pitts, W. (1943). A ogica cacuus of the ideas immanent in nervous activity. Buetin of Mathematica Biophysics, 5, 115-133.
McConkie, G.W. & Rayner, K. (1975). The span of the effective stimuus during a fixation in reading. Perception and Psychophysics, 17, 578-586.
Meyer, D.E. & Gutschera, K.D. (1975). Orthographic versus phonemic processing of printed words. Psychonomic Society Presentation.
Monk, A.F. & Hume, C. (1983). Errors in proofreading: Evidence for the use of word shape in word recognition. Memory and Cognition, 11, 16-23.
Paap, K.R., Newsome, S.L., & Noe, R.W. (1984). Word shape’s in poor shape for the race to the exicon. Journa of Experimenta Psychoogy: Human Perception and Performance, 10, 413-428.
Pitts, W. & McCuoch, W.S. (1947). How we know universas: the perception of auditory and visua form. Buetin of Mathematica Biophysics 9: 127-147.
Paut, D.C., McCeand, J.L., Seidenberg, M.S., & Patterson, K. (1996). Understanding norma and impaired word reading: Computationa principes in quasi-reguar domains. Psychoogica Review, 103, 56–115.
Poatsek, A. & Rayner, K. (1982). Eye movement contro in reading: The roe of word boundaries. Journa of Experimenta Psychoogy: Human Perception and Performance, 8, 817-833.
Poatsek, A., We, A.D., & Schinder, R.M. (1975). Effects of segmentation and expectancy on matching time for words and nonwords. Journa of Experimenta Psychoogy: Human Perception and Performance, 1, 328-338.
Rayner, K. (1975). The perceptua span and periphera cues in reading. Cognitive Psychoogy, 7, 65-81.
Rayner, K., McConkie, G.W., & Zoa, D. (1980). Integrating information across eye movements. Cognitive Psychoogy, 12, 206-226.
Reicher, G.M. (1969). Perceptua recognition as a function of meaningfuness of stimuus materia. Journa of Experimenta Psychoogy, 81, 275-280.
Seidenberg, M.S., & McCeand, J.L. (1989). A distributed, deveopmenta mode of word recognition and naming. Psychoogica Review, 96, 523–568.
Smith, F. (1969). Famiiarity of configuration vs. discriminabiity of features in the visua identification of words. Psychonomic Science, 14, 261-262.
Spering, G. (1963). A mode for visua memory tasks. Human Factors, 5, 19-31.
Woodworth, R.S. (1938). Experimenta psychoogy. New York; Hot.
Рекомендуемая литература
1. Rayner, K. (1998). Eye movements in reading and information processing: 20 years of research. Psychoogica Review, 124 (3), 372-422. This paper is an account of the eye movement fied from the premier eye tracking researcher.
2. Paut, D.C., McCeand, J.L., Seidenberg, M.S., & Patterson, K. (1996). Understanding norma and impaired word reading: Computationa principes in quasi-reguar domains. Psychoogica Review, 103, 56–115.This is the most recent of the major neura network papers, and is avaiabe on David Paut’s website. "cnbc.cmu.edu/%7Epaut/" cnbc.cmu.edu/~paut/
3. Stanovich, K.E (1986). Matthew effects in reading: Some consequences of individua differences in the acquisition of iteracy. Reading Research Quartery, 21, 360-407.This is one of the most cited reading papers of a time. If you are interested in reading acquisition this is the pace to start.
4. Hoover, W.A. & Gough, P.B. (1990). The simpe view of reading. Reading & Writing, 2(2), 127-160.This paper demonstrates that word recognition and context are two separate skis that are both necessary for reading.
Кевин Ларсон (Kevin Larson) Advanced Reading Technoogy, Microsoft Corporation "microsoft.com/typography/ctfonts/wordrecognition.aspx" microsoft.com/typography/ctfonts/wordrecognition.aspx
Какой шрифт разборчивее: с засечками или без засечек?
Источник: "aexpooe.info/which-are-more-egibe-serif-or-sans-serif-typefaces" aexpooe.infoВ 1998 году, когда шрифт Times New Roman еще широко использовался в сети, мой тогдашний шеф требовала, чтобы мы оформляли наши веб-сайты шрифтом Aria, потому что она терпеть не могла шрифты с засечками. Казались ли ей шрифты без засечек более разборчивыми, или это было лишь делом вкуса?
В 2003 году я, в рамках разработки трудов на степень магистра произвел обзор свыше 50 практических исследований в области типографии и нашел вполне определенный ответ.
Введение
Несколько десятков лет в науч&heip;

Интеллектуальные развлечения. Интересные иллюзии, логические игры и загадки.

Log-in.ru© - мир необычных и интеллектуальных развлечений. Интересные оптические иллюзии, обманы зрения, логические флеш-игры.

Интересно