1. Эволюция представлений о механизмах зрительного внимания (обзор литературы)

1.1. Известные классификации механизмов и типов зрительного внимания

Необходимым условием нормального функционирования зрительного восприятия у человека являются движения глаз (Ярбус, 1965; Buswell, 1935; Stratton, 1906). При осмотре изображений и сцен человек выполняет от трех до четырех скачков взгляда, или саккад, в секунду. В основном, зрительное восприятие происходит в промежутках между саккадами (Ярбус, 1965; Барабанщиков, Белопольский, 2008; Underwood et al., 2008). Однако взгляд человека не остается полностью стабильным: даже во время фиксации совершаются микродвижения – тремор, дрейф, микросаккады, вергентные движения (Martinez-Conde, Macknik, 2008, 2015). В интервалах между двумя скачками взгляд смещается медленно, и зрительное восприятие происходит именно в это время, также называемое фиксацией взгляда. Во время фиксации человек четко видит не все зрительное поле, а только небольшой участок диаметром от 1,5–2 (область фовеа) до 6–8 (область макулы) угловых градусов (Ярбус, 1965; Шахнович, 1974; Velichkovsky et al., 2000). Выбор участка, который будет осматриваться в ближайшее время, происходит во время предыдущей фиксации взгляда и зависит от того, куда направлено внимание человека. Таким образом, наблюдая за характеристиками и положением точек фиксации и скачков можно изучать внешние проявления функционирования системы зрительного внимания человека.

Зрительное внимание – один из самых неуловимых психических процессов. Оно не имеет собственного продукта, но всегда сопровождает мышление, восприятие, запоминание и другие когнитивные процессы (Rayner, 1978). Существует множество определений и подходов к изучению внимания, которые объясняют некоторые закономерности его функционирования. Рассмотрим основные подходы к изучению механизмов, определяющих зрительное внимание.

1.1.1. Представление о нисходящих (top-down) и восходящих (bottom-up) механизмах зрительного внимания

Несмотря на большое количество исследований, посвященных осмотру сложных зрительных сцен и изображений, наиболее важные результаты, касающиеся механизмов работы зрительного внимания, были получены при использовании простых зрительных стимулов (Treisman, Gelade., 1980; Henderson, 2003; Awh et al., 2012).

Еще Вильям Джемс (1890) ввел различие двух форм внимания – «пассивного» и «активного». В то время, как в качестве методического подхода при изучения психической деятельности применялся интроспективный подход, основным критерием для различия этих форм внимания оказалось наличие цели или волевого решения. «Пассивное» внимание означало, что человек не выбирает, что осматривать, а его взгляд как бы «притягивается» объектами или свойствами поля зрения к той или иной области зрительного пространства. «Активное» внимание при этом направлялось к тем объектам, которые могли способствовать достижению осознаваемой конкретной цели, стоящей перед человеком. В дальнейшем, после исследований, проведенных Найссером, Ярбусом и многими другими учеными сформировался подход к пониманию зрительного восприятия как процесса, в норме всегда сопровождающегося активностью разной степени осознанности (Найссер, 1981).

Движения глаз, головы и тела происходят как при целенаправленном поиске зрительной информации, так и при случайном привлечении внимания человека к элементам зрительной сцены. Кроме того, при восприятии человек отчасти пытается «предвосхитить» события, и этот процесс происходит непрерывно, все время дополняется новой информацией, поступающей через сенсорные системы. Найссер называл такой процесс «перцептивным циклом», представляя его модель в виде взаимосвязанных элементов – «объект», модифицирует «схему», которая направляет «исследование», которое в свою очередь отвечает за выбор объекта (Найссер, 1981). При этом Найссер считал, что внимание является следствием специфической организации функционирования комплекса структур мозга, отвечающих за восприятие стимулов. Исходя из того, что нет никаких специфических систем, отвечающих за селекцию признаков, была предложена гипотеза, согласно которой трудности при выполнении двух или более видов деятельности могут быть преодолены путем упражнения.

Вывод был сделан в пользу того, что селективное внимание работает с помощью механизма преднастройки – например, при оценке кинетической информации строятся предположения о будущей позиции искомого объекта. Влияние преднастройки может ослабить стимуляция, вызывающая ориентировочные ответы: громкий звук, вспышка или движение в поле зрения, собственное имя, названное во время осмотра. Такие события прерывают поиск или восприятие информации, имеющей отношение к решаемой задаче, и оцениваются с высокой скоростью независимо от предыдущей задачи. Найссер предложил отказаться от понятия «предвнимания» поскольку оно создает ложное представление, будто внимание имеет отделенные друг от друга этапы, когда на самом деле это непрерывный процесс.

Преднастройку, которая объяснялась ранее через предвнимание, Найссер объясняет работой простых, врожденных механизмов, которые необходимы для запуска новых «перцептивных циклов». Согласно представлениям Найссера, эти процессы могут лежать за пределами основного потока деятельности, но при этом в разной степени контролируются и осознаются субъектом (Найссер, 1981). Предполагалась принципиальная возможность одновременного восприятия нерелевантного стимула с релевантным в том случае, если субъект достаточно практиковался.

В дальнейшем исследованию процессов, относящихся к селективному вниманию, было посвящено большое количество работ (Duncan, Humphreys, 1989; LaBerge, Brown, 1989; Wolfe et al., 1989). Авторы этих работ сходятся в том, что, когда человек ищет определенный объект в поле зрения, он использует знания о свойствах этого объекта для направления внимания; в этом случае контроль внимания имеет большой нисходящий компонент (top-down в англоязычных работах). В случае, если наблюдатель ищет необычный элемент в поле зрения, но не знает, чем именно он может выделяться, можно говорить о преобладающей роли восходящего (bottom-up) компонента. В работах, вышедших в 80–90 годах XX в., авторы уже не говорят об автономности восходящих и нисходящих компонентов внимания.

Treisman, Gelade (1980) предложили гипотезу, описывающую возможные механизмы функционирования нисходящей системы управления вниманием. Согласно этой гипотезе, зрительная система содержит всю информацию о свойствах поля зрения как функционально разграниченные карты. Например, существует карта, указывающая на расположение вертикальных перепадов яркости, карта смещения элементов вправо, карта, содержащая признаки зеленого цвета. LaBerge and Brown (1989) предположили, что если наблюдатель знает об уникальных свойствах искомого объекта, то он может использовать подходящую карту из этого набора для направления внимания. Таким образом, если целевой и отвлекающие стимулы достаточно различны, чтобы активировать разные наборы признаковых карт, то поиск таких целевых стимулов будет происходить одинаково быстро, вне зависимости от количества отвлекающих стимулов – в том случае, если испытуемый знает, каковы уникальные свойства целевого стимула.

В то же время другая группа исследователей, изучая восходящую систему управления вниманием, предложила гипотезу о важности локального торможения связей внутри карты признаков, которое определяет заметность цели и ее последующие отношения с фокусом внимания (Itti, Koch, 2000). Похожие идеи были предложены Treisman (1988) и Huang, Pashler (2005). Когда многие нецелевые стимулы имеют сходные признаки, активность, которую они генерируют в соответствующей признаковой карте, подавляется из-за взаимного торможения. Такое торможение не может проявиться в отношении активности, генерируемой уникальным свойством целевого объекта, поскольку он не является одним из сети элементов, взаимно тормозящих друг друга. Активность во всех позициях стимулов затем суммируется, и внимание направляется к местоположению с наибольшей активностью.

Альтернативный механизм, объясняющий работу восходящих процессов управления вниманием, был предложен Sagi et al. (1986). Согласно утверждению этих авторов, механизмы, которые сравнивают признаки соседних элементов, затем направляют внимание к положению изменения признаков. Поскольку оба механизма восходящего управления вниманием основаны на обработке локальных признаков, они оба работают наиболее хорошо, когда расстояние между всеми стимулами минимальное. В тех случае, когда внимание должно быть направлено на неизвестный целевой стимул, время поиска должно зависеть от расстояния между стимулами.

Результаты, полученные в рассмотренных выше работах, позволили сделать ряд предположений. В частности, в задачах, требующих фокального внимания, в том случае, если испытуемый не знает, какими уникальными свойствами будет обладать целевой стимул, то время поиска такого стимула будет сокращаться с увеличением количества отвлекающих стимулов; напротив, если уникальное свойство целевого объекта известно, то время поиска не должно зависеть от количества отвлекающих стимулов. В задачах, требующих пространственного, или распределенного внимания, количество отвлекающих стимулов не влияет на скорость поиска, независимо от того, известны ли свойства целевого стимула; кроме того, расстояние между элементами может влиять на время поиска.

При проверке этих предположений необходимо учитывать, что большинство данных, касающихся работы нисходящих и восходящих процессов управления вниманием, было получено в экспериментах с абстрактными и примитивными стимулами, которые мало походили на естественные сцены, воспринимаемые человеком в обычных условиях. Эти результаты показали наличие динамики взаимодействия восходящих и нисходящих процессов. В ряде работ было обнаружено, что эти системы функционируют одновременно (Egeth, Yantis, 1997; Itti, Koch, 2001; Corbetta et al., 2008), в то время как в других обнаружено различие во времени активации обоих механизмов, по меньшей мере в коротких временных периодах: сразу после появления новых стимулов восходящий контроль доминирует до той поры, пока нисходящий контроль постепенно не станет более активным (Stigchel et al., 2009; Hickey et al., 2010). Есть также данные о том, что сразу же после появления стимулов влияние нисходящего контроля становится доминирующим (Einhäuser et al., 2008).

Backer, Mertsching (2003) в своей концептуальной модели рассматривают возможный двухступенчатый выбор фокуса внимания. Авторы разделили процесс селекции признаков на следующие этапы: сначала с учетом всей доступной информации составляются признаковые карты, и на их основе выбирается небольшое количество отдельных объектов; затем собирается информация об этих объектах; на второй стадии из этих объектов выбирается один, к которому и направляется фокус внимания. На первой стадии используется уже описанный выше подход Treisman (1998) к теории интеграции признаков, а также направленный поиск, схожий с тем, который описан в работах Wolfe (2006).

Модель Backer, Mertsching (2003) исходит из идеи о своеобразности и равнозначности нисходящих и восходящих процессов в работе селективного внимания. Вместе с тем авторы отмечают, что в текущем состоянии модель имеет ряд ограничений при анализе динамических сцен. В частности, торможение возврата к ранее осмотренным объектам свойственно только статическим частям сцены, но не подвижным; кроме того, извлеченная информация не может быть связана с подвижными объектами. При обработке статических изображений модель решает задачу выделения основных объектов, однако для проверки предположения об устройстве селективного внимания необходимо сравнение результатов ее работы с результатами осмотра изображений человеком.

Пока остается непонятным, снижается ли влияние восходящих процессов управления вниманием со временем осмотра (Parkhurst et al., 2002), или же влияние нисходящих процессов возрастает и получает все большее влияние, тогда как активность первых существенно не изменяется (Tatler et al., 2005).

Анализ психофизиологических показателей динамики этих взаимодействий проводился в короткие временные отрезки от сотен миллисекунд до нескольких секунд. При проведении исследований на поведенческом уровне с осмотром натуралистичных изображений было показано, что регионы с наибольшим скоплением признаков, явно выделяющихся из окружения, фиксируются взглядом раньше, чем регионы с меньшей плотностью и заметностью таких признаков, если не давалось никакой специфической инструкции (Underwood, Foulsham, 2006; Underwood et al., 2006). Авторы интерпретировали этот результат как подтверждение раннего доминирования восходящей активности, когда взор «захватывается» низкоуровневыми признаками в местах их наибольшей плотности. Такой захват внимания происходил с большим постоянством у разных испытуемых, в том числе при повторных экспериментах. Разница между испытуемыми возрастала на более поздних этапах осмотра и относилась к тому моменту, когда вследствие получения данных об изображении более активными становились нисходящие процессы управления фокусом внимания (Velichkovsky et al., 2002; Henderson, 2003).

Tatler et al. (2011) обсуждают проблемы, связанные с интерпретацией этих данных. С одной стороны, в процессе осмотра сцен реальной среды обнаружена тенденция к помещению объектов, наделенных большим количеством признаков, в центр поля зрения или близко к нему. С другой стороны, центральные объекты чаще фиксируются на ранних этапах осмотра сцен. Такая тенденция к фиксации центра может отражать общую стратегию наблюдателей к осмотру центральной части поля зрения, безотносительно плотности признаков в этой области, и это может не иметь, следовательно, отношения к восходящим процессам контроля внимания (Tatler et al., 2005).

Загрузка...