Контент-анализ является основным методом социологии и политологии. Эти отрасли знания оказывают влияние на психологию, из них она часто заимствует (что не всегда заметно) установки и приоритеты. В рамках психологии контент-анализ имеет свою историю и традиции. Основной задачей данной книги является рассмотрение контент-анализа именно в контексте психологического исследования. Необходимо раскрыть, при каких условиях данный метод в наибольшей мере учитывает специфику психологического исследования, обеспечивает максимальную надежность и валидность результатов, а не служит каким-либо иным, посторонним для психологии задачам.
Читатель, знакомый с контент-анализом по другим областям знания, вполне вероятно, может быть удивлен расстановкой некоторых акцентов и приоритетов. В свою очередь, психолога, полагающего, что шкалы контент-анализа суть просто аналог шкал опросникового теста и обращаться с ними следует примерно таким же образом, ждет немало нового, начиная с организации исследования и заканчивая методами статистической обработки результатов.
Прежде всего, следует определить, что называется контент-анализом, какого типа исследования относятся к нему.
Контент-анализ – это анализ текста, основанный на выделении категорий содержания и последующем подсчете представленности данных категорий в тексте.
В силу сказанного далеко не всякое изучение текста есть контент-анализ. Если категории эксплицитно не выделяются, если не формулируются кодировочные инструкции, т. е. принципы, согласно которым какие-либо фрагменты текста могут быть отнесены к тем или иным категориям содержания, то нет и контент-анализа. Это относится как к традиционным герменевтическим исследованиям в области философии, так и к получающим все большее распространение компьютерным программам, претендующим на выделение смысла текста. Такие программы генетически восходят к задачам автоматического реферирования, основной принцип которого сводится к выделению наиболее частотных слов, а затем отбору тех предложений реферируемого текста, в которых эти наиболее частотные слова встречаются совместно. В первых нет количественного подсчета, а во-вторых нет заранее выделенных категорий.
Таким образом, два условия являются критичными для отнесения какого-либо исследования к контент-анализу: 1) выделение наперед заданных категорий содержания с кодировочными инструкциями и 2) количественный анализ единиц содержания, относящихся к данным категориям.
Количественный анализ обеспечивает возможность проверки статистических гипотез, что является необходимым условием научности в современной психологии.
Разумеется, сама по себе возможность статистической проверки гипотез не обеспечивает валидности исследования. Если категории выделены случайно, неадекватны специфике материала, то различий между группами или не окажется вовсе, или они не дадут новой полезной информации об объекте.
Каким же образом выделяются контент-аналитические категории, откуда они вообще берутся, можно ли пользоваться ими так же, как в психологии пользуются опросниковыми тестами?
В отличие от опросников специфика контент-анализа состоит в использовании свободной речи, «наиболее универсальной формы человеческого творчества» (К. Ясперс).
Содержание речи чрезвычайно изменчиво и детерминировано множеством внешних и внутренних факторов, по существу, ее разнообразие отражает разнообразие жизни человека и соответствует ему. В отличие от опросникового теста, в котором человеку предлагаются более или менее соответствующие его представлениям о себе утверждения, из которых следует выбрать наиболее соответствующие, в свободной речи человек сам подбирает слова, которые должны обеспечить наибольшее соответствие тому, что он переживает. Свободная речь более валидна для анализа, чем ответы на тест, но в меньшей степени связана с теоретическими представлениями психологов.
Принимая во внимание отмеченную выше чрезвычайную изменчивость речи, первым, главнейшим и необходимым условием является единообразие инструкции, с которой получен речевой материал. Бессмысленно сравнивать личные дневники и тексты должностных поручений. Инструкции могут быть даны имплицитно, через определенные жанровые стандарты и ожидания, характерные, например, для письма другу, записки, оставленной перед суицидом и т. п. Однако в любом случае важно, чтобы сопоставлялся однородный материал, полученный по одной и той же инструкции.
Следующим важным условием является наличие независимой переменной, влияющей на речевую продукцию. Уровни независимой переменной могут соответствовать различным состояниям одних и тех же субъектов (например, пищевая депривация в опытах Аткинсона и Макклелланда, 1948) или различным группам субъектов, между которыми производится сравнение (например, слепые и зрячие в нашем исследовании с А. Б. Дородневым, 2009).
Если независимая переменная имеется, то содержание речи выступает зависимой переменной, и тогда задачей исследования является нахождение различий в речевой продукции, соответствующей уровням независимой переменной.
Определенную помощь при выделении категорий может оказать частотный анализ слов, однако слишком на него уповать не стоит. Значимые слова в любом случае окажутся не самыми частотными (к последним в любом тексте относятся предлоги), да и категории, служащие для фиксации различий в речевой продукции, как правило, много крупнее отдельных слов.
На выделение категорий неизбежно влияют задачи исследования, мы определяем в текстах не только то, чем они отличаются друг от друга, но и то, что нам требуется найти, т. е. в большей или меньшей степени этот этап работы зависит от общей постановки исследовательской задачи, от сложившейся практики, в которую включено данное исследование, от распространенных в данной области психологии объяснительных схем и т. п. Например, если задачей является изучение влияния травмы на личность человека, то и в рассказах, прежде всего, выделяется повествования о травмах. Если ТАТ формировался в общем и целом в рамках психоаналитического подхода[1], направленного на поиск конфликтов в прошлом, то и для провоцирования рассказов использовались картинки, способствующие обращению к прошлому, а не к настоящему и будущему.
Таким образом, полноформатное психологическое исследование с применением контент-анализа предполагает выделение в речи таких категорий содержания, наличие которых позволяет различать группы субъектов, подлежащих сравнению, например, слепые и зрячие, мужчины и женщины, подводники, разное время находящиеся в состоянии пищевой депривации и т. п. Затем гипотеза о различиях между данными субъектами проверяется с помощью подсчета встречаемости данных категорий в соответствующих текстах (методы подсчета могут быть различны, см. ниже).
Получается, что при таком подходе категории всякий раз должны выделяться заново, а использование категорий, выделенных ранее в других исследованиях, весьма проблематично. Действительно, откуда мы знаем, что речевая активность каких-либо двух групп измеряется именно по тем же самым параметрам, что и речевая активность каких-то других групп? В начале исследования следует взять относительно небольшую, но все же репрезентативную выборку порядка 40–50 текстов и попытаться выделить основные темы в виде контент-категорий и кодировочных инструкций. Затем на их основе разметить базовый корпус текстов экспериментальной и контрольной групп и тем или иным способом осуществить проверку статистической гипотезы в отношении каждой из категорий.
Если категории выделялись не в результате предварительного анализа текста, а по каким-то иным соображениям, существует риск искать, по пословице, не там, где потеряли, а там, где светлее.
Такой подход, отчасти напоминает рефакторизацию опросникового теста на новой выборке и оперирование в дальнейшем новыми шкалами как более адекватными для этой выборки, чем исходные.
Вместе с тем совершенно нереально разрабатывать новый тест для каждого нового человека. Поэтому для анализа отдельных случаев, т. е. почти всего, что обобщенно называется «психологической практикой», на основе проведенных исследований вырабатывается некоторое количество контент-аналитических категорий, которые помогают соотносить тексты в некой единой системе координат.
Первой, быть может, несколько умозрительной, но и наиболее значительной попыткой создать такую единую систему координат был проект «персонологии», реализованный группой под руководством Г. Мюррея в Гарварде в середине 1930-х годов. Его и следует рассмотреть в первую очередь, поскольку другие попытки такого рода находятся в более или менее выраженной генетической связи с ним.
Рассмотрение различных контент-аналитических систем вовсе не означает, что именно этими категориями и следует пользоваться. Скорее, наоборот, опыт прошлых разработок должен вдохновлять авторов на создание новых систем, наиболее адекватных той реальности, с которой они имеют дело.