Представим, что в двух странах раздается опросник по определению уровня депрессии и что в него включены и соматические (например, потеря аппетита, сонливость), и психологические (например, уныние, отсутствие интереса к другим людям) симптомы. Далее, предположим, что проявление данных проблем на соматическом уровне встречается в одной из культур повсеместно, однако психологические симптомы в той же культуре не считаются проявлениями депрессии. Кросс-культурное сравнение средних показателей в соответствии с опросником имеет низкий уровень валидности. Из-за различий в проявлениях депрессии в данных культурах трудно ответить на вопрос о том, какая группа обнаружила больше симптомов депрессии; безусловно, этот вопрос не решается проведением теста T, Который определяет средние показатели двух культурных групп.
Два наиболее существенных для кросс-культурной методологии понятия, отклонения и эквивалентность (Poortinga, 1989), можно проиллюстрировать примером. Под отклонениями понимается наличие мешающих факторов, которые ставят под сомнение сравнимость оценок, полученных в разных культурных группах. Если полученные оценки подвергается влиянию отклонений, их психологическое значение зависит от группы, и различия между группами в итоговых оценках должны, по крайней мере, до некоторой степени объясняться дополнительными психологическими конструктами или измерительными артефактами.
Наличие отклонений делает сравнимость оценок, полученных в разных культурах, еще более проблематичной. Наличие отклонений, влияющих на сравнимость, при оценке различных параметров заставляет обратиться к понятию эквивалентности. Под эквивалентностью понимается сравнимость оценок, полученных при тестировании в различных культурных группах. Безусловно, отклонения и эквивалентность связаны между собой, Можно доказать, что эти понятия являются зеркальным отражением друг друга: отклонения являются синонимом неэквивалентности; и наоборот, эквивалентность предполагает отсутствие отклонений. Однако здесь мы не будем обращаться с ними таким образом, поскольку для представления методологии кросс-культурных исследований будет полезнее выявить источники отклонений и их влияние на сравнимость оценок.
Согласно ван де Вивьеру и ЛеЙнгу (van de Vijver & Leung, 1997a, 1997b), при кросс-культурном исследовании можно выделить три источника отклонений. Первая разновидность отклонений определена как отклонения, связанные с конструктом; они имеют место, когда оцениваемый конструкт не является идентичным в разных группах или когда поведение, определяющее сферу интересов, с котором связаны тестовые задания, в различных культурах не является тождественным, как было проиллюстрировано в примере, связанном с исследованием депрессии. Эмпирический пример можно найти в работе Хо (Но, 1996), касающейся сыновней благодарности (психологической характеристики, которая определяет хорошего сына или хорошую дочь). Западные представления на этот счет более ограничены чем китайские, в соответствии с которыми дети должны взять на себя уход и заботу о престарелых родителях, когда те будут нуждаться в помощи. Отклонения, связанные с конструктом, препятствуют кросс-культурной оценке конструкта при помощи одних и тех же показателей. Опросник, касающийся сыновней благодарности, опирающийся на китайские представления, будет включать в себя аспекты, которые не имеют отношения к испытуемым западного происхождения, в то время как опросник, базирующийся на западных представлениях, упустит аспекты, важные для китайцев. Эмбретсон (Embretson, 1983) предложил родственный термин неполное представление конструкта, обозначающий неполноту отбора всех релевантных областей при создании инструментария исследования. Между отклонениями, связанными с конструктом, и термином, предложенным Эмбретсоном, есть существенные различия; в то время как неполное представление конструкта представляет собой проблему слишком узко определенного инструментария для оценки широкого понятия, то есть проблему, которую можно преодолеть, добавляя тестовые задания, относящиеся к той же области генерализации, отклонения, связанные с конструктом, могут быть исправлены лишь добавлением тестовых заданий, относящихся к другим областям генерализации.
Важную разновидность отклонений представляют собой отклонения, связанные с методом, причиной которых может быть несравнимость выборок, особенности инструментария, влияние экспериментатора или интервьюера и метод применения тестов. В целом, отклонения, связанные с методом, — определение, под которое подпадают все источники отклонений, возникающих в связи с моментами, описанными в разделе, посвященном методике конкретного исследования. Примером может служить дифференцированный уровень знакомства со стимулами (при проверке умственных способностей) и различия в желательном в социальном плане (при исследовании личности и исследованиях общественного мнения). В примере с депрессией отклонения, связанные с методом, могли быть вызваны, среди прочего, возрастными особенностями, половой принадлежностью, степенью открытости испытуемых или социальной желательностью сообщения о проблемах душевного здоровья.
И, наконец, последняя разновидность отклонений встречается на уровне тестовых заданий; она определена как отклонения, связанные с тестовыми заданиями, или различная функциональная значимость тестовых заданий. В соответствии с определением, широко используемым в психологии, тестовое задание провоцирует отклонения, если люди с одинаковым отношением к лежащему в основе конструкту (например, с одинаковым уровнем умственных способностей и образования), но принадлежащие к разным культурным группам, показывают разный уровень средних оценок при выполнении данного тестового задания. Оценка по конструкту обычно выводится из полной оценки за выполнение тестового задания. Если ученикам из Польши и Японии дается тест по географии, который содержит вопрос: «Назовите столицу Польши», то естественно ожидать, что ученики из Польши получат более высокие оценки за ответ на этот вопрос, чем японцы, даже если сравнивать учеников, у которых оценки за выполнения теста в целом одинаковы. Данный вопрос задает отклонения, поскольку он является предпочтительным для одной культурной группы. Если в нашем примере с депрессией симптомы соматического характера являются общими для всех культурных групп, в то время как психологические проблемы воспринимаются как составная часть депрессии лишь в рамках одной из культур, анализ, выявляющий отклонения, связанные с тестовыми заданиями, определит вопросы, связанные с психологическими проблемами как вызывающие отклонения. Из всех типов отклонений отклонения, связанные с тестовыми заданиями, изучены наиболее широко; существуют различные психометрические приемы, которые дают возможность выявить такие отклонения (например, Camilli & Shepard, 1994; Holland & Wainer, 1993).
Здесь предлагаются четыре типа эквивалентности (сравни van de Vijver & Leung, 1997a, 1997b). Первый тип определен как неэквивалентность конструкта. Он означает сравнение «яблок и апельсинов» (например, сравнение китайской и западной сыновней благодарности, о котором говорилось выше). Поскольку общие
Признаки здесь отсутствуют, сравнение проводиться не может. Второй тип называется структурная (или функциональная) эквивалентность. Инструмент, который применяется в различных культурных группах, обладает структурной эквивалентностью, если в этих группах при помощи него оценивается один и тот же конструкт. Многие когнитивные тесты проверялись в отношении структурной эквивалентности (Jensen, 1980), например личностный опросник Айзенка (Barret, Petrides, Eysenck & Eysenck, 1998) и так называемая пятифакторная модель личности (МсСгае & Costa, 1997). Структурная эквивалентность не требует обязательного использования идентичных инструментов для исследования разных культур. Оценка депрессии может опираться на разные показатели в различных культурных группах и при этом обладать структурной эквивалентностью.
Третий тип эквивалентности называется эквивалентностью единиц измерения. Инструменты соответствуют требованиям данного типа эквивалентности, если их шкала измерений включает единицы измерения одних и тех же параметров, имеющие различное происхождение (например, шкала Кельвина и шкала Цельсия для измерения температуры). Такой тип эквивалентности предполагает оценку коэффициента соответствия (одними и теми же единицами измерения в каждой культуре). На первый взгляд, может показаться, что в использовании при определении уровня эквивалентности единиц измерения различного происхождения не только нет никакой необходимости, но это может еще и ухудшить положение. И все же, если мы применяем в разных группах шкалу с разными интервалами, оценки могут быть как вполне сравнимыми, так и абсолютно несравнимыми (в случае неэквивалентности).
Необходимость понятия эквивалентности единиц измерения может стать яснее при более подробном рассмотрении воздействия различного уровня желательности в социальном плане или знакомства со стимулами на различие в кросс-культурных оценках. Предположим, что тест Равена предложили грамотной и неграмотной группе. Вполне естественно предположить, что кросс-культурные различия, касающиеся знакомства со стимулами, повлияют на результаты. Грамотные испытуемые предположительно покажут более высокие результаты и лучшие показатели знакомства со стимулами. По крайней мере отчасти, наблюдаемые различия в результатах можно отнести на счет различной степени знакомства со стимулами, которая скроет действительные кросс-культурные различия. Когда нельзя определить, в какой степени оказал влияние каждый из двух источников, интерпретация сравнения групп по средним значениям результатов носит весьма сомнительный характер. Для того чтобы результаты были сравнимы, необходима поправка на разный уровень знакомства. Можно отметить, что базовая идея внесения поправок в полученные результаты, для того чтобы сделать их сравнимыми в полной мере, применятся также в ковариационном анализе, в котором сравнение оценок производится после того, как нарушающее воздействие сопутствующих факторов (отклонения в контексте данной главы) определено статистически.
Лишь в случае скалярной (или полной) эквивалентности можно проводить прямые сравнения; это единственный тип эквивалентности, который допускает статистические тесты, сравнивающие средние значения (такие, как t-тесты и дисперсионный анализ). Этот тип эквивалентности предполагает один и тот же интервал или шкалу отношений в разных группах и дает возможность без риска пренебречь воздействием отклонений. Определить, какой из двух последних типов эквивалентности имеет отношение к делу, достаточно трудно, и необходимость сделать однозначный вывод часто вызывает расхождение во мнениях. Например, расовые различия при определении результатов тестирования умственных способностей интерпретировались как имеющие место благодаря действительно существующим различиям (скалярная эквивалентность) и как отражающие измерительные артефакты (эквивалентность единиц измерения).
Структурная эквивалентность, эквивалентность единиц измерения и скалярная эквивалентность связаны иерархически. Третья предполагает в качестве предварительного условия вторую, необходимым условием которой является наличие первой. Вытекающее отсюда следствие состоит в том, что эквивалентность более высокого уровня труднее поддается выявлению. Проще доказать, что при помощи определенных средств в разных культурных группах оценивается один и тот же конструкт (структурная эквивалентность), чем доказать численную сравнимость в разных культурах (скалярная эквивалентность). С другой стороны, более высокие уровни эквивалентности допускают более точные сравнения оценок, полученных в разных культурах. В то время как в случае структурной эквивалентности могут сравниваться только факторные структуры или помологические схемы (Cronbach & Meehl, 1955), эквивалентность единиц измерения и полная скалярная эквивалентность позволяют осуществить анализ черт кросс-культурного сходства и различия на уровне мелких структурных единиц. И лишь в случае полной эквивалентности могут сравниваться средние значения показателей, полученные в разных культурах при помощи t-тестов и ковариационного (дисперсионного) анализа.