Современные стандарты при проведении кросс-культурного исследования Отклонения и эквивалентность: определения и классификации

Представим, что в двух странах раздается опросник по определению уровня де­прессии и что в него включены и соматические (например, потеря аппетита, сон­ливость), и психологические (например, уныние, отсутствие интереса к другим людям) симптомы. Далее, предположим, что проявление данных проблем на сома­тическом уровне встречается в одной из культур повсеместно, однако психологиче­ские симптомы в той же культуре не считаются проявлениями депрессии. Кросс-культурное сравнение средних показателей в соответствии с опросником имеет низкий уровень валидности. Из-за различий в проявлениях депрессии в данных культурах трудно ответить на вопрос о том, какая группа обнаружила больше симптомов депрессии; безусловно, этот вопрос не решается проведением теста T, Кото­рый определяет средние показатели двух культурных групп.

Два наиболее существенных для кросс-культурной методологии понятия, от­клонения и эквивалентность (Poortinga, 1989), можно проиллюстрировать приме­ром. Под отклонениями понимается наличие мешающих факторов, которые ста­вят под сомнение сравнимость оценок, полученных в разных культурных группах. Если полученные оценки подвергается влиянию отклонений, их психологическое значение зависит от группы, и различия между группами в итоговых оценках дол­жны, по крайней мере, до некоторой степени объясняться дополнительными пси­хологическими конструктами или измерительными артефактами.

Наличие отклонений делает сравнимость оценок, полученных в разных куль­турах, еще более проблематичной. Наличие отклонений, влияющих на сравни­мость, при оценке различных параметров заставляет обратиться к понятию экви­валентности. Под эквивалентностью понимается сравнимость оценок, полученных при тестировании в различных культурных группах. Безусловно, отклонения и эквивалентность связаны между собой, Можно доказать, что эти понятия являют­ся зеркальным отражением друг друга: отклонения являются синонимом неэкви­валентности; и наоборот, эквивалентность предполагает отсутствие отклонений. Однако здесь мы не будем обращаться с ними таким образом, поскольку для пред­ставления методологии кросс-культурных исследований будет полезнее выявить источники отклонений и их влияние на сравнимость оценок.

Согласно ван де Вивьеру и ЛеЙнгу (van de Vijver & Leung, 1997a, 1997b), при кросс-культурном исследовании можно выделить три источника отклонений. Пер­вая разновидность отклонений определена как отклонения, связанные с конструк­том; они имеют место, когда оцениваемый конструкт не является идентичным в разных группах или когда поведение, определяющее сферу интересов, с котором связаны тестовые задания, в различных культурах не является тождественным, как было проиллюстрировано в примере, связанном с исследованием депрессии. Эм­пирический пример можно найти в работе Хо (Но, 1996), касающейся сыновней благодарности (психологической характеристики, которая определяет хорошего сына или хорошую дочь). Западные представления на этот счет более ограничены чем китайские, в соответствии с которыми дети должны взять на себя уход и забо­ту о престарелых родителях, когда те будут нуждаться в помощи. Отклонения, свя­занные с конструктом, препятствуют кросс-культурной оценке конструкта при помощи одних и тех же показателей. Опросник, касающийся сыновней благодар­ности, опирающийся на китайские представления, будет включать в себя аспекты, которые не имеют отношения к испытуемым западного происхождения, в то вре­мя как опросник, базирующийся на западных представлениях, упустит аспекты, важные для китайцев. Эмбретсон (Embretson, 1983) предложил родственный тер­мин неполное представление конструкта, обозначающий неполноту отбора всех релевантных областей при создании инструментария исследования. Между откло­нениями, связанными с конструктом, и термином, предложенным Эмбретсоном, есть существенные различия; в то время как неполное представление конструкта представляет собой проблему слишком узко определенного инструментария для оценки широкого понятия, то есть проблему, которую можно преодолеть, добавляя тестовые задания, относящиеся к той же области генерализации, отклонения, свя­занные с конструктом, могут быть исправлены лишь добавлением тестовых зада­ний, относящихся к другим областям генерализации.

Важную разновидность отклонений представляют собой отклонения, связан­ные с методом, причиной которых может быть несравнимость выборок, особенно­сти инструментария, влияние экспериментатора или интервьюера и метод приме­нения тестов. В целом, отклонения, связанные с методом, — определение, под ко­торое подпадают все источники отклонений, возникающих в связи с моментами, описанными в разделе, посвященном методике конкретного исследования. Приме­ром может служить дифференцированный уровень знакомства со стимулами (при проверке умственных способностей) и различия в желательном в социальном пла­не (при исследовании личности и исследованиях общественного мнения). В при­мере с депрессией отклонения, связанные с методом, могли быть вызваны, среди прочего, возрастными особенностями, половой принадлежностью, степенью от­крытости испытуемых или социальной желательностью сообщения о проблемах душевного здоровья.

И, наконец, последняя разновидность отклонений встречается на уровне тесто­вых заданий; она определена как отклонения, связанные с тестовыми заданиями, или различная функциональная значимость тестовых заданий. В соответствии с определением, широко используемым в психологии, тестовое задание провоцирует отклонения, если люди с одинаковым отношением к лежащему в основе конструк­ту (например, с одинаковым уровнем умственных способностей и образования), но принадлежащие к разным культурным группам, показывают разный уровень сред­них оценок при выполнении данного тестового задания. Оценка по конструкту обычно выводится из полной оценки за выполнение тестового задания. Если уче­никам из Польши и Японии дается тест по географии, который содержит вопрос: «Назовите столицу Польши», то естественно ожидать, что ученики из Польши получат более высокие оценки за ответ на этот вопрос, чем японцы, даже если срав­нивать учеников, у которых оценки за выполнения теста в целом одинаковы. Дан­ный вопрос задает отклонения, поскольку он является предпочтительным для од­ной культурной группы. Если в нашем примере с депрессией симптомы соматиче­ского характера являются общими для всех культурных групп, в то время как психологические проблемы воспринимаются как составная часть депрессии лишь в рамках одной из культур, анализ, выявляющий отклонения, связанные с тесто­выми заданиями, определит вопросы, связанные с психологическими проблемами как вызывающие отклонения. Из всех типов отклонений отклонения, связанные с тестовыми заданиями, изучены наиболее широко; существуют различные психо­метрические приемы, которые дают возможность выявить такие отклонения (на­пример, Camilli & Shepard, 1994; Holland & Wainer, 1993).

Здесь предлагаются четыре типа эквивалентности (сравни van de Vijver & Leung, 1997a, 1997b). Первый тип определен как неэквивалентность конструкта. Он означает сравнение «яблок и апельсинов» (например, сравнение китайской и западной сыновней благодарности, о котором говорилось выше). Поскольку общие

Признаки здесь отсутствуют, сравнение проводиться не может. Второй тип назы­вается структурная (или функциональная) эквивалентность. Инструмент, кото­рый применяется в различных культурных группах, обладает структурной экви­валентностью, если в этих группах при помощи него оценивается один и тот же конструкт. Многие когнитивные тесты проверялись в отношении структурной эк­вивалентности (Jensen, 1980), например личностный опросник Айзенка (Barret, Petrides, Eysenck & Eysenck, 1998) и так называемая пятифакторная модель личности (МсСгае & Costa, 1997). Структурная эквивалентность не требует обя­зательного использования идентичных инструментов для исследования разных культур. Оценка депрессии может опираться на разные показатели в различных культурных группах и при этом обладать структурной эквивалентностью.

Третий тип эквивалентности называется эквивалентностью единиц измерения. Инструменты соответствуют требованиям данного типа эквивалентности, если их шкала измерений включает единицы измерения одних и тех же параметров, имею­щие различное происхождение (например, шкала Кельвина и шкала Цельсия для измерения температуры). Такой тип эквивалентности предполагает оценку коэф­фициента соответствия (одними и теми же единицами измерения в каждой куль­туре). На первый взгляд, может показаться, что в использовании при определении уровня эквивалентности единиц измерения различного происхождения не только нет никакой необходимости, но это может еще и ухудшить положение. И все же, если мы применяем в разных группах шкалу с разными интервалами, оценки мо­гут быть как вполне сравнимыми, так и абсолютно несравнимыми (в случае неэк­вивалентности).

Необходимость понятия эквивалентности единиц измерения может стать яснее при более подробном рассмотрении воздействия различного уровня желательнос­ти в социальном плане или знакомства со стимулами на различие в кросс-культур­ных оценках. Предположим, что тест Равена предложили грамотной и неграмотной группе. Вполне естественно предположить, что кросс-культурные различия, касаю­щиеся знакомства со стимулами, повлияют на результаты. Грамотные испытуемые предположительно покажут более высокие результаты и лучшие показатели зна­комства со стимулами. По крайней мере отчасти, наблюдаемые различия в резуль­татах можно отнести на счет различной степени знакомства со стимулами, кото­рая скроет действительные кросс-культурные различия. Когда нельзя определить, в какой степени оказал влияние каждый из двух источников, интерпретация срав­нения групп по средним значениям результатов носит весьма сомнительный харак­тер. Для того чтобы результаты были сравнимы, необходима поправка на разный уровень знакомства. Можно отметить, что базовая идея внесения поправок в по­лученные результаты, для того чтобы сделать их сравнимыми в полной мере, при­менятся также в ковариационном анализе, в котором сравнение оценок произво­дится после того, как нарушающее воздействие сопутствующих факторов (откло­нения в контексте данной главы) определено статистически.

Лишь в случае скалярной (или полной) эквивалентности можно проводить прямые сравнения; это единственный тип эквивалентности, который допускает статистические тесты, сравнивающие средние значения (такие, как t-тесты и дисперсионный анализ). Этот тип эквивалентности предполагает один и тот же интер­вал или шкалу отношений в разных группах и дает возможность без риска прене­бречь воздействием отклонений. Определить, какой из двух последних типов экви­валентности имеет отношение к делу, достаточно трудно, и необходимость сделать однозначный вывод часто вызывает расхождение во мнениях. Например, расовые различия при определении результатов тестирования умственных способностей интерпретировались как имеющие место благодаря действительно существующим различиям (скалярная эквивалентность) и как отражающие измерительные арте­факты (эквивалентность единиц измерения).

Структурная эквивалентность, эквивалентность единиц измерения и скалярная эквивалентность связаны иерархически. Третья предполагает в качестве предва­рительного условия вторую, необходимым условием которой является наличие первой. Вытекающее отсюда следствие состоит в том, что эквивалентность более высокого уровня труднее поддается выявлению. Проще доказать, что при помощи определенных средств в разных культурных группах оценивается один и тот же конструкт (структурная эквивалентность), чем доказать численную сравнимость в разных культурах (скалярная эквивалентность). С другой стороны, более высо­кие уровни эквивалентности допускают более точные сравнения оценок, получен­ных в разных культурах. В то время как в случае структурной эквивалентности могут сравниваться только факторные структуры или помологические схемы (Cronbach & Meehl, 1955), эквивалентность единиц измерения и полная скаляр­ная эквивалентность позволяют осуществить анализ черт кросс-культурного сход­ства и различия на уровне мелких структурных единиц. И лишь в случае полной эквивалентности могут сравниваться средние значения показателей, полученные в разных культурах при помощи t-тестов и ковариационного (дисперсионного) анализа.

Updated: 11.06.2013 — 23:55