Экзамен по математические основы психологии.
Понятие измерения в психологии.
Главное отличие отраслей психологического знания использующих математические методы – их предмет может быть не только описан, но и измерен. Возможность измерения открывает доступ для применения количественного анализа.
Измерение – это приписывание чисел объектам или их свойствам по определенным правилам. Правила устанавливают соответствия между некоторыми свойствами рассматриваемых объектов и рядом чисел.
Любой вид измерения предполагает наличие единиц измерения.
Психологические переменные не имеют собственных измерительных единиц.
Значение психологического признака определяется при помощи специальных измерительных шкал. Выделяют четыре типа измерительных шкал. В психологии большинство измерений относится к номинальному, порядковому и интервальному уровням. В реальной ситуации трудом можно найти шкалы, удовлетворяющие условиям интервальной шкалы. Психологические и педагогические измерения, а особенно клинические не поддаются какой-либо простой классификации, вроде порядковой или интервальной. Измерение — это приписывание числовых форм объектам или событиям в соответствии с определенными правилами. С.Стивенсом
предложена классификация из 4 типов шкал измерения:
Измерение – это приписывание чисел объектам или их свойствам по определенным правилам. Правила устанавливают соответствия между некоторыми… Любой вид измерения предполагает наличие единиц измерения. Психологические переменные не имеют собственных измерительных единиц.
Измерительные шкалы. Характеристика номинальной шкалы.
Состоит в присваивании какому-либо свойству или признаку определенного обозначения или символа. При измерении в этой шкале осуществляется классификация или распределение на непересекающиеся классы. Символы не несут никакой информации, операции с ними не имеют смысла.
Примеры Типы темперамента; типы акцентуаций характера; варианты ответов испытуемых.
Дихотомические (двоичные): «Да» и «нет»; «За» и «Против»; «Интроверт» и «Экстраверт»; «Полная семья» и «Неполная семья».
Номинативная шкала— это шкала, классифицирующая по названию: потеп (лат.) — имя, название. Название же не измеряется количественно, оно лишь позволяет отличить один объект от другого или одного субъекта от другого. Номинативная шкала — это способ классификации объектов или субъектов, распределения их по ячейкам классификации.
Психология как наука. Роль психологических знаний в деятельности ...
... отметить, что в классификациях XIX века - в системе О. Конта - для психологии нет места. Рассмотрим классификацию наук по Б. Кедрову. В его классификации психология занимает определенное место. ... представляла собой конкретную схему всех научных знаний той эпохи. Его классификация совпадает со структурой собственно психологии, то есть структурой познавательных способностей человека. Диалектика - ум, ...
Простейший случай номинативной шкалы — дихотомическая шкала, состоящая всего
лишь из двух ячеек, например: «имеет братьев и сестер — единственный ребенок в семье»;
«иностранец — соотечественник»; «проголосовал «за» — проголосовал «против»» и т.п.
Признак, который измеряется по дихотомической шкале наименований, называется
альтернативным. Он может принимать всего два значения. При этом исследователь
зачастую заинтересован в одном из них, и тогда он говорит, что признак “проявился”,
если тот принял интересующее его значение, и что признак “не проявился” , если он при-
нял противоположное значение. Например: «Признак леворукости проявился у 8
испытуемых из 20″. В принципе номинативная шкала может состоять из ячеек «признак
проявился — признак не проявился.
Более сложный вариант номинативной шкалы — классификация из трех и более
ячеек, например: «экстрапунитивные — интрапунитивные -импунитивные реакции» или
«выбор кандидатуры А — кандидатуры Б -кандидатуры В — кандидатуры Г» или «старший —
средний — младший -единственный ребенок в семье» и др.
Расклассифицировав все объекты, реакции или всех испытуемых по ячейкам
классификации, мы получаем возможность от наименований перейти к числам, подсчитав
количество наблюдений в каждой из ячеек.
Как уже указывалось, наблюдение — это одна зарегистрированная реакция, один
совершенный выбор, одно осуществленное действие или результат одного испытуемого.
Допустим, мы определим, что кандидатуру А выбрали 7 испытуемых, кандидатуру Б
— 11, кандидатуру В — 28, а кандидатуру Г -всего 1. Теперь мы можем оперировать этими
числами, представляющими собой частоты встречаемости разных наименований, то есть
частоты принятия признаком «выбор» каждого из 4 возможных значений. Далее мы можем
сопоставить полученное распределение частот с равномерным или каким-то иным
распределением.
Таким образом, номинативная шкала позволяет нам подсчитывать частоты
встречаемости разных «наименований», или значений признака, и затем работать с этими частотами с помощью математических методов.
Единица измерения, которой мы при этом оперируем — количество наблюдений
(испытуемых, реакций, выборов и т. п.), или частота. Точнее, единица измерения — это
одно наблюдение. Такие данные могут быть обработаны с помощью метода χ2,
биномиального критерия m и углового преобразования Фишера φ*.
Примеры Типы темперамента; типы акцентуаций характера; варианты ответов испытуемых. Дихотомические (двоичные): «Да» и «нет»; «За» и «Против»; «Интроверт» и… Номинативная шкала- это шкала, классифицирующая по названию: потеп (лат.) — имя, название. Название же не измеряется…
Измерительные шкалы. Характеристика порядковой шкалы.
Классифицирует совокупность измеренных признаков по принципу «больше-меньше», «выше-ниже», «сильнее-слабее».
Специфика социально–психологического климата подросткового класса сельской школы
... классном коллективе. Первостепенное значение будет иметь решение следующих задач: подростковый класс коллектив микроклимат 1. Изучить характеристики взаимоотношений в коллективе как ... исследование, тестирование (анкетирование), эксперимент. §1. Общая характеристика подросткового класса п1. Характеристика подросткового класса Подростковый возраст настолько своеобразен и интересен (с точки зрения ...
Примеры
Школьные оценки от 1 до 5; закодированные уровни от низкого до высокого; ранжируемые иерархии предпочтений или ценностей.
Порядковая шкала— это шкала, классифицирующая по принципу «больше — меньше». Если в шкале наименований было безразлично, в каком порядке мы расположим классификационные ячейки, то в порядковой шкале они образуют последовательность от ячейки «самое малое значение» к ячейке «самое большое значение» (или наоборот).
Ячейки теперь уместнее называть классами, поскольку по отношению к классам
употребимы определения «низкий», «средний» и «высокий» класс, или 1-й, 2-й, 3-й класс, и
т.д.В порядковой шкале должно быть не менее трех классов, например «положительная
реакция — нейтральная реакция — отрицательная реакция» или «подходит для занятия
вакантной должности — подходит с оговорками — не подходит» и т. п.
В порядковой шкале мы не знаем истинного расстояния между классами, а знаем
лишь, что они образуют последовательность. Например, классы «подходит для занятия
вакантной должности» и «подходит с оговорками» могут быть реально ближе друг к другу,
чем класс «подходит с оговорками» к классу «не подходит».
От классов легко перейти к числам, если мы условимся считать, что низший класс
получает ранг 1, средний класс — ранг 2, а высший класс — ранг 3, или наоборот. Чем
больше классов в шкале, тем больше у нас возможностей для математической обработки
полученных данных и проверки статистических гипотез.
Например, мы можем оценить различия между двумя выборками испытуемых по
преобладанию у них более высоких или более низких рангов или подсчитать коэффициент
ранговой корреляции между двумя переменными, измеренными в порядковой шкале,
допустим, между оценками профессиональной компетентности руководителя, данными
ему разными экспертами.
Все психологические методы, использующие ранжирование, построены на
применении шкалы порядка. Если испытуемому предлагается упорядочить 18 ценностей
по степени их значимости для него, проранжировать список личностных качеств
социального работника или 10 претендентов на эту должность по степени их
профессиональной пригодности, то во всех этих случаях испытуемый совершает так
называемое принудительное ранжирование, при котором количество рангов соответствует
количеству ранжируемых субъектов или объектов (ценностей, качеств и т.п.).
Независимо от того, приписываем ли мы каждому качеству или испытуемому один
из 3-4 рангов или совершаем процедуру принудительного ранжирования, мы получаем в
обоих случаях ряды значений, измеренные по порядковой шкале. Правда, если у нас всего
3 возможных класса и, следовательно, 3 ранга, и при этом, скажем, 20 ранжируемых
испытуемых, то некоторые из них неизбежно получат одинаковые ранги. Все
многообразие жизни не может уместиться в 3 градации, поэтому в один и тот же класс
Развитие математических способностей младших школьников в классах коррекции
... В настоящее время в системе общеобразовательных школ организуются классы компенсирующего обучения (классы коррекции). В эти классы принимаются или переводятся дети группы риска, не имеющие ... заключения, списка литературы. Глава I . Особенности развития младших школьников коррекционных классов. 1.Физиологические, психические и психолого-педагогические особенности развития младших школьников. Научной ...
могут попасть люди, достаточно серьезно различающиеся между собой. С другой
стороны, принудительное ранжирование, то есть образование последовательности из
многих испытуемых, может искусственно преувеличивать различия между людьми.
Кроме того, данные, полученные в разных группах, могут оказаться несопоставимыми,
так как группы могут изначально различаться по уровню развития исследуемого качества,
и испытуемый, получивший в одной группе высший ранг, в другой получил бы всего
лишь средний, и т.п.
Выход из положения может быть найден, если задавать достаточно дробную
классификационную систему, скажем, из 10 классов, или градаций, признака. В сущности,
подавляющее большинство психологических методик, использующих экспертную оценку,
построено на измерении одним и тем же «аршином» из 10, 20 или даже 100 градаций
разных испытуемых в разных выборках.
Итак, единица измерения в шкале порядка — расстояние в 1 класс или в 1 ранг, при
этом расстояние между классами и рангами может быть разным (оно нам неизвестно).
К
данным, полученным по порядковой шкале, применимы все описанные в данной книге
критерии и методы.
Примеры Школьные оценки от 1 до 5; закодированные уровни от низкого до высокого;…
Измерительные шкалы. Характеристика интервальной шкалы.
Каждое из возможных значений измеренных величин отстоит от ближайшего на равном расстоянии. Нуль условен. Для измерения с помощью шкалы интервалов устанавливаются
специальные единицы измерения – стены. При работе с этой шкалой измеряемому свойству или предмету присваивается число равное количеству единиц измерения, эквивалентное количеству измеряемого свойства.
Примеры
Семантический дифференциал Ч.Осгуда; IQ Векслера; T-шкала; 16-ти факторный опросник
Кеттела и другие тестовые шкалы, которые специально вводятся при обосновании их
равноинтервальности.·
Интервальная шкала— это шкала, классифицирующая по принципу «больше на
определенное количество единиц — меньше на определенное количество единиц». Каждое
из возможных значений признака отстоит от другого на равном расстоянии.
Можно предположить, что если мы измеряем время решения задачи в секундах, то
это уже явно шкала интервалов. Однако на самом деле это не так, поскольку
психологически различие в 20 секунд между испытуемым А и Б может быть отнюдь не
равно различию в 20 секунд между испытуемыми Б и Г, если испытуемый А решил задачу
за 2 секунды, Б — за 22, В — за 222, а Г — за 242.
Аналогичным образом, каждая секунда после истечения полутора минут в опыте с
измерением мышечного волевого усилия на динамометре с подвижной стрелкой, по
«цене», может быть, равна 10 или даже более секундам в первые полминуты опыта. «Одна
секунда за год идет» — так сформулировал это однажды один испытуемый.
Попытки измерять психологические явления в физических единицах — волю в
секундах, способности в сантиметрах, а ощущение собственной недостаточности — в
ИЗМЕРЕНИЯ. ШКАЛЫ ИЗМЕРЕНИЯ
... Замеряли невербальный интеллект. WISC. ФИЗИКИ ПСИХОЛОГИ Сначала формулируется гипотеза. Расчетная таблица: Индивидуальные значения – физики Ранг Индивидуальные значения – психологи Ранг ... 8,4 P=0,0085 Анализ различий и сдвигов на уровне номинальной шкалы. Fi-Fish Ограничения: n1,n2>=5; max отсутствует. Рассмотрим на примере анализа различий N1=25 ...
миллиметрах и т. п., конечно, понятны, ведь все-таки это измерения в единицах
«объективно» существующего времени и пространства. Однако ни один опытный
исследователь при этом не обольщает себя мыслью, что он совершает измерения по
психологической интервальной шкале. Эти измерения принадлежат по-прежнему к шкале
порядка, нравится нам это или нет.
Мы можем с определенной долей уверенности утверждать лишь, что испытуемый А
решил задачу быстрее Б, Б быстрее В, а В быстрее Г.
Аналогичным образом, значения, полученные испытуемыми в баллах по любой
нестандартизованной методике, оказываются измеренными лишь по шкале порядка. На
самом деле равноинтервальными можно считать лишь шкалы в единицах стандартного
отклонения и про-центильные шкалы, и то лишь при условии, что распределение значений
в стандартизующей выборке было нормальным.
Принцип построения большинства интервальных шкал построен на известном
правиле «трех сигм»: примерно 97,7-97,8% всех значений признака при нормальном его
распределении укладываются в диапазоне М±3σ2 Можно построить шкалу в единицах
долей стандартного отклонения, которая будет охватывать весь возможный диапазон
изменения признака, если крайний слева и крайний справа интервалы оставить
открытыми.
Р.Б. Кеттелл предложил, например, шкалу стенов — «стандартной десятки». Среднее
арифметическое значение в «сырых» баллах принимается за точку отсчета. Вправо и влево
отмеряются интервалы, равные 1/2 стандартного отклонения. На Рис. 1.2 представлена
схема вычисления стандартных оценок и перевода «сырых» баллов в стены по шкале N 16-
факторного личностного опросника Р. Б. Кеттелла.__ Построение шкал равных интервалов по данным, полученным по шкале порядка, напоминает трюк с веревочной лестницей, на который ссылался С. Стивене. Мы сначала поднимаемся по лестнице, которая ни на чем не закреплена, и добираемся до лестницы, которая закреплена. Однако каким путем мы оказались на ней? Измерили некую психологическую переменную по шкале порядка, подсчитали средние и стандартные отклонения, а затем получили, наконец, интервальную шкалу. «Такому нелегальному использованию статистики может быть дано известное прагматическое оправдание; во многих случаях оно приводит к плодотворным результатам».
Многие исследователи не проверяют степень совпадения полученного ими
эмпирического распределения с нормальным распределением, и тем более не переводят
получаемые значения в единицы долей стандартного отклонения или процентили,
предпочитая пользоваться «сырыми» данными. «Сырые» же данные часто дают
скошенное, срезанное по краям или двухвершинное распределение. На Рис. 1.3
представлено распределение показателя мышечного волевого усилия на выборке из 102
испытуемых. Распределение с удовлетворительной точностью можно считать
нормальным (χ2=12,7, при v=9, M=89,75, σ= 25,1).
С такими «ненормальными» распределениями приходится встречаться очень часто,
чаще, может быть, чем с классическими нормальными. И дело здесь не в каком-то изъяне,
а в самой специфике психологических признаков. По некоторым методикам от 10 до 20%
Таблица ППП
... Активность Направленность 2.Непроизвольное Отвлечение Колебание Рассеянность- это свойство внимания. - Тест "Черно-красная таблица Горбова-Шульте - Таблицы Шульте 1.Ощущение – простейший психический процесс, отражение в сознании человека ...
испытуемых получают оценку «ноль» — например, в их рассказах не встречается ни одной
словесной формулировки, которая отражала бы мотив «надежда на успех» или «боязнь
неудачи» (методика Хекхаузена).
То, что испытуемый получил оценку «ноль», нормально,
но распределение таких оценок не может быть нормальным, как бы мы ни увеличивали
объем выборки (см. п. 5.3).
Методы статистической обработки, предлагаемые в настоящем руководстве, в
большинстве своем не требуют проверки совпадения полученного эмпирического
распределения с нормальным. Они построены на подсчете частот и ранжировании.
Проверка необходима только в случае применения дисперсионного анализа. Именно
поэтому соответствующая глава сопровождается описанием процедуры подсчета необхо-
димых критериев.
Во всех остальных случаях нет необходимости проверять степень совпадения
полученного эмпирического распределения с нормальным, и тем более стремиться
преобразовать порядковую шкалу в равноинтервальную. В каких бы единицах ни были
измерены переменные — в секундах, миллиметрах, градусах, количестве выборов и т. п. —
все эти данные могут быть обработаны с помощь непараметрических критериев4,
составляющих основу данного руководства.__
специальные единицы измерения – стены. При работе с этой шкалой измеряемому свойству или предмету присваивается число равное количеству единиц… Примеры Семантический дифференциал Ч.Осгуда; IQ Векслера; T-шкала; 16-ти факторный опросник
Измерительные шкалы. Шкалы отношений.
Обладает всеми свойствами интервальной шкалы и имеет твердо фиксированный нуль, который означает полное отсутствие свойства. Используется в химии, физике, психофизике, психофизиологии.
Примеры
Рост; вес; число реакций; показатель силы; выносливости.
Шкала равных отношений— это шкала, классифицирующая объекты или субъектов
пропорционально степени выраженности измеряемого свойства. В шкалах отношений
классы обозначаются числами, которые пропорциональны друг другу: 2 так относится к 4,
как 4 к 8. Это предполагает наличие абсолютной нулевой точки отсчета. В физике
абсолютная нулевая точка отсчета встречается при измерении длин отрезков или
физических объектов и при измерении температуры по шкале Кельвина с абсолютным
нулем температур. Считается, что в психологии примерами шкал равных отношений
являются шкалы порогов абсолютной чувствительности. Возможности человеческой психики столь велики, что трудно
представить себе абсолютный нуль в какой-либо измеряемой психологической
переменной. Абсолютная глупость и абсолютная честность — понятия скорее житейской
психологии.
То же относится и к установлению равных отношений: только метафора обыденной
речи допускает, чтобы Иванов был в 2 раза (3, 100, 1000) умнее Петрова или наоборот.
Абсолютный нуль, правда, может иметь место при подсчете количества объектов
или субъектов. Например, при выборе одной из 3 альтернатив испытуемые не выбрали
альтернативу А ни одного раза, альтернативу Б — 14 раз и альтернативу В — 28 раз. В этом
случае мы можем утверждать, что альтернативу В выбирают в два раза чаще, чем
альтернативу Б. Однако при этом измерено не психологическое свойство человека, а
соотношение выборов у 42 человек.
Таблица по теориям личности
+Келли открыл и описал главные механизмы функционирования личностных конструктов, а также сформулировал основополагающий постулат и 11 следствий. Постулат утверждает, что личностные процессы психологически канализированы таким образом, чтобы обеспечить человеку максимальное предсказание событий. Все остальные следствия уточняют этот основной постулат. +Главное понятие в этом направлении – ...
По отношению к показателям частот возможно применять все арифметические
операции: сложение, вычитание, деление и умножение. Единица измерения в этой шкале
отношений — 1 наблюдение, 1 выбор, 1 реакция и т. п. Мы вернулись к тому, с чего начали:
к универсальной шкале измерения в частотах встречаемости того или иного значения
признака и к единице измерения, которая представляет собой 1 наблюдение.
Расклассифицировав испытуемых по ячейкам номинативной шкалы, мы можем применить
потом высшую шкалу измерения — шкалу отношений между частотами.__
Примеры Рост; вес; число реакций; показатель силы; выносливости.
Переменные и их измерения.
Квантили и процентили.
Квантиль – это такое значение признака q, которое делит диапазон его изменения на две части так, чтобы отношение числа элементов выборки, имеющих значение признака, меньшее q, к числу элементов, имеющих значение признака, большее q, было равно заранее заданной величине. Среди всех возможных квантилей обычно выделяют определенные семейства. Квантили одного семейства делят диапазон изменения признака на заданное число равнонаполненных частей. Семейство определяется тем, сколько частей получается. Наиболее популярными квантилями являютсяквартили, разбивающие диапазон изменения признака на 4 равнонаполненные части; децили — на 10 равнонаполненных частей; процентили – на 100 частей. Символически эти определения можно изобразить следующим образом.
Величина процента, указанная под интервалом означает долю объектов выборки, попавших в этот интервал.
Разного рода квантилями социолог пользуется очень часто. Нередко они упоминаются в средствах массовой информации (однако при этом сами термины «квантиль», «квартиль» и т.д. при этом не используются).
Так, в газетах пишут о том, что, например, 10% наиболее богатых «россиян» имеют месячный доход свыше 100 тысяч рублей, а 10% наиболее бедных – ниже 300 рублей. Ясно, что 100 тысяч рублей – это девятый дециль D9, а 300 рублей – это первый дециль D1.
Величина процента, указанная под интервалом означает долю объектов выборки, попавших в этот интервал. Разного рода квантилями социолог пользуется очень часто. Нередко они…
Таблицы и графики. Преимущества и недостатки.
Преимущества таблиц
Таблицы довольно долго властвовали в области верстки, поскольку предлагали достаточно простые методы для размещения разных элементов на веб-странице при отсутствии явных конкурентов. Благодаря наличию большого числа параметров, особенно границе нулевой толщины, таблица выступает в роли невидимой модульной сетки, относительно которой добавляется текст, изображения и другие элементы. Удобство и широкие возможности верстки — вот основной реверанс в пользу таблиц. И на этом список не заканчивается, далее рассмотрены и другие плюсы таблиц.
Таблицы довольно долго властвовали в области верстки, поскольку предлагали достаточно простые методы для размещения разных элементов на веб-странице…
Создание колонок
Таблицы же хорошо выступают в качестве многоколонной модульной сетки, каждая ячейка представляет собой отдельную колонку. Это позволяет легко создавать двух- и трехколонный макет документа. При изменении размера окна браузера, колонки сохраняют свой исходный вид, а не переносятся как слои друг под друга. К тому же высота разных колонок при использовании таблиц остается одинаковой, независимо от объема их содержимого.
Генотип и среда в изменчивости психологических признаков
... значение показателя наследуемости ничего не говорит о последовательности событий в индивидуальном развитии признака ... проблем без проб и ошибок, «в уме». Понятие интеллект ... признаку объясняются различиями между ними по их наследственности. 3. Подавляющее большинство исследований в психогенетике посвящено межиндивидуальной вариативности интеллекта, измеряемого, в зависимости от возраста испытуемых, ...
«Резиновый» макет
Таблицы удачно подходят для «резинового» макета, ширина которого привязана к ширине окна браузера. Благодаря тому, что размер таблицы можно задавать в процентах, она занимает все отведенное ей свободное пространство. Также можно регулировать и высоту содержимого.
«Склейка» изображений
Таблицы позволяют легко обеспечить «склейку» нескольких рисунков в одно изображение. Каждая картинка помещается в определенную ячейку, параметры таблицы при этом устанавливаются такими, чтобы не возникло стыков между отдельными ячейками.
«Резиновый» макет Таблицы удачно подходят для «резинового» макета, ширина которого привязана к… «Склейка» изображений
Фоновые рисунки
В ячейки таблицы разрешается добавлять фоновый рисунок, в зависимости от размеров ячейки он может повторяться по горизонтали, вертикали или сразу в двух направлениях. За счет этого приема на странице создаются декоративные линии, рамки самого разнообразного вида, добавляется тень под элементом.
Выравнивание элементов
Содержимое ячеек можно одновременно выравнивать по горизонтали и по вертикали, за счет чего расширяются возможности по размещению элементов относительно друг друга и на странице в целом.
Особенности браузеров
таблицы отображаются в разных браузерах практически одинаково, поэтому создание веб-страниц упрощается.
Недостатки таблиц
Долгая загрузка
Особенность таблиц такова, что пока последнее слово в самом низу таблицы не загрузится, на экране содержимое ячеек отображаться не будет. Браузеры используют такой подход, чтобы получить всю информацию о таблице для правильного форматирования ее содержимого. Но если таблица велика по высоте, может пройти достаточно много времени, прежде чем мы увидим нужную информацию.
Громоздкий код
Таблицы содержат сложную иерархическую структуру вложенных тегов, которая увеличивает объем кода, и повышает сложность изменения отдельных параметров.
Плохая индексация поисковиками
За счет того, что текст располагается в отдельных ячейках таблицы, в коде он может находиться достаточно далеко друг от друга. Такая раздробленность информации, а также значительная вложенность тегов затрудняет правильное индексирование страницы поисковыми системами.
Нет разделения содержимого и оформления
обилие «лишних» тегов не позволяет действительно просто и удобно управлять видом отдельных компонентов страницы. К тому же не все параметры таблиц имеют свой стилевой синоним, поэтому в любом случае приходится обращаться к коду веб-страницы и править его.
Несоответствие стандартам
В последнее время стандарты HTML и CSS прочно засели в умах веб-разработчиков. Этому способствует развитие XHTML и XML, которые более «жестко» относятся к коду документа, появление новых версий браузеров, придерживающихся спецификации, и мода на верстку слоями. Что же говорит спецификация относительно таблиц? А говорит она, что таблицы в первую и последнюю очередь нужны для размещения табличных данных. Все остальные способы использования таблиц осуждаются.
Сущность и значение контроля в системе управления.
... воздействия. По степени формализации различают факторы количественно измеримые и неизмеримые. Критерий эффективности — это показатель, выражающий главную меру желаемого результата, который учитывается ... между проведением измерений или оценок, который адекватно соответствует контролируемому явлению. Значение наиболее подходящего временного интервала такого рода определяется с учетом временных ...
Меры центральной тенденции. Общая характеристика.
Среднее, его свойства.
Дисперсия, ее свойства. Содержательный смысл дисперсии.
Стандартное отклонение.
Стандартное отклонениеесть квадратный корень из дисперсии:
Стандартное отклонение является более удобным показателем в отличие от дисперсии. Для многих распределений мы можем приблизительно знать, какой процент данных лежит внутри одного, двух, трех и более стандартных отклонений среднего.
Нормальный закон распределения и его применения в психологии.
Понятие корреляции.
Понятие корреляции
Корреляция – это согласованное изменение признаков. Если при изменении одной (или нескольких) величин изменяются другая (другие), то между показателями этих явлений будет наблюдаться корреляция. Наличие корреляции двух переменных ничего не говорит о причинно-следственных зависимостях между ними, однако дает возможность выдвинуть такую
гипотезу.
Корреляция является отрицательной, если увеличение одной переменной связано с уменьшением другой (чем боязливей особь, тем меньше у нее шансов занять доминирующее положение в группе).
Корреляция является положительной, если увеличение одной переменной связано с увеличением другой переменной (чем выше личностная тревожность, тем выше риск заболеть язвой желудка).
Корреляция является нулевой, при которой отсутствуют связи между переменными (связь между ростом учеников и их успеваемостью).
Корреляции также могут быть линейными и нелинейными. Если с увеличением или уменьшением одной переменной вторая переменная в среднем также либо растет, либо убывает, то связь линейна. Если при увеличении одной величины характер изменения другой величины нелинеен,
а описывается другими законами, то связь нелинейна. В психологических исследованиях сильная линейная корреляционная связь встречается достаточно редко.
Линейную корреляцию можно количественно измерить. Степень связи между признаками выражается величиной, называющейся коэффициентом корреляции. Обозначается r. Значения данного коэффициента могут находиться в диапазоне от – 1 до + 1. Возможные варианты связей,
соответствующие им коэффициенты корреляции и их интерпретации изобразим на диаграммах рассеивания (см. Рис. 1).
Коэффициенты корреляции характеризуются не только силой, но и значимостью. Сильная корреляция может оказаться случайной при малом объеме выборки, а слабая корреляция может оказаться высокозначимой при большом объеме выборки.
гипотезу. Корреляция является отрицательной, если увеличение одной переменной связано с… Корреляция является положительной, если увеличение одной переменной связано с увеличением другой переменной (чем выше…
Коэффициент корреляции пирсона.
Коэффициент корреляции r-Пирсона характеризует наличие только линейной связи между признаками. Формула для подсчета коэффициента корреляции r-Пирсона выглядит следующим образом: где X , Y– средние арифметические элементов ряда x и y соответственно; n – число пар измерений; x s , y s – стандартные отклонения элементов ряда x и y соответственно.
Ранговая корреляция спирмена.
Коэффициент корреляции r-Спирмена
Назначение.Вычисление ранговой корреляции позволяет определить
силу и направление корреляционной связи между двумя признаками, измеренными в ранговой шкале или между двумя иерархиями признаков. Коэффициент ранговой корреляции r-Спирмена вычисляется по формуле:
где d – разность рангов, n – число пар объектов
Коэффициент ранговой корреляции rs Спирмена
Назначение рангового коэффициента корреляции
Метод ранговой корреляции Спирмена позволяет определить тесноту (силу) и
направление корреляционной связи между двумя признаками или двумя профилями
{иерархиями) признаков.
Описание метода
Для подсчета ранговой корреляции необходимо располагать двумя рядами значений,
которые могут быть проранжированы. Такими рядами значений могут быть:
1) два признака, измеренные в одной и той же группе испытуемых;
2) две индивидуальные иерархии признаков, выявленные у двух испытуемых по
одному и тому же набору признаков (например, личностные профили по 16-факторному
опроснику Р. Б. Кеттелла, иерархии ценностей по методике Р. Рокича, последовательности
предпочтений в выборе из нескольких альтернатив и др.);
3) две групповые иерархии признаков;
4) индивидуальная и групповая иерархии признаков.
Вначале показатели ранжируются отдельно по каждому из признаков. Как правило,
меньшему значению признака начисляется меньший ранг.
Рассмотрим случай 1 (два признака).
Здесь ранжируются индивидуальные значения
по первому признаку, полученные 64025a0279разными испытуемыми, а затем индивидуальные
значения по второму признаку.
Если два признака связаны положительно, то испытуемые, имеющие низкие ранги
по одному из них, будут иметь низкие ранги и по другому, а испытуемые, имеющие
высокие ранги по одному из признаков, будут иметь по другому признаку также высокие
ранги. Для подсчета rs необходимо определить разности (d) между рангами, полученными
данным испытуемым по обоим признакам. Затем эти показатели d определенным образом
преобразуются и вычитаются из 1. Чем меньше разности между рангами, тем больше
будет rs, тем ближе он будет к +1.
Если корреляция отсутствует, то все ранги будут перемешаны и между ними не
будет никакого соответствия. Формула составлена так, что в этом случае rs, окажется
близким к 0.
В случае отрицательной корреляции низким рангам испытуемых по одному
признаку будут соответствовать высокие ранги по другому признаку, и наоборот.
Чем больше несовпадение между рангами испытуемых по двумя переменным, тем
ближе rs к -1.
Рассмотрим случай 2 (два индивидуальных профиля).
Здесь ранжируются
индивидуальные значения, полученные каждым из 2-х испытуемым по определенному
(одинаковому для них обоих) набору признаков. Первый ранг получит признак с самым
низким значением; второй ранг — признак с более высоким значением и т.д. Очевидно, что
все признаки должны быть измерены в одних и тех же единицах, иначе ранжирование
невозможно. Например, невозможно проранжировать показатели по личностному
опроснику Кеттелла (16PF), если они выражены в «сырых» баллах, поскольку по разным
факторам диапазоны значений различны: от 0 до 13, от 0 до 20 и от 0 до 26. Мы не можем
сказать, какой из факторов будет занимать первое место по выраженности, пока не
приведем все значения к единой шкале (чаще всего это шкала стенов).
Если индивидуальные иерархии двух испытуемых связаны положительно, то
признаки, имеющие низкие ранги у одного из них, будут иметь низкие ранги и у другого,
и наоборот. Например, если у одного испытуемого фактор Е (доминантность) имеет
самый низкий ранг, то и у другого испытуемого он должен иметь низкий ранг, если у
одного испытуемого фактор С (эмоциональная устойчивость) имеет высший ранг, то и
другой испытуемый должен иметь по этому фактору высокий ранг и т.д.
Рассмотрим случай 3 (два групповых профиля).
Здесь ранжируются
среднегрупповые значения, полученные в 2-х группах испытуемых по определенному,
одинаковому для двух групп, набору признаков. В дальнейшем линия рассуждений такая
же, как и в предыдущих двух случаях.
Рассмотрим случай 4 (индивидуальный и групповой профили).
Здесь ранжируются
отдельно индивидуальные значения испытуемого и среднегрупповые значения по тому же
набору признаков, которые получены, как правило, при исключении этого отдельного
испытуемого — он не участвует в среднегрупповом профиле, с которым будет
сопоставляться его индивидуальный профиль. Ранговая корреляция позволит проверить,
насколько согласованы индивидуальный и групповой профили.
Во всех четырех случаях значимость полученного коэффициента корреляции
определяется по количеству ранжированных значений N. В первом случае это количество
будет совпадать с объемом выборки п. Во втором случае количеством наблюдений будет
количество признаков, составляющих иерархию. В ヌニナハハハノハハヒтретьем и четвертом случае N — это
также количество сопоставляемых признаков, а не количество испытуемых в группах.
Подробные пояснения даны в примерах.
Если абсолютная величина rs достигает критического значения или превышает его,
корреляция достоверна.
которые могут быть проранжированы. Такими рядами значений могут быть: 1) два признака, измеренные в одной и той же группе испытуемых; 2) две индивидуальные иерархии признаков, выявленные у двух испытуемых по
Гипотезы
Возможны два варианта гипотез. Первый относится к случаю 1, второй — к трем
остальным случаям.
Первый вариант гипотез
H0: Корреляция между переменными А и Б не отличается от нуля.
H1: Корреляция между переменными А и Б достоверно отличается от нуля.
Второй вариант гипотез
H0: Корреляция между иерархиями А и Б не отличается от нуля.
H1: Корреляция между иерархиями А и Б достоверно отличается от нуля.
Графическое представление метода ранговой корреляции
Чаще всего корреляционную связь представляют графически в виде облака точек
или в виде линий, отражающих общую тенденцию размещения точек в пространстве двух
осей: оси признака А и признака Б (см. Рис. 6.2).
Попробуем изобразить ранговую корреляцию в виде двух рядов ранжированных
значений, которые попарно соединены линиями (Рис. 6.3).
Если ранги по признаку А и по
признаку Б совпадают, то между ними оказывается горизонтальная линия, если ранги не
совпадают, то линия становится наклонной. Чем больше несовпадение рангов, тем более
наклонной становится линия. Слева на Рис. 6.3 отображена максимально высокая
положительная корреляция (rв=+1,0) — практически это «лестница». В центре отображена
нулевая корреляция — плетенка с неправильными переплетениями. Все ранги здесь
перепутаны. Справа отображена максимально высокая отрицательная корреляция (rs=-1,0)
-паутина с правильным переплетением линий.
Рис. 6.3. Графическое представление ранговой корреляции:
а) высокая положительная корреляция;
б) нулевая корреляция;
в) высокая отрицательная корреляция
или в виде линий, отражающих общую тенденцию размещения точек в пространстве двух осей: оси признака А и признака Б (см. Рис. 6.2).
Попробуем изобразить ранговую корреляцию в виде двух рядов ранжированных
Ограничения коэффициента ранговой корреляции
1. По каждой переменной должно быть представлено не менее 5 наблюдений.
Верхняя граница выборки определяется имеющимися таблицами критических значений
(Табл.XVI Приложения 1), а именно N≤40.
2. Коэффициент ранговой корреляции Спирмена rs при большом количестве
одинаковых рангов по одной или обеим сопоставляемым переменным дает огрубленные
значения. В идеале оба коррелируемых ряда должны представлять собой две
последовательности несовпадающих значений. В случае, если это условие не
соблюдается, необходимо вносить поправку на одинаковые ранги. Соответствующая
формула дана в примере 4.
Верхняя граница выборки определяется имеющимися таблицами критических значений (Табл.XVI Приложения 1), а именно N≤40. 2. Коэффициент ранговой корреляции Спирмена rs при большом количестве
Пример 1 — корреляция между двумя признаками
В исследовании, моделирующем деятельность авиадиспетчера (Одерышев Б.С.,
Шамова Е.П., Сидоренко Е.В., Ларченко Н.Н., 1978), группа испытуемых, студентов
физического факультета ЛГУ проходила подготовку перед началом работы на тренажере.
Испытуемые должны были решать задачи по выбору оптимального типа взлетно-
посадочной полосы для заданного типа самолета. Связано ли количество ошибок,
допущенных испытуемыми в тренировочной сессии, с показателями вербального и
невербального интеллекта, измеренными по методике Д. Векслера?
Таблица 6.1
Показатели количества ошибок в тренировочной сессии и показатели уровня вербального
и невербального интеллекта у студентов-физиков (N=10)
1)Испытуемый 2)Количество ошибок 3)Показатель вербального
интеллекта
4)Показатель невербального
интеллекта
1 Т.А. 29 131 106
2 П.А. 54 132 90
3 Ч.И. 13 121 95
4 Ц.А. 8 127 116
5 См.А. 14 136 . 127
6 К.Е. 26 124 107
7 К.А. 9 134 104
8 Б.Л. 20 136 102
9 И.А. 2 132 111
10 Ф.В. 17 136 99
Суммы 192 1309 1057
Средние 19,2 130,9 105,7
Сначала попробуем ответить на вопрос, связаны ли между собой показатели
количества ошибок и вербального интеллекта.
Сформулируем гипотезы.
H0: Корреляция между показателем количества ошибок в тренировочной сессии и
уровнем вербального интеллекта не отличается от нуля.
H1: Корреляция между показателем количества ошибок в тренировочной сессии и
уровнем вербального интеллекта статистически значимо отличается от нуля.
Далее нам необходимо проранжировать оба показателя, Приписывая меньшему
значению меньший ранг, затем подсчитать разности между рангами, которые получил
каждый испытуемый по двум переменным (признакам), и возвести эти разности в квадрат.
Произведем все необходимые расчеты в таблице.
В Табл. 6.2 в первой колонке слева представлены значения по показателю
количества ошибок; в следующей колонке — их ранги. В третьей колонке слева
представлены значения по показателю вербального интеллекта; в следующем столбце — их
ранги. В пятом слева представлены разности d между рангом по переменной А
(количество ошибок) и переменной Б (вербальный интеллект).
В последнем столбце
представлены квадраты разностей — d2.
Расчет d2 для рангового коэффициента корреляции Спирмена rs при сопоставлении
показателей количества ошибок и вербального интеллекта у студентов-физиков (N=10)
Испытуемый Переменная А
количество ошибок
Переменная Б
вербальный интеллект.
d (ранг А —
— ранг Б) J2
Индивидуальные
значения Ранг
Индивидуальные
значения Ранг
1 ТА. 29 9 131 4 5 25
2 ПА. 54 10 132 5.5 4,5 20.25
3 Ч.И. 13 4 121 1 3 9
4 Ц.А. 8 2 127 3 -1 1
5 См.А. 14 5 136 9 -4 16
6 К.Е. 26 8 124 2 6 36
7 К.А. 9 3 134 7 -4 16
8 Б.Л. 20 7 136 9 -2 4
9 И.А. 2 1 132 5,5 -4,5 20,25
10 Ф.В. 17 6 136 9 9
Суммы 55 55 0 156,5
Коэффициент ранговой корреляции Спирмена подсчитывается по формуле:
где d — разность между рангами по двум переменным для каждого испытуемого;
N — количество ранжируемых значений, в. данном случае количество
испытуемых.
Рассчитаем эмпирическое значение rs:
Полученное эмпирическое значение гs близко к 0. И все же определим критические
значения rs при N=10 по Табл. XVI Приложения 1:
Ответ: H0 принимается. Корреляция между показателем количества ошибок в
тренировочной сессии и уровнем вербального интеллекта не отличается от нуля.
Теперь попробуем ответить на вопрос, связаны ли между собой показатели
количества ошибок и невербального интеллекта.
Сформулируем гипотезы.
H0: Корреляция между показателем количества ошибок в тренировочной сессии и
уровнем невербального интеллекта не отличается от 0.
H1: Корреляция между показателем количества ошибок в тренировочной сессии и
уровнем невербального интеллекта статистически значимо отличается от 0.
Расчет d2 для рангового коэффициента корреляции Спирмена rs при сопоставлении
показателей количества ошибок и невербального интеллекта у студентов-физиков (N=10)
Мы помним, что для определения значимости rs неважно, является ли он
положительным или отрицательным, важна лишь его абсолютная величина. В данном
случае:
rs эмп χ2кр, H0 отвергается.
В большинстве случаев для того, чтобы мы признали различия значимыми,
необходимо, чтобы эмпирическое значение критерия превышало критическое, хотя есть
критерии (например, критерий Манна-Уитни или критерий знаков), в которых мы должны
придерживаться противоположного правила.
Эти правила оговариваются в описании каждого из представленных в руководстве
критериев.
В некоторых случаях расчетная формула критерия включает в себя количество
наблюдений в исследуемой выборке, обозначаемое как п. В этом случае эмпирическое
значение критерия одновременно является тестом для проверки статистических гипотез.
По специальной таблице мы определяем, какому уровню статистической значимости
различий соответствует данная эмпирическая величина. Примером такого критерия
является критерий φ*, вычисляемый на основе углового преобразования Шишера.
В большинстве случаев, однако, одно и то же эмпирическое значение критерия
может оказаться значимым или незначимым в зависимости от количества наблюдений в
исследуемой выборке (n) или от так называемого количества степеней свободы, которое
обозначается как v или как df.
Число степеней свободы v равно числу классов вариационного ряда минус число
условий, при которых он был сформирован. К
числу таких условий относятся объем выборки (n), средние и дисперсии.
Если мы расклассифицировали наблюдения по классам какой-либо номинативной
шкалы и подсчитали количество наблюдений в каждой ячейке классификации, то мы
получаем так называемый частотный вариационный ряд. Единственное условие, которое
соблюдается при его формировании — объем выборки п. Допустим, у нас 3 класса: «Умеет
работать на компьютере — умеет выполнять лишь определенные операции — не умеет
работать на компьютере». Выборка состоит из 50 человек. Если в первый класс отнесены
20 испытуемых, во второй — тоже 20, то в третьем классе должны оказаться все остальные
10 испытуемых. Мы ограничены одним условием — объемом выборки. Поэтому даже если
мы потеряли данные о том, сколько человек не умеют работать на компьютере, мы можем
определить это, зная, что в первом и втором классах — по 20 испытуемых. Мы не свободны
в определении количества испытуемых в третьем разряде, «свобода» простирается только
на первые две ячейки классификации:
v= c-l = 3-1 = 2
Аналогичным образом, если бы у нас была классификация из 10 разрядов, то мы
были бы свободны только в 9 из них, если бы у нас было 100 классов — то в 99 из них и т.
д.Способы более сложного подсчета числа степеней свободы при двухмерных
классификациях приведены в разделах, посвященных критерию χ2 и дисперсионному
анализу.
Зная n и/или число степеней свободы, мы по специальным таблицам можем
определить критические значения критерия и сопоставить с ними полученное
эмпирическое значение. Обычно это записывается так: «при n=22 критические значения
критерия составляют …» или «при v=2 критические значения критерия составляют …» и
т.п.Критерии делятся на параметрические и непараметрические._
поведение, то есть принятие истинной и отклонение ложной гипотезы с высокой вероятностью. Статистические критерии обозначают также метод расчета определенного числа и
Уровни статистической значимости
Уровень значимости — это вероятность того, что мы сочли различия существенными,
а они на самом деле случайны.
Когда мы указываем, что различия достоверны на 5%-ом уровне значимости, или
при р<0,05, то мы имеем виду, что вероятность того, что они все-таки недостоверны,
составляет 0,05.
Когда мы указываем, что различия достоверны на 1%-ом уровне значимости, или
при р<0,01, то мы имеем в виду, что вероятность того, что они все-таки недостоверны,
составляет 0,01.
Если перевести все это на более формализованный язык, то уровень значимости — это
вероятность отклонения нулевой гипотезы, в то время как она верна.
а они на самом деле случайны. Когда мы указываем, что различия достоверны на 5%-ом уровне значимости, или … при р<0,05, то мы имеем виду, что вероятность того, что они все-таки недостоверны,
Ошибка, состоящая в том, что мы отклонили нулевую гипотезу, в то время какона верна, называется ошибкой 1 рода.
Вероятность такой ошибки обычно обозначается какα. В сущности, мы должны
были бы указывать в скобках не р≤0,05 или р≤0,01, а α≤0,05 или α≤0,01. В некоторых
руководствах так и делается (Рунион Р., 1982; Захаров В.П., 1985 и др.).
Если вероятность ошибки — это α, то вероятность правильного решения: 1 — α. Чем
меньше α, тем больше вероятность правильного решения.
Исторически сложилось так, что в психологии принято считать низшим уровнем
статистической значимости 5%-ый уровень (р<0,05): достаточным — 1%-ый уровень
(р<0,01) и высшим 0,1%-ый уровень (р<0,001), поэтому в таблицах критических значений
обычно приводятся значения критериев, соответствующих уровням статистической зна-
чимости р<0,05 и р<0,01, иногда — р<0,001. Для некоторых критериев в таблицах указан
точный уровень значимости их разных эмпирических значений. Например, для φ*=1,56
р=0,06.
До тех пор, однако, пока уровень статистической значимости не достигнет р=0,05,
мы еще не имеем права отклонить нулевую гипотезу. В настоящем руководстве мы, вслед
за Р. Рунионом (1982), будем придерживаться следующего правила отклонения гипотезы
об отсутствии различий (H0) И принятия гипотезы о статистической достоверности
различий (Н1).Правило отклонения H0 И принятия H1
Если эмпирическое значение критерия равняется критическому значению,
соответствующему р<0,05 или превышает его, то H0 отклоняется, но мы еще не можем
определенно принять H1. Если эмпирическое значение критерия равняется критическому
значению, соответствующему р<0,01 или превышает его, то H0 отклоняется и
принимается H1.
Исключения: критерий знаков G, критерий Т Вилкоксона и критерий U Манна-
Уитни. Для них устанавливаются обратные соотношения. Для облегчения процесса принятия решения можно всякий раз вычерчивать «ось
значимости».
Критические значения критерия обозначены как Q0,05 и Q0,01, эмпирическое значение
критерия как Qэмп. Оно заключено в эллипс.
Вправо от критического значения Q0,01 простирается «зона значимости» — сюда
попадают эмпирические значения, превышающие Q0,01 и, следовательно, безусловно
значимые.
Влево от критического значения Q0,05 простирается «зона незначимости», — сюда
попадают эмпирические значения Q, которые ниже Q0,05, и, следовательно, безусловно
незначимы.
Мы видим, что Q0,05=6; Q0,01=9; Qэмп=8
Эмпирическое значение критерия попадает в область между Q0,05 и Q0,01- Это зона
«неопределенности»: мы уже можем отклонить гипотезу о недостоверности различий (H0),
НО еще не можем принять гипотезы об их достоверности (H1).
Практически, однако, исследователь может считать достоверными уже те различия,
которые не попадают в зону незначимости, заявив, что они достоверны при р<0,05, или
указав точный уровень значимости полученного эмпирического значения критерия,
например: р=0,02. С помощью таблиц Приложения 1 это можно сделать по отношению к
критериям Н Крускала-Уоллиса, χ2, Фридмана, L Пейджа, φ* Фишера, А, Колмогорова.
Уровень статистической значимости или критические значения критериев
определяются по-разному при проверке направленных и ненаправленных статистических
гипотез.
При направленной статистической гипотезе используется односторонний критерий,
при ненаправленной гипотезе — двусторонний критерий. Двусторонний критерий более
строг, поскольку он проверяет различия в обе стороны, и поэтому то эмпирическое
значение критерия, которое ранее соответствовало уровню значимости р<0,05, теперь
соответствует лишь уровню р<0,10.
В данном руководстве исследователю не придется всякий раз самостоятельно
решать, использует ли он односторонний или двухсторонний критерий. Таблицы
критических значений критериев подобраны таким образом, что направленным гипотезам
соответствует односторонний, а ненаправленным — двусторонний критерий, и
приведенные значения удовлетворяют тем требованиям, которые предъявляются к
каждому из них. Исследователю необходимо лишь следить за тем, чтобы его гипотезы
совпадали по смыслу и по форме с гипотезами, предлагаемыми в описании каждого из
критериев.
были бы указывать в скобках не р≤0,05 или р≤0,01, а α≤0,05 или α≤0,01. В некоторых руководствах так и делается (Рунион Р., 1982; Захаров В.П., 1985 и др.).
Если вероятность ошибки — это α, то вероятность правильного решения: 1 — α. Чем
Ошибки первого и второго рода.
Ошибка, состоящая в том, что мы отклонили нулевую гипотезу, в то время какона верна, называется ошибкой 1 рода.
Ошибка, состоящая в том, что мы приняли нулевую гипотезу, в то время как
она неверна, называется ошибкой II рода. Вероятность такой ошибки обозначается как β. Мощность критерия — это его
способность не допустить ошибку II рода, поэтому:
Мощность=1—β
Мощность критерия определяется эмпирическим путем. Одни и те же задачи могут
быть решены с помощью разных критериев, при этом обнаруживается, что некоторые
критерии позволяют выявить различия там, где другие оказываются неспособными это
сделать, или выявляют более высокий уровень значимости различий. Возникает вопрос: а
зачем же тогда использовать менее мощные критерии? Дело в том, что основанием для
выбора критерия может быть не только мощность, но и другие его характеристики, а
именно:
а) простота;
б) более широкий диапазон использования (например, по отношению к данным,
определенным по номинативной шкале, или по отношению к большим n);
в) применимость по отношению к неравным по объему выборкам;
г) большая информативность результатов.
способность не допустить ошибку II рода, поэтому: Мощность=1—β Мощность критерия определяется эмпирическим путем. Одни и те же задачи могут
Параметры и статистики.
Генеральные совокупности и выборки.
Выборка
i> – любая подгруппа элементов (испытуемых, респондентов)
выделенная из генеральной совокупности для проведения эксперимента.
Генеральная совокупность – это любая совокупность людей, которую психолог изучает по выборке. Теоретически генеральная совокупность
неограниченна.
Выборочное исследование – это исследование, при котором психолог производит выбор ограниченного числа элементов из изучаемой генеральной
совокупности. Если процедура эксперимента и полученные результаты измерения
некоторого свойства, проведенные на одной выборке, оказывают влияние на другую, то такие выборки называются зависимыми (связными).
Если
процедура эксперимента и полученные результаты измерения некоторого свойства, проведенные на одной выборке, не оказывают влияние на другую, то такие выборки называются независимыми (несвязными).
Требования к выборке:
1. Однородность. Выбор осуществляется на основаниях: возраст,
уровень интеллекта, национальность, заболевания.
2. Репрезентативность. Качество выборки позволяющее распространять
полученные на ней выводы на всю генеральную совокупность. Состав
экспериментальной выборки это модель генеральной совокупности.
Следует отметить, что любая выборка может быть репрезентативной
лишь в каких-то определенных, но не всех отношениях. Например, если
выборка сделана по социально-образовательному признаку, это не значит,
что она будет репрезентативна и для возрастной структуры населения или
для разных типов семьи и т.д.
Рекомендуемый объем выборки: не менее 30-35 человек в изучаемой
группе.
выделенная из генеральной совокупности для проведения эксперимента. Генеральная совокупность – это любая совокупность людей, которую психолог… неограниченна.
Параметрические и непараметрические критерии статистики.
Критерии делятся на параметрические и непараметрические.
Параметрические критерии
Критерии, включающие в формулу расчета параметры распределения, то есть
средние и дисперсии (t — критерий Стьюдента, критерий F и др.)
Непараметрические критерии
Критерии, не включающие в формулу расчета параметров распределения и
основанные на оперировании частотами или рангами (критерий Q Розенбаума, критерий Т
Вилкоксона и др.)
И те, и другие критерии имеют свои преимущества и недостатки. На основании
нескольких руководств можно составить таблицу, позволяющую оценить возможности и
ограничения тех и других.
Возможности и ограничения параметрических и непараметрических критериев
ПАРАМЕТРИЧЕСКИЕ КРИТЕРИИ 2)НЕПАРАМЕТРИЧЕСКИЕ
КРИТЕРИИ
1).
Позволяют прямо оценить различи* в средних, полученных в двух выборках (t — критерий Стьюдента).2)Позволяют оценить лишь средние тенденции, например, ответить на вопрос, чаще ли в выборке А встречаются более высокие, а в выборке Б — более низкие значения признака
(критерии Q, U, φ* и др.).
1).
Позволяют прямо оценить различия в дисперсиях (критерий Фишера).2)Позволяют оценить лишь различия в диапазонах вариативности признака (критерий φ*).
1).
Позволяют выявить тенденции изменения признака при переходе от условия к условию (дисперсионный однофакторный анализ), но лишь при условии нормального распределения
признака.2)Позволяют выявить тенденции изменения признака при переходе от условия к условию при любом распределении признака (критерии тенденций L и S).
1).
Позволяют оценить взаимодействие двух и более факторов в их влиянии на изменения признака (двухфакторный дисперсионный анализ).2)Эта возможность отсутствует.
1).
Экспериментальные данные должны отвечать двум, а иногда трем, условиям: а) значения признака измерены по интервальной шкале; б) распределение признака является нормальным; в) в
дисперсионном анализе должно соблюдаться требование равенства дисперсий в ячейках комплекса.2)Экспериментальные данные могут не отвечать ни одному из этих условий: а)
значения признака могут быть представлены в любой шкале, начиная от шкалы наименований; б) распределение признака может быть любым и совпадение его с каким-либо теоретическим законом распределения необязательно и не нуждается в проверке; в) требование равенства
дисперсий отсутствует.
1).
Математические расчеты довольно сложны.2)Математические расчеты по большей
части просты и занимают мало времени (за исключением критериев χ2 и λ).
1).
Если условия, перечисленные в п.5, выполняются, параметрические критерии оказываются несколько более мощными, чем непараметрические.2)Если условия, перечисленные в п.5, не
выполняются, непараметрические критерии оказываются более мощными, чем параметрические, так как они менее чувствительны к «засорениям’.
Из Табл. 1.1 мы видим, что параметрические критерии могут оказаться несколько
более мощными5, чем непараметрические, но только в том случае, если признак измерен
по интервальной шкале и нормально распределен. С интервальной шкалой есть
определенные проблемы (см. раздел «Шкалы измерения»).
Лишь с некоторой натяжкой
мы можем считать данные, представленные не в стандартизованных оценках, как
интервальные. Кроме того, проверка распределения «на нормальность» требует
достаточно сложных расчетов, результат которых заранее неизвестен (см. параграф 7.2).
Может оказаться, что распределение признака отличается от нормального, и нам так или
иначе все равно придется обратиться к непараметрическим критериям.
Непараметрические критерии лишены всех этих ограничений и нетребуют таких
длительных и сложных расчетов. По сравнению с параметрическими критериями они
ограничены лишь в одном — с их помощью невозможно оценить взаимодействие двух или
более условий или факторов, влияющих на изменение признака. Эту задачу может решить
только дисперсионный двухфакторный анализ.
Учитывая это, в настоящее руководство включены в основном непараметрические
статистические критерии. В сумме они охватывают большую часть возможных задач
сопоставления данных.
Единственный параметрический метод, включенный в руководство — метод
дисперсионного анализа, двухфакторный вариант которого ничем невозможно заменить.__
(критерии Q, U, φ* и др.).
1).
Позволяют прямо оценить различия в дисперсиях (критерий… 1).
Позволяют выявить тенденции изменения признака при переходе от условия к условию (дисперсионный однофакторный…
Критерий стьюдента.
Назначение.Критерий t-критерий Стьюдента является
параметрическим и используется с целью оценки достоверности сдвига
значений в зависимых выборках.
Критерий имеет следующую формулу: t = /M d /
где Md – среднее арифметическое разностей индивидуальных
значений, d s – стандартное отклонение значений разностей.
Критерий фишера.
Назначение.Критерий j-Фишера – многофункциональный и
предназначен для сравнения двух как связных, так и несвязных между собой
выборок, причем в сравниваемых выборках допускается неравное количество
испытуемых. Критерий основан на подсчете процентных долей, и на их
сравнении с помощью специальной таблицы: таблицы величин углов φ (в
радианах) для разных процентных долей.
Критерий φ* — угловое преобразование Фишера
Данный метод описан во многих руководствах.
Настоящее описание опирается на тот вариант метода, который был разработан и изложен Е.В. Гублером.
Назначение критерия φ*
Критерий Фишера предназначен для сопоставления двух выборок по частоте
встречаемости интересующего исследователя эффекта.
предназначен для сравнения двух как связных, так и несвязных между собой выборок, причем в сравниваемых выборках допускается неравное количество испытуемых. Критерий основан на подсчете процентных долей, и на их
Описание критерия
Критерий оценивает достоверность различий между процентными долями двух
выборок, в которых зарегистрирован интересующий нас эффект.
Суть углового преобразования Фишера состоит в переводе процентных долей в
величины центрального угла , который измеряется в радианах . Большей процентной доле
будет соответствовать больший угол ф, а меньшей доле — меньший угол, но соотношения
здесь не линейные:
где Р — процентная доля, выраженная в долях единицы (см. Рис. 5.1).
При увеличении расхождения между углами φ1 и φ2 и увеличения численности
выборок значение критерия возрастает. Чем больше величина φ* , тем более вероятно, что
различия достоверны.
выборок, в которых зарегистрирован интересующий нас эффект. Суть углового преобразования Фишера состоит в переводе процентных долей в величины центрального угла , который измеряется в радианах . Большей процентной доле
Гипотезы
H0: Доля лиц, у которых проявляется исследуемый эффект, в выборке 1 не больше,
чем в выборке 2.
H1: Доля лиц, у которых проявляется исследуемый эффект, в выборке 1 больше,
чем в выборке 2.
Графическое представление критерияφ*
Метод углового преобразования несколько более абстрактен, чем остальные
критерии.
Формула, которой придерживается Е. В. Гублер при подсчете значений φ,
предполагает, что 100% составляют угол φ=3,142, то есть округленную величину
π=3,14159… Это позволяет нам представить сопоставляемые выборки в виде двух
полукругов, каждый из которых символизирует 100% численности своей выборки.
Процентные доли испытуемых с «эффектом» будут представлены как секторы, образован-
ные центральными углами φ. На Рис. 5.2 представлены два полукруга, иллюстрирующие
Пример 1. В первой выборке 60% испытуемых решили задачу. Этой процентной доле
соответствует угол φ=1,772. Во второй выборке 40% испытуемых решили задачу. Этой
процентной доле соответствует угол φ =1,369.
Критерий φ* позволяет определить, действительно ли один из углов статистически
достоверно превосходит другой при данных объемах выборок.
Ограничения критерияφ*
1. Ни одна из сопоставляемых долей не должна быть равной нулю. Формально нет
препятствий для применения метода φ в случаях, когда доля наблюдений в одной из
выборок равна 0. Однако в этих случаях результат может оказаться неоправданно
завышенным (Гублер Е.В., 1978, с. 86).
2. Верхний предел в критерии φ отсутствует — выборки могут быть сколь угодно
большими.
Нижний предел — 2 наблюдения в одной из выборок. Однако должны соблюдаться
следующие соотношения в численности двух выборок:
а) если в одной выборке всего 2 наблюдения, то во второй должно быть не менее 30:
б) если в одной из выборок всего 3 наблюдения, то во второй должно быть не менее
7:в) если в одной из выборок всего 4 наблюдения, то во второй должно быть не менее
5:г) при n1,n2≥5 возможны любые сопоставления.
В принципе возможно и сопоставление выборок, не отвечающих этому условию,
например, с соотношением n1=2, n2
=15, но в этих случаях не удастся выявить достоверных
различий.
Других ограничений у критерия φ* нет.
Рассмотрим несколько примеров, иллюстрирующих возможности
критерия φ*.
Пример 1: сопоставление выборок по качественно определяемому признаку.
Пример 2: сопоставление выборок по количественно измеряемому признаку.
Пример 3: сопоставление выборок и по уровню, и по распределению признака.
Пример 4: использование критерия φ* в сочетании с критерием X Колмогорова-
Смирнова в целях достижения максимально точного результата.
чем в выборке 2. H1: Доля лиц, у которых проявляется исследуемый эффект, в выборке 1 больше, … чем в выборке 2.
Пример 1 — сопоставление выборок по качественно определяемому признаку
В данном варианте использования критерия мы сравниваем процент испытуемых в
одной выборке, характеризующихся каким-либо качеством, с процентом испытуемых в
другой выборке, характеризующихся тем же качеством.
Допустим, нас интересует, различаются ли две группы студентов по успешности
решения новой экспериментальной задачи. В первой группе из 20 человек с нею
справились 12 человек, а во второй выборке из 25 человек — 10. В первом случае
процентная доля решивших задачу составит 12/20·100%=60%, а во второй
10/25·100%=40%. Достоверно ли различаются эти процентные доли при данных n1 и n2?
Казалось бы, и «на глаз» можно определить, что 60% значительно выше 40%. Однако
на самом деле эти различия при данных n1, n2 недостоверны.
Проверим タ_v・4_ 。Gэто. Поскольку нас интересует факт решения задачи, будем считать
«эффектом» успех в решении экспериментальной задачи, а отсутствием эффекта — неудачу
в ее решении.
Сформулируем гипотезы.
H0: Доля лиц, справившихся с задачей, в первой группе не больше, чем во второй
группе.
H1: Доля лиц, справившихся с задачей, в первой группе больше, чем во второй
группе.
Теперь построим так называемую четырехклеточную, или четырехпольную таблицу,
которая фактически представляет собой таблицу эмпирических частот по двум значениям
признака: «есть эффект» — «нет эффекта».__
Четырехклеточная таблица для расчета критерия при сопоставлении двух групп
испытуемых по процентной доле решивших задачу.
1)Группы
2)»Есть эффект»: задача решена
3)»Нет эффекта»: задача не решена
4)Суммы
2)Количество испытуемых % доля
3) Количество испытуемых % доля
1 группа 12 (60%) А 8 (40%) Б 20
2jЈynna 10 (40%) В 15 (60%) Г 25
Суммы 22 23 45
В четырехклеточной таблице, как правило, сверху размечаются столбцы «Есть
эффект» и «Нет эффекта», а слева — строки «1 группа» и «2 группа». Участвуют в
сопоставлениях, собственно, только поля (ячейки) А и В, то есть процентные доли по
столбцу «Есть эффект». По Табл. XII Приложения 1 определяем величины φ, соответствующие процентным
долям в каждой из групп.
Теперь подсчитаем эмпирическое значение φ* по формуле:
где φ1 — угол, соответствующий большей % доле;
φ2 — угол, соответствующий меньшей % доле;
n1 — количество наблюдений в выборке 1;
n2 — количество наблюдений в выборке 2.
В данном случае:
По Табл. XIII Приложения 1 определяем, какому уровню значимости соответствует
φ*эмп=1,34:
р=0,09
Можно установить и критические значения φ*, соответствующие принятым в
психологии уровням статистической значимости:
Построим «ось значимости».
Полученное эмпирическое значение φ* находится в зоне незначимости.
Ответ: H0 принимается. Доля лиц, справившихся с задачей, в первой группе не
больше, чем во второй группе.
Можно лишь посочувствовать исследователю, который считает существенными
различия в 20% и даже в 10%, не проверив их достоверность с помощью критерия φ*. В
данном случае, например, достоверными были бы только различия не менее чем в 24,3%.
Похоже, что при сопоставлении двух выборок по какому-либо качественному
признаку критерий φ может нас скорее огорчить, чем обрадовать. То, что казалось
существенным, со статистической точки зрения может таковым не оказаться.
Гораздо больше возможностей порадовать исследователя появляется у критерия
Фишера тогда, когда мы сопоставляем две выборки по количественно измеренным
признакам и можем варьировать «эффект .
АЛГОРИТМ 17
Расчет критерия φ*
1. Определить те значения признака, которые будут критерием для разделения
испытуемых на тех, у кого «есть эффект» и тех, у кого «нет эффекта». Если признак
измерен количественно, использовать критерий λ для поиска оптимальной точки
разделения.
2. Начертить четырехклеточную таблицу из двух столбцов и двух строк. Первый
столбец — «есть эффект»; второй столбец — «нет эффекта»; первая строка сверху — 1 группа
(выборка); вторая строка — 2 группа (выборка).
3. Подсчитать количество испытуемых в первой группе, у которых «есть эффект», и
занести это число в левую верхнюю ячейку таблицы.
4. Подсчитать количество испытуемых в первой выборке, у которых «нет эффекта», и
занести это число в правую верхнюю ячейку таблицы. Подсчитать сумму по двум верхним
ячейкам. Она должна совпадать с количеством испытуемых в первой группе.
5. Подсчитать количество испытуемых во второй группе, у которых «есть эффект», и
занести это число в левую нижнюю ячейку таблицы.
6. Подсчитать количество испытуемых во второй выборке, у которых «нет эффекта»,
и занести это число в правую нижнюю ячейку таблицы. Подсчитать сумму по двум
нижним ячейкам. Она должна совпадать с количеством испытуемых во второй группе
(выборке).
7. Определить процентные доли испытуемых, у которых «есть эффект», путем
отнесения их количества к общему количеству испытуемых в данной группе (выборке).
Записать полученные процентные доли соответственно в левой верхней и левой нижней
ячейках таблицы в скобках, чтобы не перепутать их с абсолютными значениями.
8. Проверить, не равняется ли одна из сопоставляемых процентных долей нулю.
Если это так, попробовать изменить это, сдвинув точку разделения групп в ту или иную
сторону. Если это невозможно или нежелательно, отказаться от критерия φ* и
использовать критерий χ2.
9. Определить по Табл. XII Приложения 1 величины углов φ для каждой из
сопоставляемых процентных долей.
10. Подсчитать эмпирическое значение φ* по формуле:
где: φ1 — угол, соответствующий большей процентной доле;
φ2 — угол, соответствующий меньшей процентной доле;
n1 — количество наблюдений в выборке 1;
n2 — количество наблюдений в выборке 2.
11. Сопоставить полученное значение φ* с критическими значениями: φ* ≤1,64
(Р<0,05) И φ* ≤2,31 (р<0,01).
Если φ*эмп ≤φ*кр. H0 отвергается.
При необходимости__
1. Определить те значения признака, которые будут критерием для разделения испытуемых на тех, у кого «есть эффект» и тех, у кого «нет… измерен количественно, использовать критерий λ для поиска оптимальной точки
Преимущества и недостатки параметрических критериев.
Преимущества и недостатки непараметрических критериев.
28)критерий U, манна – уитни.
Назначение.Критерий U-Манна-Уитни применяется для оценки различий по показателям какого-либо признака между двумя несвязными (независимыми) выборками. Количество элементов в сравниваемых выборках может быть не одинаковым.
U— критерий Манна-Уитни
Назначение критерия
Критерий предназначен для оценки различий между двумя выборками по уровню какого-либо признака, количественно измеренного. Он позволяет выявлять различия между малыми выборками, когда n1•n2≥3 или n1=2, n2≥5, и является более мощным, чем критерий Розенбаума.
Описание критерия
Существует несколько способов использования критерия и несколько вариантов
таблиц критических значений, соответствующих этим способам.
Этот метод определяет, достаточно ли мала зона перекрещивающихся значений
между двумя рядами. Мы помним, что 1-м рядом (выборкой, группой) мы называем тот
ряд значений, в котором значения, по предварительной оценке, выше, а 2-м рядом — тот,
где они предположительно ниже.
Чем меньше область перекрещивающихся значений, тем более вероятно, что различия достоверны. Иногда эти различия называют различиями в расположении двух выборок.
Эмпирическое значение критерия U отражает то, насколько велика зона совпадения
между рядами. Поэтому чем меньше Uэмп, тем более вероятно, что различия достоверны.
таблиц критических значений, соответствующих этим способам. Этот метод определяет, достаточно ли мала зона перекрещивающихся значений между двумя рядами. Мы помним, что 1-м рядом (выборкой, группой) мы называем тот
Гипотезы
Н0: Уровень признака в группе 2 не ниже уровня признака в группе 1.
H1: Уровень признака в группе 2 ниже уровня признака в группе 1.
Графическое представление критерия U
На Рис. 2.5. представлены три из множества возможных вариантов соотношения
двух рядов значений.
В варианте (а) второй ряд ниже первого, и ряды почти не перекрещиваются. Область
наложения слишком мала, чтобы скрадывать различия между рядами. Есть шанс, что
различия между ними достоверны. Точно определить это мы сможем с помощью критерия
U.В варианте (б) второй ряд тоже ниже первого, но и область перекрещивающихся
значений у двух рядов достаточно обширна. Она может еще не достигать критической
величины, когда различия придется признать несущественными. Но так ли это, можно
определить только путем точного подсчета критерия U.
В варианте (в) второй ряд ниже первого, но область наложения настолько обширна,
что различия между рядами скрадываются.
двух рядов значений. В варианте (а) второй ряд ниже первого, и ряды почти не перекрещиваются.… наложения слишком мала, чтобы скрадывать различия между рядами. Есть шанс, что
Ограничения критерия U
1. В каждой выборке должно быть не менее 3 наблюдений: n1•n2≥3; допускается,
чтобы в одной выборке было 2 наблюдения, но тогда во второй их должно быть не менее
5.2. В каждой выборке должно быть не более 60 наблюдений; n1•n2≤60. Однако уже
при n1•n2>20 ранжирование становиться достаточно трудоемким.
На наш взгляд, в случае, если n1•n2>20, лучше использовать другой критерий, а
именно угловое преобразование Фишера в комбинации с критерием λ,, позволяющим
выявить критическую точку, в которой накапливаются максимальные различия между
двумя сопоставляемыми выборками (см. п. 5.4).
.Формулировка звучит сложно, но сам
метод достаточно прост. Каждому исследователю лучше попробовать разные пути и
выбрать тот, который кажется ему более подходящим.
чтобы в одной выборке было 2 наблюдения, но тогда во второй их должно быть не менее 5. 2. В каждой выборке должно быть не более 60 наблюдений; n1•n2≤60. Однако уже
Пример
Вернемся к результатам обследования студентов физического и психологического
факультетов Ленинградского университета с помощью методики Д. Векслера для
измерения вербального и невербального интеллекта. С помощью критерия Q Розенбаума
мы в предыдущем параграфе смогли с высоким уровнем значимости определить, что
уровень вербального интеллекта в выборке студентов физического факультета выше.
Попытаемся установить теперь, воспроизводится ли этот результат при сопоставлении
выборок по уровню невербального интеллекта. Данные приведены в Табл. 2.3.
Можно ли утверждать, что одна из выборок превосходит другую по уровню
невербального интеллекта?
Индивидуальные значения невербального интеллекта в выборках студентов
физического (щ=4) и психологического (п2=12) факультетов
1)Студенты-физики
2)Студенты-психологи
Код имени испытуемого
Показатель невербального интеллекта
Код имени испытуемого
Показатель невербального интеллекта
1. И.А. 111 1. Н.Т. ИЗ
2. К.А. 104 2. О.В. 107
3. К.Е. 107 3. Е.В. 123
4. П.А. 90 4. Ф.О. 122
5. С.А. 115 5. И.Н. 117
6. Ст.А. 107 6. И.Ч. 112
7. Т.А. 106 7. И.В. 105
8. Ф.А. 107 8. К.О. 108
9. Ч.И. 95 9. P.P. 111
10. ЦА. 116 10. Р.И. 114
11. См.А. 127 11. O.K. 102
12. К.Ан. 115 12. Н.К. 104
13. Б.Л. 102
14. Ф.В. 99
Критерий U требует тщательности и внимания. Прежде всего, необходимо помнить
правила ранжирования.
Правила ранжирования
1. Меньшему значению начисляется меньший ранг. Наименьшему значению
начисляется ранг 1.
Наибольшему значению начисляется ранг, соответствующий количеству
ранжируемых значений. Например, если n=7, то наибольшее значение получит ранг 7, за
возможным исключением для тех случаев, которые предусмотрены правилом 2.
2. В случае, если несколько значений равны, им начисляется ранг, представляющий
собой среднее значение из тех рангов, которые они получили бы, если бы не были равны.
Например, 3 наименьших значения равны 10 секундам. Если бы мы измеряли время
более точно, то эти значения могли бы различаться и составляли бы, скажем, 10,2 сек; 10,5
сек; 10,7 сек. В этом случае они получили бы ранги, соответственно, 1, 2 и 3. Но
поскольку полученные нами значения равны, каждое из них получает средний ранг:
Допустим, следующие 2 значения равны 12 сек. Они должны были бы получить
ранги 4 и 5, но, поскольку они равны, то получают средний ранг:
3. Общая сумма рангов должна совпадать с расчетной, которая определяется по
формуле:
где N — общее количество ранжируемых наблюдений (значений).
Несовпадение
__________реальной и расчетной сумм рангов будет свидетельствовать об ошибке, допущенной при
начислении рангов или их суммировании. Прежде чем продолжить работу, необходимо
найти ошибку и устранить ее.
При подсчете критерия U легче всего сразу приучить себя действовать по строгому
алгоритму.
начисляется ранг 1. Наибольшему значению начисляется ранг, соответствующий количеству ранжируемых значений. Например, если n=7, то наибольшее значение получит ранг 7, за
АЛГОРИТМ 4
Подсчет критерия U Манна-Уитни.
1. Перенести все данные испытуемых на индивидуальные карточки.
2. Пометить карточки испытуемых выборки 1 одним цветом, скажем красным, а все
карточки из выборки 2 — другим, например синим.
3. Разложить все карточки в единый ряд по степени нарастания признака, не
считаясь с тем, к какой выборке они относятся, как если бы мы работали с одной большой
выборкой.
4. Проранжировать значения на карточках, приписывая меньшему значению
меньший ранг. Всего рангов получится столько, сколько у нас (n1+п2).
5. Вновь разложить карточки на две группы, ориентируясь на цветные обозначения:
красные карточки в один ряд, синие — в другой.
6. Подсчитать сумму рангов отдельно на красных карточках (выборка 1) и на синих
карточках (выборка 2).
Проверить, совпадает ли общая сумма рангов с расчетной.
7. Определить большую из двух ранговых сумм.
8. Определить значение U по формуле:
где n1 — количество испытуемых в выборке 1;
n2 — количество испытуемых в выборке 2;
Тх — большая из двух ранговых сумм;
nх — количество испытуемых в группе с большей суммой рангов.
9. Определить критические значения U по Табл. II Приложения 1. Если Uэмп.>Uкp 005,
Но принимается. Если Uэмп≤Uкp_005, Но отвергается. Чем меньше значения U, тем
достоверность различий выше.
Подсчет ранговых сумм по выборкам студентов физического и психа-логического факультетов
Студенты-физики (n1=14)
Студенты-психологи (n2=12)
Показатель невербального интеллекта
РангПоказатель невербального интеллекта
Ранг127 26
123 25
122 24
117 23
116 22
115 20,5
115 20,5
114 19
113 18
112 17
111 15,5 111 15.5
108 14′
107 11.5 107 11,5
107 11,5
107 11,5
106 9105 8
104 6.5 104 6,5
102 4,5 102 4,5
99 395 2
90 1Суммы 1501 165 1338 186
Средние 107,2 111,5
Общая сумма рангов: 165+186=351. Расчетная сумма:
Равенство реальной и расчетной сумм соблюдено.
Мы видим, что по уровню невербального интеллекта более «высоким» рядом
оказывается выборка студентов-психологов. Именно на эту выборку приходится большая
ранговая сумма: 186.
Теперь мы готовы сформулировать гипотезы:
H0: Группа студентов-психологов не превосходит группу студентов-физиков по
уровню невербального интеллекта.
Н1: Группа студентов-психологов превосходит группу студентов-физиков по
уровню невербального интеллекта.
В соответствии со следующим шагом алгоритма определяем эмпирическую
величину U:
Поскольку в нашем случае пФп2, подсчитаем эмпирическую величину U и для
второй ранговой суммы (165), подставляя в формулу соответствующее ей пх:
165 108
(14 12) 14 (14 1) − =
⋅ +
= ⋅ + эмп U
Такую проверку рекомендуется производить в некоторых руководствах (Рунион Р.,
1982; Greene J., D’Olivera M., 1989).
Для сопоставления с критическим значением
выбираем меньшую величину U: Uэмп=60.
По Табл. II Приложения 1 определяем критические значения для n1=14, n2=12.
Мы помним, что критерий U является одним из двух исключений из общего правила
принятия решения о достоверности различий, а именно, мы можем констатировать
достоверные различия, если Uэмп≤Uкp
Построим «ось значимости».
Uэмп=60
Uэмп>Uкp
Ответ: H0 принимается. Группа студентов-психологов не превосходит группы
студентов-физиков по уровню невербального интеллекта.
Обратим внимание на то, что для данного случая критерий Q Розенбаума
неприменим, так как размах вариативности в группе физиков шире, чем в группе
психологов: и самое высокое, и самое низкое значение невербального интеллекта
приходится на группу физиков (см. Табл. 2.4).
2. Пометить карточки испытуемых выборки 1 одним цветом, скажем красным, а все карточки из выборки 2 — другим, например синим. 3. Разложить все карточки в единый ряд по степени нарастания признака, не
Критерий Т, вилкоксона и критерий знаков.
Назначение.Критерий T-Вилкоксона применяется для оценки различий экспериментальных данных полученных в двух разных условиях на одной и той же выборке испытуемых. Он позволяет выявить не только направленность изменений (критерий G-знаков), но и позволяет установить насколько сдвиг показателей в каком-то одном направлении является более интенсивным, чем в другом.
Т— критерий Вилкоксона
Назначение критерия
Критерий применяется для сопоставления показателей,, измеренных в двух разных
условиях на одной и той же выборке испытуемых.
Он позволяет установить не только направленность изменений, но и их
выраженность. С его помощью мы определяем, является ли сдвиг показателей в каком-то
одном направлении более интенсивным, чем в другом.
Описание критерия Т
Этот критерий применим в тех случаях, когда признаки измерены по крайней мере
по шкале порядка; и сдвиги между вторым и первым замерами тоже могут быть
упорядочены. Для этого они должны варьировать в достаточно широком диапазоне. В
принципе, можно применять критерий Т и в тех случаях, когда сдвиги принимают только
три значения: —1, 0 и +1, но тогда критерий Т вряд ли добавит что-нибудь новое к тем
выводам, которые можно было бы получить с помощью критерия знаков. Вот если сдвиги
изменяются, скажем, от —30 до +45, тогда имеет смысл их ранжировать и потом
суммировать ранги.
Суть метода состоит в том, что мы сопоставляем выраженность сдвигов в том и
ином направлениях по абсолютной величине. Для этого мы сначала ранжируем все абсолютные величины сдвигов, а потом суммируем ранги. Если сдвиги в положительную и в отрицательную сторону происходят случайно, то суммы рангов абсолютных значений их будут примерно равны. Если же интенсивность сдвига в одном из направлений перевешивает, то сумма рангов абсолютных значений сдвигов в противоположную сторону будет значительно ниже, чем это могло бы быть при случайных изменениях.
Первоначально мы исходим из предположения о том, что типичным сдвигом будет
сдвиг в более часто встречающемся направлении, а нетипичным, или редким, сдвигом —
сдвиг в более редко встречающемся направлении.
по шкале порядка; и сдвиги между вторым и первым замерами тоже могут быть упорядочены. Для этого они должны варьировать в достаточно широком диапазоне.… принципе, можно применять критерий Т и в тех случаях, когда сдвиги принимают только
Гипотезы
Н0: Интенсивность сдвигов в типичном направлении не превосходит интенсивности сдвигов в нетипичном направлении.
H1: Интенсивность сдвигов в типичном направлении превышает интенсивность
сдвигов в нетипичном направлении.
Графическое представление критерия Т
Сдвиги в противоположные стороны мы можем представить себе в виде двух
облаков, как и в критерии знаков. Величина облака зависит не только от количества
соответствующих сдвигов, но и от их интенсивности, отраженной в длине стрелок (Рис.
3.3).
В сущности, облака: противостоят друг пруту, как два воздушных фронта: они не просто соревнуются по величине, они меряются силами! При определенных п, а именно при n≥18, мы вообще можем отказаться от понятия типичного сдвига. Сдвигов в ту и другую сторону может оказаться поровну, но если 9 меньших сдвигов будут относиться к одному направлению, а 9 больших сдвигов — к противоположному, то мы можем констатировать достоверное преобладание этого противоположного направления сдвигов.
Вспомним, что критерий знаков в этом случае не выявил бы никаких достоверных
различий.
облаков, как и в критерии знаков. Величина облака зависит не только от количества соответствующих сдвигов, но и от их интенсивности, отраженной в длине стрелок… 3.3).
В сущности, облака: противостоят друг пруту, как два воздушных фронта: они не просто соревнуются по величине,…
Ограничения в врнменеанн критерия Т Ввлкоксона
1. Минимальное количество испытуемых, прошедших измерения в двух условиях — 5
человек. Максимальное количество испытуемых — 50 человек, что диктуется верхней
границей имеющихся таблиц. Крити-чесхие значения Т приведены в Табл. VI Приложения
2. Нулевые сдвиги из рассмотрения исключаются, и количество наблюдений п
уменьшается на количество этих нулевых сдвигов (McCall R., 1970, р. 36).
Можно обойти
это ограничение, сформулировав гипотезы, включающие отсутствие изменений,
например: «Сдвиг в сторону увеличения значений превышает сдвиг в сторону уменьшения
значений и тенденцию сохранения их на прежнем уровне».
человек. Максимальное количество испытуемых — 50 человек, что диктуется верхней границей имеющихся таблиц. Крити-чесхие значения Т приведены в Табл. VI… 2. Нулевые сдвиги из рассмотрения исключаются, и количество наблюдений п
Пример
В выборке курсантов военного училища (юноши в возрасте от 18 до 20 лет)
измерялась способность к удержанию физического волевого усилия на динамометре.
Сначала у испытуемых измерялась максимальная мышечная сила каждой из рук, а на
следующий день им предлагалось выдерживать, на динамометре с подвижной стрелкой
мышечное усилие, равное 1/2 максимальной мышечной силы данной руки. Почувствовав
усталость, испытуемый должен был сообщить об этом экспериментатору, но не
прекращать опыт, преодолевая усталость и неприятные ощущения — «бороться, пока воля
не иссякнет». Опыт проводился дважды; вначале с обычной инструкцией, а затем, после
того, как испытуемый заполнял опросник самооценки волевых качеств по методике А.Ц.
Пуни (Пуни А.Ц., 1977), ему предлагалось представить себе, что он уже добился идеала в
развитии волевых качеств, и продемонстрировать соответствующее идеалу волевое
усилие. Подтвердилась ли гипотеза экспериментатора о том, что обращение к идеалу
способствует возрастанию волевого усилия? Данные представлены в Табл. 3.5.
Таблица 3.5
Расчет критерия Т при сопоставлении замеров физического волевого усилия
1)Код имени
испытуемого
2)Длительность удержания усилия на динамометре (с)3) Разность
(fпосле— fдо)
4)Абсолютное
значение
разности
5)Ранговый
номер разности
2а)До измерения волевых
качеств и обращения к
идеалу (fдо)
2б)После измерения волевых
качеств и обращения к идеалу
(fпосле)
Г.Кос.Крив.
Кур.Л.М.
Р____.
С.Т.X.
Ю.2а)64
2б)2563
3)- 39
— 27+ 3
— 19- 38
— 8+ 4
— 4- 38
+ 25
— 184)39
5)119,5
2,5
2,59,5
Сумма 66
Для подсчета этого критерия нет необходимости упорядочивать ряды значений по
нарастанию признака. Мы можем использовать алфавитный список испытуемых, как в
данном случае._
_ Первый шаг в подсчете критерия Т — вычитание каждого индивидуального значения
«до» из значения «после»10. Мы видим из Табл. 3.5, что 8 полученных разностей —
отрицательные и лишь 3 — положительные. Это означает, что у 8 испытуемых
длительность удержания мышечного усилия во втором замере уменьшилась, а у 3 —
увеличилась. Мы столкнулись с тем случаем, когда уже сейчас мы не можем сфор-
мулировать статистическую гипотезу, соответствующую первоначальному
предположению исследователя. Предполагалось, что обращение к идеалу будет
увеличивать длительность мышечного усилия, а экспериментальные данные
свидетельствуют, что лишь в 3 случаях из 11 этот показатель действительно увеличился.
Мы можем сформулировать лишь гипотезу, предполагающую несущественность сдвига
этого показателя в сторону снижения.
Сформулируем гипотезы.
Н0: Интенсивность сдвигов в сторону уменьшения длительности мышечного
усилия не превышает интенсивности сдвигов в сторону ее увеличения.
H1: Интенсивность сдвигов в сторону уменьшения длительности мышечного
усилия превышает интенсивность сдвигов в сторону ее увеличения.
На следующем шаге все сдвиги, независимо от их знака, должны быть
проранжированы по выраженности. В Табл. 3.5 в четвертом слева столбце приведены
абсолютные величины сдвигов, а в последнем столбце (справа) — ранги этих абсолютных
величин. Меньшему значению соответствует меньший ранг. При этом сумма рангов равна
66, что соответствует расчетной:__
Теперь отметим те сдвиги, которые являются нетипичными, в данном случае —
положительными. В Табл. 3.5 эти сдвиги и соответствующие им ранги выделены цветом.
Сумма рангов этих «редких» сдвигов и составляет эмпирическое значение критерия Т:
где Rr — ранговые значения сдвигов с более редким знаком.
Итак, в данном случае,
Тэмn=1+2,5+7=10,5
По Таблице VI Приложения 1 определяем критические значения Т для n=11:
Зона значимости в данном случае простирается влево. Действительно, если бы
«редких», в данном случае положительных, сдвигов не было совсем, то и сумма их рангов
равнялась бы нулю. В данном же случае эмпирическое значение Т попадает в зону
неопределенности:
Тэмп<Ткр (0,05)
Ответ: Н0 отвергается. Интенсивность отрицательного сдвига показателя
физического волевого усилия превышает интенсивность положительного сдвига (р<0,05).
Попытаемся графически отобразить интенсивность отрицательных и положительных
сдвигов. На Рис. 3.4 слева сдвиги представлены в секундах, а справа — в своих ранговых
значениях. Мы видим, что ранжирование несколько уменьшает площади сопоставляемых
облаков, или «фронтов».
Таким образом, исследователю придется признать, что продолжительность
удержания мышечного волевого усилия во втором замере снижается, и этот сдвиг
неслучаен. Инструкция, ориентирующая испытуемого на соответствие идеалу в развитии
воли, оказалась гораздо менее мощным фактором, чем какая-то иная сила — возможно,
мышечное утомление, может быть, разочарование в себе или в возможностях данного
психологического эксперимента. А может быть, в момент второго замера просто перестает
действовать какой-то мощный фактор, который был активен вначале? На все эти вопросы
статистические методы не могут ответить, если в схему эксперимента не включена
контрольная группа — в данном случае, выборка, уравновешенная с экспериментальной
группой по всем значимым характеристикам (полу, возрасту, профессии, месту обучения),
у которой просто измерили бы вторично волевое усилие через такой же промежуток
времени, не призывая соответствовать идеалу в развитии воли.
Представим выполненные действия в виде алгоритма:
АЛГОРИТМ 9
Подсчет критерия Т Вилкоксона
1. Составить список испытуемых в любом порядке, например, алфавит-
ном.2. Вычислить разность между индивидуальными значениями во втором и первом
замерах («после» — «до»).
Определить, что будет считаться «типичным» сдвигом и
сформулировать соответствующие гипотезы.
3. Перевести разности в абсолютные величины и записать их отдельным столбцом
(иначе трудно отвлечься от знака разности).
4. Проранжировать абсолютные величины разностей, начисляя меньшему значению
меньший ранг. Проверить совпадение полученной суммы рангов с расчетной.
5. Отметить кружками или другими знаками ранги, соответствующие сдвигам в
«нетипичном» направлении.
6. Подсчитать сумму этих рангов по формуле:
где Rr — ранговые значения сдвигов с более редким знаком.
7. Определить критические значения Т для данного п по Табл. VI Приложения 1.
Если Тэмп меньше или равен Ткр, сдвиг в «типичную» сторону по интенсивности
достоверно преобладает.
ном. 2. Вычислить разность между индивидуальными значениями во втором и первом замерах («после» — «до»).
Определить, что будет считаться «типичным» сдвигом и
Корреляционный анализ. Содержательный смысл и примеры из психологии.
Регрессионный анализ. Содержательный смысл и примеры из психологии.
Дисперсионный анализ. Содержательный смысл и примеры из психологии.
Понятие дисперсионного анализа
Дисперсионный анализ — это анализ изменчивости признака под влиянием каких-
либо контролируемых переменных факторов. В зарубежной литературе дисперсионный
анализ часто обозначается как ANOVA, что переводится как анализ вариативности
(Analysis of Variance).
Автором метода является Р. А. Фишер (Fisher R.A., 1918, 1938).
Задача дисперсионного анализа состоит в том, чтобы из общей вариативности
признака вычленить вариативность троякого рода:
а) вариативность, обусловленную действием каждой из исследуемых независимых переменных;
б) вариативность, обусловленную взаимодействием исследуемых независимых переменных;
в) случайную вариативность, обусловленную всеми другими неизвестными
переменными.
Вариативность, обусловленная действием исследуемых переменных и их
взаимодействием, соотносится со случайной вариативностью. Показателем этого
соотношения является критерий F Фишера1.
В формулу расчета критерия F входят оценки дисперсий, то есть параметров
распределения признака, поэтому критерий F является параметрическим критерием.
Чем в большей степени вариативность признака обусловлена исследуемыми
переменными (факторами) или их взаимодействием, тем выше эмпирические значения
критерия F.
В дисперсионном анализе исследователь исходит из предположения, что одни
переменные могут рассматриваться как причины, а другие — как следствия. Переменные
первого рода считаются факторами, а переменные второго рода — результативными
признаками. В этом отличие дисперсионного анализа от прямолинейного
корреляционного анализа, в котором мы исходим из предположения, что изменения
одного признака просто сопровождаются определенными изменениями другого.
В дисперсионном анализе возможны два принципиальных пути разделения всех
исследуемых переменных на независимые переменные (факторы) и зависимые
переменные (результативные признаки).
Первый путь состоит в том, что мы совершаем какие-либо воздействия на
испытуемых или учитываем какие-либо не зависящие от нас воздействия на них, и именно
эти воздействия считаем независимыми переменными, или факторами, а исследуемые
признаки рассматриваем как зависимые переменные, или результативные признаки. На-
пример, возраст испытуемых или способ предъявления им информации считаем
факторами, а обучаемость или эффективность выполнения задания — результативными
признаками.
Второй путь предполагает, что мы, не совершая никаких воздействий, считаем, что
при разных уровнях развития одних психологических признаков другие проявляются тоже
по-разному. По тем или иным причинам мы решаем, что одни признаки могут
рассматриваться скорее как факторы, а другие — как результат действия этих факторов.
Например, уровень интеллекта или мотивации достижения начинаем считать факторами, а
профессиональную компетентность или социометрический статус — результативными
признаками.
Второй путь весьма уязвим для критики. Допустим, мы предположили, что
настойчивость — значимый фактор учебной успешности студентов. Мы принимаем
настойчивость за воздействующую переменную (фактор), а учебную успешность — за
результативный признак. Против этого могут быть выдвинуты сразу же два возражения.
Во-первых, успех может стимулировать настойчивость; во-вторых, как, собственно,
измерялась настойчивость? Если она измерялась с помощью метода экспертных оценок, а
экспертами были соученики или преподаватели, которым известна учебная успешность
испытуемых, то не исключено, что это оценка настойчивости будет зависеть от известных
экспертам показателей успешности, а не наоборот.
Допустим, что в другом исследовании мы исходим из предположения, что фактор
социальной смелости (фактор Н) из 16-факторного личностного опросника Р.Б. Кеттелла —
это та независимая переменная, которая определяет объем заключенных торговым
представителем договоров на поставку косметических товаров. Но если объем договоров
определялся по какому-то периоду работы, скажем трехмесячному, а личностное
обследование проводилось в конце этого периода или даже после его истечения, то мы не
можем со всей уверенностью отделить здесь причину от следствия. Есть очень сильное
направление в психологии и психотерапии, которое утверждает, что личностные
изменения начинаются с действий и поступков: «Начни действовать, и постепенно
станешь таким, как твои поступки». Таким образом, психолог, представляющий это
направление, возможно, стал бы утверждать, что причиной должен считаться достигнутый
объем договорных поставок, а результатом — повышение социальной смелости.
Только наше исследовательское чутье может подсказать нам, что должно
рассматриваться как причина, а что — как результат. Однако не всегда эти ощущения у
разных исследователей совпадают, поэтому нужно быть готовым к тому, что наши
выводы могут быть оспорены другими специалистами, которые рассматривают данный
предмет с иной точки зрения и видят в нем иные перспективы. Впрочем, спорность
выводов — постоянный спутник психологического исследования.
Постараемся быть оптимистичными и представим себе, что существует все же какое-
то совпадение взглядов на психологические причины и следствия. На Рис. 7.1
представлены два варианта рассеивания показателей учебной успешности в зависимости
от уровня развития кратковременной памяти. Из Рис. 7.1(а) мы видим, что при низком
уровне развития кратковременной памяти оценки по английскому языку, похоже,
несколько ниже, чем при среднем, а при высоком уровне выше, чем при среднем. Похоже,
что кратковременная память может рассматриваться как фактор успешности овладения
английским языком. С другой стороны, Рис. 7.1(6) свидетельствует о том, что успешность
в чистописании вряд ли так же определенно зависит от уровня развития кратковременной
памяти.
О том, верны ли наши предположения, мы сможем судить только после вычисления
эмпирических значений критерия F.
либо контролируемых переменных факторов. В зарубежной литературе дисперсионный анализ часто обозначается как ANOVA, что переводится как анализ… (Analysis of Variance).
Автором метода является Р. А. Фишер (Fisher R.A., 1918, 1938).
Рис. 7.1. Рассеивание индивидуальных средних оценок по английскому языку (а) и чистописа-
Нию (б) у учеников с низким, средним и высоким уровнями развития кратковременной памяти
Низкий, средний и высокий уровни развития кратковременной памяти можно
рассматривать как градации фактора кратковременной памяти.
Нулевая гипотеза в дисперсионном анализе будет гласить, что средние величины
исследуемого результативного признака во всех градациях одинаковы.
Альтернативная гипотеза будет утверждать, что средние величины результативного
признака в разных градациях исследуемого фактора различны.
В зарубежных руководствах чаще говорят о переменных, действующих в разных
условиях, а не о факторах и их градациях.
Дело в том, что градация подразумевает ступень, стадию, уровень развития. Говоря о
градациях фактора, мы явно или неявно подразумеваем, что сила его возрастает при
переходе от градации к градации. Между тем, схема дисперсионного анализа применима и
в тех случаях, когда градации фактора представляют собой номинативную шкалу, то есть
отличаются лишь качественно. Например, градациями фактора могут быть: параллельные
формы экспериментальных заданий; цвет окраски стимулов; жанр музыкальных
произведений, сопровождающих процесс работы; традиционные или специально
подобранные православные тексты в сеансах аутогенной тренировки; разные формы
заболевания; разные экспериментаторы; разные психотерапевты и т. д.
Если градации фактора различаются лишь качественно, их лучше называть условиями действия фактора или переменной. Например, действие аутогенной тренировки при условии использования текстов православных молитв или эффективность
психокоррёкционных воздействий при разных формах хронических заболеваний у детей3.
Экспериментальные данные, представленные по градациям фактора, называются
дисперсионным комплексом. Данные, относящиеся к отдельным градациям — ячейками
комплекса.
Дисперсионный анализ позволяет нам констатировать изменение признака, но при
этом не указывает направление этих изменений. Нам необходимо специально графически
представлять полученные данные по градациям фактора, чтобы получить наглядное
представление о направлении изменений.
Подобного рода задачи, как мы помним, позволяют решать непараметрические
методы сравнения выборок или условий измерения, а именно критерий Н. Крускала-
Уоллиса и критерий Фридмана. Однако это касается только тех задач, в которых исследуется действие одного фактора, или одной переменной. Задачи
однофакторного дисперсионного анализа, действительно, могут эффективным образом
решаться с помощью непараметрических методов. Метод дисперсионного анализа
становится незаменимым только когда мы исследуем одновременное действие двух (или более) факторов, поскольку он позволяет выявить взаимодействие факторов в их влиянии на один и тот же результативный признак. Именно эти возможности двухфакторного дисперсионного анализа послужили причиной, по которой изложение этого метода включено в настоящее руководство.
Несмотря на то, что нас интересует прежде всего двухфакторный дисперсионный
анализ, который нельзя заменить другими методами, начнем рассмотрение мы с
однофакторного дисперсионного анализа: во-первых, для того, чтобы выдержать
определенную последовательность и логику в изложении; во-вторых, для того, чтобы на
реальном примере продемонстрировать возможность замены этого метода непараметриче-
скими методами.
Итак, начнем рассмотрение дисперсионного анализа с простейшего случая, когда
исследуется действие только одной переменной (одного фактора).
Исследователя
интересует, как изменяется определенный признак в разных условиях действия этой
переменной. Например, как изменяется время решения задачи при разных условиях моти-
вации испытуемых (низкой, средней, высокой) или при разных способах предъявления
задачи (устно, письменно, в виде текста с графиками и иллюстрациями), в разных
условиях работы с задачей (в одиночестве, в одной комнате с экспериментатором, в одной
комнате с экспериментатором и другими испытуемыми) и т.п. В первом случае
переменной, влияние которой исследуется, является мотивация, во втором — степень
наглядности, в третьем — фактор публичности.
Преимущество однофакторного дисперсионного анализа по сравнению с
непараметрическими методами Н Крускала-Уоллиса и Фридмана — неограниченность в
объемах выборок. Ограничения дисперсионного анализа достаточно условны__
рассматривать как градации фактора кратковременной памяти. Нулевая гипотеза в дисперсионном анализе будет гласить, что средние величины … исследуемого результативного признака во всех градациях одинаковы.
Факторный анализ. Содержательный смысл и примеры из психологии.
Зачем и почему нужна математика психологу.