14.02.13
Семинар N 1
Темы для конспектов:
1. История развития основных направлений математической психологии.
2. Предмет, объект и основной метод, исследуемый в математической психологии.
3. Современные направления математической психологии.
4. Основные понятия математической психологии.
5. Построение проблем в психолого-педагогическом исследовании.
6. Проведение пилотажного исследования.
7. Общие сведения о планировании эксперимента.
8. Статистическая обработка результатов психологического исследования.
9. Интерпретация результатов статистического исследования.
Литература:
1) Образцов П.И. «Методы и методология психолого-педагогического исследования». Москва, 2004 г.
2) Сочивко Д.В., Якунин В.А. «Математические модели в психолого-педагогических исследованиях». Москва, 1990г.
3) Математическая психология. Методология, теория, модели. Москва, 1985г.
Задача:
По итогам обучения часть студентов получает красные дипломы. Можно предположить, что некоторые ВУЗы, стремясь повысить свой статус, выдают приблизительно одинаковое число дипломов, независимо от численности статусов. Рассчитайте коэффициент корреляции между этими признаками. Позволяет ли коэффициент корреляции сделать вывод о том, что для красных дипломов различных ВУЗов с разным числом студентов…. (?)
Число студентов (x) | Доля красных (y) |
2,3% | |
3,3% | |
2,6% | |
2,7% | |
2,1% | |
2,9% | |
2,8% |
x | y | Xi Yi | X22 | Y22 |
2712 — 4972,86 = 2260,86 | 2,3 — 2,67 = -0,37 | 836,52 | (-2260,82)2 = 5111487,94 | (-0,37)2 = 0,1369 |
3227,14 | 3,3 – 2,67 = 0,63 | 2033,09 | (3227,14)2 = 10414432,5 | 0,632 = 0,3969 |
406,86 | 2,6 – 2,67 = -0,07 | 28,7 | (409,86)2 = 167985,22 | (-0,07)2 = 0,0049 |
5322 – 4972,86 = 349,14 | 2,7 – 2,67 = 0,03 | 10,47 | (349,14)2 = 121898,74 | 0,032 = 0,0009 |
1717 – 4972 = -3255,86 | 2,1 – 2,67 = -0,57 | 1855,84 | (-3255,86)2 = 10600624,34 | (-0,57)2 = 0,3249 |
6340 – 4972 = 1367,14 | 2,9 – 2,67 = 0,23 | 314,44 | (1367,14)2 = 1869071,78 | 0,232 = 0,0529 |
5956 – 4972 = 983,14 | 2,8 – 2,67 = 0,13 | 127,8 | (983,14)2 = 966564260 | 0,132 = 0,0169 |
x̅ = 4972,86 | y̅ = 2,67 | ΣXiYi = 5206,86 | ΣX2 = 2925206486 | ΣY2 = 0,9343 |
1. История развития основных направлений математической психологии. 2. Предмет, объект и основной метод, исследуемый в математической… 3. Современные направления математической психологии.
Конспект 1
Основные понятия в математической статистике.
Важную роль в анализе многих психолого-педагогических явления играют средние величины, представляющие собой обобщённую характеристику качественно однородной совокупности по определённому количественному признаку. Нельзя, например, вычислить среднюю специальность и национальность — это качественно разнородные явления. Зато можно и нужно определять среднюю специальность или среднюю количественную характеристику их успеваемости (средний балл), эффективности методологических систем и приёмов и т.д.
В психолого-педагогических исследованиях обычно применяются различные виды средних величин: средняя арифметическая, средняя геометрическая, медиана, мода и другие.
Средняя арифметическая.
Применяется в тех случаях, когда между определяющим свойством и данным признаком имеется прямо пропорциональная зависимость (например, при улучшении показателей работы ученой группы улучшаются показатели каждого её числа).
Средняя арифметическая представляет собой частное от деления суммы величин, на их число:
x̅ = x1 + x2 + x3 + … + xn= ΣX1
N N
Медианой (Ме)называется мера среднего положения, характеризующая значение признака на упорядоченной (построенной по признаку возрастания или убывания) шкале, которое соответствует середине исследуемой совокупности.
Медиана может быть определена для порядковых и количественных признаков. Место расположения этого значения определяется по формуле:
N+1
Мода (Мо)– наиболее часто встречающееся типичное значение признака среди других значений. Она соответствует классу с максимальной частотой. Этот класс называется модальным значением.
Большое значение при использовании в психолого-педагогическом исследовании математических методов уделяется расчёту дисперсии.
Дисперсия равна среднему квадрату отклонений значения исследуемой переменной от среднего значения. Она выступает как одна из характеристик индивидуальных результатов/разброса значений исследуемой переменной (например, оценок учащихся вокруг среднего значения).
Значение дисперсии используется в различных статистических расчётах, но не имеет непосредственного наблюдаемого характера.
Величиной непосредственно связанной с содержанием наблюдаемой переменной является среднее квадратическое отклонение. Среднее квадратическое отклонение подтверждает типичность и показательность средней арифметической, отражает меру колебания численных значений, признаков, из которых выводится средняя величина.
Средняя арифметическая и средняя квадратическая являются основными характеристиками полученных результатов в ходе исследования. Они позволяют обобщить данные, сравнить их, установить преимущества одной психолого-педагогической системы (программы) над другой. Меры связи между переменными. Связи между двумя и более переменными в статистике называются корреляциями. Они оцениваются с помощью значения коэффициента корреляции, который является мерой степени и величины этой связи.
Статистическая проверка научной гипотезы.
Доказательство статистической достоверности экспериментального влияния существенно отличается от доказательства в математике и формальной логике, где выводы носят более универсальный характер. Статистические доказательства не являются столь строгими и окончательными – в них всегда допускается риск ошибиться в выводах, и поэтому статистическими методами не доказываются окончательно правомерность того или иного вывода, а показывается лишь мера правдоподобности принятия той или иной гипотезы.
Пед-я гипотеза (научное предположение о преимуществе того ил иного метода) в процессе статистического анализа переводится на язык статистической науки и заного формируется, по меньшей мере в виде 2-х статистических гипотез.
Первая (основная) – нулевая гипотеза, в которой исследователь говорит о своей исходной позиции.
Альтернативная гипотеза – делается предположительно о преимуществе нового метода.
Многомерные методы анализа данных.
Анализ взаимосвязи, между большим кол-вом переменных осуществляющийся путём использования многомерных методов статистической обработки. Цель применения подобных методов – обнаружить скрытые закономерности, выделить наиболее существенные взаимосвязи между переменными.
Факторный анализ заключается в выявлении и интерпретации факторов. Фактор – обобщённая переменная, которая позволяет свернуть часть информации(?).
Кластерный анализ позволяет выделить иерархию взаимосвязанных признаков.
Дисперсионный анализ – статистический метод, используемый для изучения 1-й или нескольких одновременно действующих и независимых переменных на изменчивость наблюдаемого признака.
Регрессионный анализ позволяет выявлять количественную (численную) зависимость среднего значения изменений результатного признака от изменений одного или нескольких признаков.
Как правило, данный вид анализа применяется в том случае, когда требуется выяснить, насколько изменяется средняя величина одного признака или при изменении на единицу другого признака.
Пед-я гипотеза (научное предположение о преимуществе того ил иного метода) в…
Латентно-структурный анализ.
Представляет совокупность аналитико-статистических процедур, выявление скрытых переменных (признаков), а также внутренней структуры, связей между ними.
Многомерное шкалирование обеспечивает наглядную оценку сходства или различия между некоторыми объектами, описываемыми большим количеством разнообразных переменных.
Образцов П.И. «Методы и методология психолого-педагогического исследования».
21.02.13
Семинар N 2
Темы для рефератов:
1. Типы шкал (Я) – Крылов – 46-50 стр.
2. Измерительные шкалы.
3. Порядковые и интервальные измерения.
4. Измерения отношений.
5. Переменные и их измерение.
6. Символы, данные и операции.
7. Этапы многомерного шкалирования.
8. Применение многомерного шкалирования.
Литература:
1) Гласс и Стедли «Статистические методы в педагогике и психологии». Москва 1976г.
2) Дойвисон «Многомерное шкалирование. Методы наглядного представления данных». Москва 1988г.
3) Крылов В.Ю. «Геометрические представление данных в психологических исследованиях». Москва, 1990г.
Задача:
Была исследована группа детей с заболеванием крови до лечения и после. Сделайте сравнительный анализ результативности лечения.
t = _____2,26 – 3,38_____(*) = _________-1,12_________ (*) = __-1,12__ (*) = -0,73
10,5654/14 + 7,9382/14 0,053905112 + 0,04050102 0,09440612
1. Типы шкал (Я) – Крылов – 46-50 стр. 2. Измерительные шкалы. 3. Порядковые и интервальные измерения.
14 14
(*) – означает, что нижняя часть уравнения находится под корнем.
N п/п | До лечения | После лечения | |||
4,2 | 2,65 | ||||
2,38 | |||||
2,33 | 3,5 | ||||
2,4 | 3,5 | ||||
1,8 | 4,8 | ||||
0,8 | |||||
3,7 | |||||
2,1 | 4,12 | ||||
2,8 | 4,2 | ||||
1,46 | 2,89 | ||||
3,85 | 3,7 | ||||
1,64 | 2,58 | ||||
2,6 | 3,2 | ||||
1,7 | 2,1 | ||||
Xi1 (до лечения) | Xi2 (после лечения) | Xi12 | Xi22 | ||
1,94 = 4,2 – 2,26 | 2,65 – 3,38 = -0,73 | 1,942 = 3,7636 | (-0,73) 2 = 0,5329 | ||
-0,26 = 2 – 2,26 | 2,38 – 3,38 = -1 | (-0,26)2 = | (-1) 2 = 1 | ||
0,07 – 2,33 – 2,26 | 3,5 – 3,38 = 0,12 | (0,07)2 = 0,0049 | 0,122 = 0,0144 | ||
0,14 = 2,4 – 2,26 | 3,5 – 3,38 = 0,12 | (0,14) 2 = 0,0196 | 0,122 = 0,0144 | ||
-0,46 = 1,8 – 2,26 | 4,8 – 3,38 = 1,42 | (-0,46) 2 = 0,2116 | 1,422 = 2,0164 | ||
-1,46 = 0,8 – 2,26 | 4 – 3,38 = 0,62 | (-1,46) 2 = 2,1316 | 0,622 = 0,3844 | ||
-0,26 = 2 – 2,26 | 3,7 – 3,38 = 0,32 | (-0,26) 2 = 0,0676 | 0,322 = 0,1024 | ||
-0,16 = 2,1 – 2,26 | 4,12 – 3,38 = 0,74 | (-0,16) 2 = 0,0256 | 0,742 = 0,5476 | ||
0,54 = 2,8 – 2,26 | 4,2 – 3,38 = 0,82 | 0,542 = 0,2916 | 0,822 = 0,6724 | ||
-0,8 = 1,46 – 2,26 | 2,89 – 3,38 = -0,49 | (-0,8) 2 = 0,64 | (-0,49) 2 = 0,2401 | ||
1,59 = 3,85 – 2,26 | 3,7 – 3,38 = 0,32 | 1,592 = 2,5281 | 0,322 = 0,1024 | ||
-0,62 = 1,64 – 2,26 | 2,58 – 3,38 = -0,8 | (-0,62) 2 = 0,3844 | (-0,8) 2 = 0,64 | ||
0,34 = 2,6 – 2,26 | 3,2 – 3,38 = -0,1 | 0,342 = 0,1156 | (-0,1) 2 = 0,01 | ||
— 0,56 = 1,7 – 2,26 | 2,1 – 3,38 = -1,28 | (-0,56) 2 = 0,3136 | (-1,28) 2 = 1,6384 | ||
x̅i = 2,26 | x̅2 = 3,38 | Xi12 = 10,5654 | Xi22 = 7,9382 | ||
Поскольку значение t = 3,73, для 27 степеней свободы по модулю табличного значения = p<1,001, то есть вероятность погрешности не превышает 0,1%. Это значит, что действуют существующие различия между значениями до и после лечения. Или существует терапевтический эффект на уровне статистической значимости P<0,001.
Конспект 2.
«Типы шкал» Крылов В.Ю.
«Геометрическое представление данных в психологических исследованиях», Москва 1990.
Порой проблемой, которая возникает в случае применения любых количественных методов исследования в психологии, является проблема измерения величин, характеризующих психические явления. Общая концепция измерения впервые была в достаточно развитом виде сформулирована Д.Скоттом и П.Саппесом. В последнее время общая теория измерений интенсивно развивается И.Пфанцаглем.
Общая концепция измерения существенно использует понятие реляционной системы (системы с отношениями), введённой Тарским. Существуют следующие типы шкал, известные в теории психических измерений:
Шкала наименований определяется следующим образом. Пусть А = — эмпирическая реляционная система с отношением эквивалентности, а N = — числовая реляционная система, с отношением равенства. Взаимно однозначное отображение A = на N = , называется шкалой наименований, она определяется с точностью до эквивалентности.
Шкала порядковопределяется следующим образом.
Эмпирическая релационная система A называется шкалируемой шкалой порядка, если и только если существует N – представление для A и выполнены следующие 2 условия:
1) для любой монотонно возрастающей функции f (φ) тоже является N-представлением для A.
2) для любых двух N-представлений функции психологической эмпирической реляционной (ДАЧТОВООБЩЕЭТОЗНАЧИТВСЁ O_o!?) системы A существует монотонно возрастающая функция f, чтоψß (пси) = f (ф)ßфи
Таким образом, шкала порядка определена с точностью до монотонно возрастающих непрерывных преобразований.
Шкала интервалов определяется следующим образом.
Эмпирическая реляционная система А называется шкалируемой шкалой интервалов если и только если выполнены следующие два условия:
1) если ф есть N-представление для А, то ф (фи) = α ф (фи) + β, где α (альфа) > 0 – любые, β (бета) – любое вещественное, тоже явл. N-представлением для A.
2) для любых двух N-представлений ф (фи) и пси эмпирической реляционой системы А существуют такие α>0 и вещественнее ρ,что ψ пси =α (альфа) ф(фи) + β(бета).
Таким образом, мы имеем фигню, понятную, кажется, только автору, шкала интервалов определена с точностью до преобразований сдвига на β (выбора нуля шкалы) и подобия коэффициентом α > 0 (выбора масштаба или единицы измерения).
Шкала отношений определяется следующим образом.
Эмпирическая реляционная система А, называется шкалируемой шкалой отношений если только существует N-представление для А и выполнены следующие два условия:
1) если ф (фи) есть N-представление для А, то (пси) = (альфа)(фи), где (альфа) > 0 любое, также является N-представлением для А.
2) для любых (альфа) N – представлений (фи) и (пси) эмпирической реляционной системы А существует (альфа) > 0, что (пси)=(альфа)(фи)
(И почему у меня такое чувство, что я переписал одно и тоже место 3 раза подряд?)
Таким образом, шкала отношений определена с точностью до преобразования подобия с коэффициентом (альфа) > 0, т.е. с точностью до изменения масштаба или выбора единицы измерения.
Заметим, что шкала называется многомерной (n-мерной) если в качестве области часовой системы N выбирается n-ая декартова прямая степень вещественной оси.
Некоторые авторы (особенно по отношениям к физическим измерениям) предлагают определять тип шкалы в соответствии с постановлением генеральной ассамблеи ООН… (шутка хьюмора :P).. с допустимыми эмпирическими операциями. Так, например, для определения веса предлагается использовать операцию сложения весов, реализуемую эмпирически с помощью весов. Веса двух объектов положенных на различные чашки весов, считаются равными, если чашки весов находятся в равновесии. Если на одну чашку весов положено несколько объектов, то их вес считается равным сумме весов. Это последнее аддитативности веса позволяет производить взвешивание при помощи объектов имеющих вес, принятый в качестве эталонного.
Чтобы взвесить данный объект нужно произвести следующую операцию: положив объект на одну чашку весов, класть на другую столько эталонных объектов (гирь), сколько понадобится для того, чтобы весы уравновешивались. Тогда вес объектов будет равен сумме весов эталонных объектов (гирь).
Выбор эталонного объекта произволен. Нулевой вес приписывается отсутствию объекту на чашке весов. Таким образом, шкала в которой измеряется вес, является шкалой отношений.
Однако в психологии такой подход не применим, т.к. исследователя интересуют не свойства стимулов, а то, как субъект воспринимает эти свойства, т.к. реакции субъекта на стимул.
«Геометрическое представление данных в психологических исследованиях», Москва 1990. Порой проблемой, которая возникает в случае применения любых количественных методов исследования в психологии,…
28.02.13
Семинар N 3
Тест N 4.
1.б2. а
3. б4. г
5. в6. а
7. г8. в
9. б10. в
11. г12. г
13. д14. в
15. г16. б
17 . б
18. а19. д
20. б21. в
22. г23. д
Лирическое отступление:
На безобразных зимних перекрестках
Ещё лежал позавчерашний снег,
Он не любил весенних теплых нег,
Но уберечься было так непросто!
Белы крупинки снежные, легки,
Но холодны у них прикосновенья,
Веселый дождь собрал в одно мгновенье
Их всех и разбросал по дну реки.
Оставив город без ночных гирлянд,
Дождь улицы, старясь, вымыл нежно.
Есть что-то в этой черноте бесснежной
Весны пронзительный и ясный взгляд.
Андрей Крюков «Ясный взгляд весны»
Задача:
Определите взаимоотношение между двумя переменными «рост» и «самоуважение».
N п/п | Рост | Самоуважение |
166,6 | 4,1 | |
4,6 | ||
3,8 | ||
183,7 | 4,4 | |
3,2 | ||
3,1 | ||
3,8 | ||
166,6 | 4,1 | |
4,3 | ||
3,7 | ||
166,6 | 3,5 | |
3,2 | ||
154,4 | 3,7 | |
3,3 | ||
3,4 | ||
154,4 | 4,0 | |
159,3 | 4,1 | |
3,8 | ||
3,4 | ||
149,5 | 3,6 |
r = 66,6 (*) = _66,6_ (*) = _66,6_ = 0,74
3,41 * 2345,42 7997,88 89,43
n = 20, 0,74 > 0,679, значит погрешность меньше 0,001% à мы получим статистически достоверный результат. Существует взаимосвязь между ростом и взаимоуважением, т.е. рост положительно коррелирует с самоуважением.
xi | yi | XiYi | Yi2 | Xi2 |
166,6 – 159,86 = 6,74 | 744,1 – 3,75 = 0,35 | 2,3625 | (0,35)2 = 0,1225 | 45,5625 |
174 – 159,86 = 14,14 | 4,6 – 3,75 = 0,85 | 12,0275 | (0,85)2 = 0,7225 | 200,2225 |
152 – 159,86 = -7,86 | 3,8 – 3,75 = 0,05 | -0,3925 | (0,05)2 = 0,0025 | 61,6225 |
183,7 – 159,86 = 23,84 | 4,4 – 3,75 = 0,65 | 15,5025 | (0,65)2 = 0,42 | 568,8225 |
142 – 159,85 = -17,86 | 3,2 – 3,75 = 0,55 | 9,8175 | (-0,55)2 = 0,30 | 318,6225 |
147 – 159,86 = -12,86 | 3,1 – 3,75 = -0,65 | 8,36525 | (-0,65)2 = 0,42 | 165,1225 |
164 – 159,86 = 4,14 | 3,8 – 3,75 = 0,05 | 0,2075 | (0,05)2 = 0,0025 | 17,2225 |
166,6 – 159,86 = 6,74 | 4,1 – 3,75 = 0,35 | 2,3625 | (0,35)2 = 0,12 | 45,5625 |
174 – 159,86 = 14,14 | 4,3 – 3,75 = 0,55 | 7,7825 | (0,55)2 = 0,30 | 200,2225 |
169 – 159,86 = 9,14 | 3,7 – 3,75 = -0,05 | -0,4605 | (-0,05)2 = 0,0025 | 83,7225 |
166,6 – 159,86 = 6,74 | 3,5 – 3,75 = -0,25 | -1,6975 | (-0,25)2 = 0,06 | 45,5625 |
164 – 159,86 = 4,14 | 3,2 – 3,75 = -0,55 | -2,2825 | (-0,55)2 = 0,30 | 17,2225 |
154,4 – 159,86 = -5,46 | 3,7 – 3,75 = -0,05 | 0,2725 | (-0,05)2 = 0,0025 | 29,7025 |
152 – 159,86 = -2,86 | 3,3 – 3,75 = -0,45 | 3,5325 | (-0,45)2 = 0,20 | 61,6225 |
147 – 159,86 = -12,86 | 3,4 – 3,75 = 0,35 | 4,50 | (-0,35)2 = 0,12 | 165,1225 |
154,4 – 159,86 = -5,46 | 4,0 – 3,75 = 0,25 | 1,3625 | (0,25)2 = 0,06 | 29,7025 |
159,3 – 159,86 = -12,86 | 4,1 – 3,75 = 0,35 | 0,1925 | (0,35)2 = 0,12 | 0,3025 |
164 – 159,86 = 4,14 | 3,8 – 3,75 = 0,35 | 0,2075 | (0,05)2 = 0,0025 | 17,2225 |
147 – 159,86 = -12,86 | 3,4 – 3,75 = -0,35 | 4,4975 | (-0,35)2 = 0,12 | 165,1225 |
149,5 – 159,86 = -10,36 | 3,6 – 3,75 = -0,15 | 1,6275 | (-0,15)2 = 0,02 | 117,7225 |
x̅ = 159,86 | y̅ = 3,75 | ΣXiYi = | ΣYi2 = 3,4125 | ΣXi2 = |
1.б 2. а 3. б
7.03.13
Семинар N 4
Меры центральной тенденции и показатели вариации.
Темы для конспектов:
1. Мода. Соглашение о использовании моды.
2. Медианы. Вычисление медианы.
3. Вычисление и интерпретация моды, медианы и среднего.
4.5. Дисперсия и её свойства.
6. Выбор меры центральной тенденции.
Задача:
Для проверки эффективности новой развивающей программы были созданы 2 группы детей 6-летнего возраста. Экспериментальная группа занималась по новой программе, а контрольная – по старой. После эксперимента детей протестировали. Можно ли утверждать, что новая программа более эффективна, чем старая?
N n/n | Экспериментальн. гр. | Контрольн. гр. | N n/n | Экспериментальн. гр. | Контрольн. гр. |
Xi1 | Xi2 | Xi12 | Xi22 |
12 – 11,81 = 0,19 | 0,04 | ||
1,19 | 1,42 | ||
— 1,81 | 3,28 | ||
— 3,81 | 14,52 | ||
1,19 | 1,42 | ||
0,19 | 0,04 | ||
3,19 | -1 | 10,18 | |
0,19 | -1 | 0,04 | |
-1,81 | 3,28 | ||
-0,81 | 0,66 | ||
1,19 | 1,42 | ||
-0,81 | 0,66 | ||
-0,81 | 0,66 | ||
2,19 | -4 | 4,8 | |
-0,18 | 0,66 | ||
1,19 | 1,42 | ||
x̅1 = 11,81 | x̅2 = 13 | ΣXi12 = 44,44 | ΣXi22 = 26 |
t = |X — X| = __|11,81 – 13|____ = |-1,19|_ = 1,19 = -0,27
m12 + m22 (*) 44,44/16 + 26/16 (*) 0,17 + 0,1(*) 0,52
Темы для конспектов: 1. Мода. Соглашение о использовании моды.
16 16
df – (n1 + n2 – 1) = 31, p — 0,27 > 0, значит p<0,05 => новая программа эффективней старой.
Локин. «Биометрия». Москва 1990, стр 46 – 49.
Конспект 3.
Дисперсия и её свойства S2, σ2.
Несмотря на явное преимущество среднего линейного отклонения перед лимитами и размахом вариации, этот показатель не получил широкого применения в биометрии. Наиболее подходящий показатель, построенный не на отклонениях вариант от их средних, а на квадратах этих отклонений, его называют дисперсией (лат. dispersio – рассеяние) и выражают формулами:
Sx2 = Σfi (xi –x̅)2
n
Несмотря на явное преимущество среднего линейного отклонения перед лимитами и…
Или
Sx2 = Σi=f (xi – x̅)2
n
r
где Σ i=f— знак суммирования произведений отклонений вариант xi от их средней на веса или частоты fi этих отклонений в пределах от первого до f-го класса; n-общее число наблюдений. Индекс x y символа дисперсии обозначает, что этот показатель характеризует варьирование числовых значений признака вокруг их средней величины.
Ценность дисперсии заключается в том, что являясь мерой варьирования числовых значений признака вокруг их средней арифметической она измеряет и внутреннего изменчивость значений признака зависящую от разностей м/у наблюдениями.
Преимущество дисперсии перед другими показателями вариации состоит также и в том, что она разлагается на составные компоненты, позволяя тем самым оценивать влияние различных факторов на величину учитываемого признака.
Вместе с тем установлено, что рассчитывается по формуле дисперсия оказывается смещённой по отношении к своему генеральному параметру на величину, равную n / (n-1)
Чтобы получить несмещённую дисперсию, нужно в формулу ввести в качестве множителя поправку на смещённость, называемую поправкой Бесселя.
В лез. формула преобр. след. обр.:
Sx2 = Σi=f (xi – x̅)2 * _n_ = Σi=f (xi – x̅)2
n n – 1 n — 1
Разность n – 1, обозначаемую в дальнейшей строчной буквой латинского алфавита K, называют число степеней свободы, пд которым понимают, число свободную варьирующ. единиц в составе численно ограниченной статистической совокупности.
Так, если совокупность состоит из n-го числа членов и характеризуются средней величиной x̅, то любой член этой совокупности может иметь какое угодно значение, не измеряя при этом среднюю x̅, кроме одной варианты, значение которых определяется разностью между суммой значений всех остальных вариантов и величиной n*x̅, следовательно, 1 варианта численно ограниченной статистической ограниченной статистической совокупности не имеет свободы вариации. Отсюда число степеней свободы для такой совокупности будет равно её объёму и без единицы, т.е. k = n-1. А при наличии не одного, а нескольких ограничений свободы вариации, число степеней свободы вариации будет = k=n-v (ню), где v(ню) обознач. число ограничений свободы вариации.
Дисперсия обладает рядом важных свойств, из которых необходимо отметить следующие:
1. Если каждому варианту совокупности уменьшить или увеличивать на одно и то же постоянно число А, то дисперсия уменьшиться или увеличится в А2 р. При наличии в совокупности многозначных вариантов их можно сократить на какое-то постоянное число А и по результатам вычислить дисперсию. Затем полученную величину умножить на квадрат общего делителя А – что даст в сколько величину дисперсии.
7.03.13
Семинар N 5
Темы для конспектов:
1. Матрица, векторы
2. Сложение и умножение векторов
3. Транспонирование матриц.
4. Сложение и вычислительные матрицы.
5. Матрица умножения
6. Вращения и матрицы приобретений.
7. Ортогональность. Ортогональные матрицы.
8. Решение матричных уравнений.
9. Обратная матрица. Определители.
10. Некомутативность. Ассоциативность V.
Лит-ра:
1) Беллиан Р – «Введение в теор. матриц». Москва 1969 г (42-43)
2) Дейвисон М – «Многомерное шкалирование. Методы наглядного представления данных». Моква 1988 г.
3) Иберла К. «Факторный анализ», Москва 1980 г.
Исследователи группы детей с заболеваниями крови до лечения и после лечения. Определ. результат лечения данными препаратом.
N п/п | До лечения | После | N п/п | До лечения | После | |
20,5 | 2,3 | 8,7 | 4,7 | |||
12,1 | 7,5 | 3,5 | 3,9 | |||
13,6 | 3,8 | 13,8 | 4,8 | |||
40,5 | 3,8 | 7,4 | 5,7 | |||
9,6 | 4,8 | 29,4 | ||||
8,8 | ||||||
77,2 | 21,9 | 0,9 | ||||
t = __________29,09 – 6,14________ = ___ 22,95_____ = 2,82
12822,28 / 14 + 175,28 / 14(*) 65,42 + 0,89
14 14
2,82 > 2,779, значит, p < o,o1 => лечение эффективно.
Xi1 (до лечения) | Xi2 (после лечения) | Xi12 | Xi22 |
20,5 – 29,09 = -8,59 | 2,3 – 6,14 = -3,84 | (-8,59)2 = 73,7881 | (-3,84)2 ~ 14,75 |
12,1 – 29,09 = -16,99 | 7,5 – 6,14 = 1,36 | 288,6601 | ~ 1,85 |
13,6 – 29,09 = -15,49 | 3,8– 6,14 = -2,34 | 239,9401 | ~5,48 |
40,5 – 29,09 = 11,41 | 3,8 – 6,14 = -2,34 | 130,1881 | ~ 5,48 |
9,6 – 29,09 = -19,49 | 4,8 – 6,14 = -1,34 | 379,8601 | ~ 1,80 |
33 – 29,09 = 3,91 | 8,8 – 6,14 = 2,66 | 15,2881 | ~ 7,08 |
77,2 – 29,09 = 48,11 | 13 – 6,14 = 6,86 | 2314,5721 | ~ 47, 06 |
8,7 – 29,09 = -25,59 | 4,7 – 6,14 = -1,44 | 419,7521 | ~ 2,07 |
13,8 – 29,09 = -15,25 | 3,9 — 6,14 = -2,24 | 654,8481 | ~5,02 |
7,4 – 29,09 = -21,69 | 4,8 – 6,14 = -1,34 | 233,7841 | ~1,79 |
29,4 – 29,09 = 0,31 | 5,7 – 6,14 = -0,44 | 470,4561 | ~ 0,2 |
(нет записи) | 9 – 6,14 = 2,86 | 0,0961 | ~8,18 |
116 – 29,09 = 0,31 | 13 – 6,14 = 6,86 | 7553,3481 | ~47,06 |
21,9 – 29,09 = -7,19 | 0,9 – 6,14 = -5,24 | 51,6961 | ~27,46 |
x̅1 = -29,09 | x̅2 = 6,14 | ΣXi12 = 12822,2773 | ΣXi22 = 175,28 |
Беллиан Р. «Введение в теоретическую матрицу», Москва 1699 г (стр. 42-43)
1. Матрица, векторы 2. Сложение и умножение векторов 3. Транспонирование матриц.
Конспект 4
Некоммутативность. Ассоциативность.
Одним из интереснейших (!) свойств матриц, делающих их изучение таким увлекательным (!!), является то, что произведение матриц некоммутативно. Иными словами, в общем случае:
АВ≠ ВА (1)
Простой пример: даётся матрица 2-го парядка:
A = 1 2 B = 2 1 (2)
Одним из интереснейших (!) свойств матриц, делающих их изучение таким увлекательным (!!), является то, что произведение матриц некоммутативно. Иными… АВ≠ ВА (1)
3 4 4 3
Если АВ = ВА, то мы будем говорить, что матрицы А и В коммутативны.
Теория матриц даёт естественный переход от обычной области скаляров и их доступной алгебры к более реальному миру объектов, в котором имеется множество различных видов алгебр, обладающих своими специфическими свойствами.
Ассоциативность.
Хотя в новой алгебре коммутативность не имеет места, свойство ассоциативности к счастью, сохраняется. Иными словами, для любых матриц А и В и С мы имеем:
(АВ) * С = А * (ВС) (1)
Это означает, что произведение АВС вполне определено и без помощи круглых скобок. Для доказательства этого результата воспользуемся правилом «немого индекса», которое заключается в том, что любой повторяющийся индекс должен суммироваться по всем своим возможным значениям. Приняв это условие, ij (ита-дже )-й элемент произведения АВ можно записать как:
a ik * b kj (2)
Применяя этот приём и определяя произведение, приведённое выше, мы получаем соотношения,
(АВ)С = (a ik * b kj) c lj ,
A (BC) = a ik (b kl * c lj)
..которые устанавливают равенство выражений (AB)C и A(BC).
21.03.13
Семинар N 6
Оценка | ||||
10 «А» | ||||
10 «Б» |
Тема: «Характеристики положения вариационного ряда».
Одной из задач психолого-педагогического исследования является сравнение полученных результатов.
Например, после проведения контрольной работы мы хотим знать какой класс справился лучше.
Таким образом возникает необходимость в сравнении данных из нескольких вариационных рядов.
Пусть выборка задана своим вариационным радом.
Измеряемая величина xi | x1 | x2 | … | xk |
Частота mi | m1 | m2 | … | mk |
Тогда выборочно средней будет называться величина, определяемая по формуле:
x̅ = x1m1 + x2m2 + … + xkmk ,
m1 + m2 + … + mk
x̅ = Σi=1 xi mi
n
где n = m1 + m2 + … + mk = Σi=1
Найдём выборочное среднее для каждого класса:
Для 10 «А» x̅ = 2*2 + 3*7 + 4*10 + 5*3 = 80 = 3,64
Тема: «Характеристики положения вариационного ряда». Одной из задач психолого-педагогического исследования является сравнение полученных результатов.
2 + 7 + 10 + 3 22
Для 10 «Б» x̅ = 2*1 + 3*9 + 4*10 + 5*1 = 74 = 3,52
1 + 9 + 10 + 1 21
Средняя величина, показывающая среднюю оценку. Можно сказать, что в 10 «А» средняя оценка за контрольную работу выше, чем в 10 «Б».
При этом следует учитывать:
1) учащиеся обоих 10 классов писали одну и ту же контрольную работу.
2) проверял работы один учитель.
В противном случае некорректно делать вывод о том, какой класс справился лучше.
Помимо выборочной средней, результаты характеризует медиана.
Медиана выборки – это такое значение измеряемой величины, которая разбивает выборку на две группы. Так, что суммой частот в каждой группе должны быть не менее ½.
Оценка (вариант) | ||||
Кол-во учащихся в 10 «А» и получивших такую оценку | ||||
Относительная частота | 2_ | 7_ | 10_ | 3_ |
fi = mi , n = 22
n
Σi=1 fi = 2 + 7 + 10 = 19 = 0,86 > 1 .
22 22 2
Σi=3 fi = 10 + 3 = 10 + 3 = 13 = 0,59 > 1 .
22 22 22 2
Т.о. для 10 «А» класса медианой является оценка «4». 10 «А» можно разделить на 2 группы, причём суммы относительных частот в группах будут равны.
Аналогичным образом 10 «Б» можно разбить на две группы по 10 и 11 человек.
Σi=1 fi = 1 + 9 + 10 = 0,95 > 1 .
21 2
Σi=3 fi = 10 + 1 = 0,52 > 1 .
21 2
Однако число 4 тоже является медианой, так как:
Σi=1 fi = 1 + 9 + 10 = 0,95 > 1 .
21 2
Σi=3 fi = 10 + 1 = 0,52 = ½
Некоторые авторы считают невозможным наличие 2-х медиан и предлагают вычислять среднее арифметическое двух медиан.
Медиану рекомендуется применять в тех случаях, когда выборка содержит варианты, сильно отличающиеся от выборочного среднего. Кроме медианы можно использовать такую числовую характеристику, как мода.
Мода показывает какой вариант встречается в выборке наиболее часто. Для 10 «А» класса модой является оценка 4, потому что у неё самая большая частота в выборке.
По имеющимся данным можно найти средний балл за контрольную работу для обоих классов.
Способ N1: Обобщим имеющиеся данные в виде одного вариационного ряда.
Оценка (вариант) | ||||
Кол-во учащихся | 2+1 | 7+9 | 10+10 | 3+1 |
x̅ = 2*3 + 3*16 + 4*20 + 5*4 = 3,58.
Воспользуемся формулой для выборочной средней. Ответ: 3,58.
Таким образом, средний балл в обоих классах оказался выше, чем в 10 «Б», но ниже, чем в 10 «А».
Способ N2: Если выборку можно разбить на несколько групп, например на школы, на классы, тогда выборочное среднее называется «групповое среднее».
Выборочное среднее может быть получено из групповых средних следующим образом:
x̅B = Σi=1 xi ni
Σi=1 ni
x̅B = 3,64 * 22 + 3,52 *21 = 3,58
Средний балл для обеих групп нам известен.
Для 10 «А» = 3, 64. Для 10 «Б» = 3, 52.
Обоими способами мы получим одинаковый результат (3,58)
В 3-х школах провели ЕГЭ по математике, найдём средний результат для 3-х школ:
Средний балл | |||
Кол-во учащихся |
x̅B = 72*50 + 85*44 + 69*61 = 74,5
50 + 44 + 61
x̅B = 3,64 * 22 + 3,52 *21 = 3,58
x̅B = 3600 + 3740 *4209 = 74,509
28.03.13
Семинар N 7
Учителя:
N п/п | Баллы | N п/п | Баллы |
Менеджеры:
N п/п | Баллы | N п/п | Баллы |
Задача:
Существуют ли статистически верные различия между учителями и менеджерами по стрессоустойчивости?
[Здесь по идее должна быть таблица с расчётами, но её не будет :P]
Среднее по учителям = 19,34
Среднее по менеджерам = 22,30
Ответ: существуют статистически достоверные различия в стрессоустойчивости между менеджерами и учителями.
Менеджеры: N п/п Баллы N п/п Баллы … Задача:
F-критерий Фишера
t-критерий Стьюдента позволяет сравнивать средние значения двух выборок.
f-критерий Фишера — тоже параметричен, т.е. он подходит к тем параметрам, которые обладают нормальным распределением.
Он позволяет выборочные дисперсии двух выборок.
Если значение f-критерия Фишера больше критического для данного уровня значимости и степней свободы числителя и знаменателя, тогда дисперсии считаются различными.
F = σ 11
σ22
σ2 = Σxi2
n
σ2 – дисперсия.
σ12 – большая дисперсия.
σ22 – меньшая дисперсия.
Сумма квадратов отклонений делится на объём (число) выборки – так высчитывается σ.
σ2 учеников = 6,17
σ2 менеджеров = 4,41
f-критерий = 1,4
Вычисленное значение подвергается проверке по таблице «Критические значения f критерия Фишера».
p = 0,05
Степени свободы числителя:
1 2 3 4 5 6 7 8 10 12 24
Поскольку вычисленное нами значение = 1,4 и оно меньше, чем критическое значение 2,003, следовательно не существует статистически достоверных различий в дисперсиях в двух сравниваемых выборках. Мы должны принять нулевую гипотезу на уровне статистической значимости p < 0,05.
* p – степень ошибки, погрешности.
Альтернативная гипотеза о различии не подтвердилась.
f-критерий Фишера — тоже параметричен, т.е. он подходит к тем параметрам, которые обладают нормальным распределением. Он позволяет выборочные дисперсии двух выборок.
4.04.13
Семинар N 8
Дисперсия.
Дисперсией называется главная характеристика расстояния(?) вариационного ряда.
Выборочная дисперсия рассчитывается по формуле:
D B = Σi=1 (xi — x̅)2 mi
n
xi –это i-тая величина из выборки, встречающаяся niраз
n– объём выборки.
x̅ – количество значений в выборке.
k – кол-во значений в выборке.
x1 = 72 m1 = 50
x2 = 85 m2 = 44
x3 = 69 m3 = 61
k (количество значений в выборке) = 3
x̅ – 74,5
D B = (72 -74,5)2 * 50 + (85 – 74,5)2 * 44 + (69 – 74,5)2 * 61
D B = 16,5
Чем больше значение дисперсии, тем сильнее отличие значений величины друг от друга.
Если в выборке все значения измеряемой величины равны между собой, то дисперсия такой выборки = 0.
Свойства дисперсии:
1) Значение для любой выборки не отрицательно
D[x]≥0
2) Если измеряемая величина постоянна, то есть x=c, то дисперсия такой величины = 0.
x = c, D[c] = 0.
3) Если все значения измеряемой величины x в выборке увеличить в “c” раз, тогда дисперсия выборки увеличится в “c2” раз.
с2 D[c*x] = c2 D[x]
c = const
Вместо дисперсии можно применить выборочное среднее квадратическое отклонение.
σв = Dв (под корнем)
Оно равно квадратному корню из выборочной дисперсии.
В нашем примере 16,9 (под корнем) = 4,11
Дисперсия позволяет оценить не только степень различия измеряемых показателей внутри одной группы, но может быть использовано для определения отклонения данных между разными группами. Для этого применяют несколько видов дисперсии.
Если в качестве выборки берётся какая либо группа, то дисперсия данной группы называется групповой дисперсией.
Чтобы выразить количественно различия между дисперсиями нескольких групп, употребляют понятие «межгрупповая дисперсия».
Межгрупповая дисперсия – это дисперсия групповых средних относительно общей средней.
D межгр = Σi=1 (xi — x̅)2 ni
Σi=1 * ni
x̅1 = 3,64
x̅2 = 3,52
x̅ = 3,64 *22 + 3,52 * 21
22 + 21
80,08 + 73,92 = 194 = 3,98
Дисперсией называется главная характеристика расстояния(?) вариационного… Выборочная дисперсия рассчитывается по формуле:
43 43K – число групп в общей выборке.
X̅ — выборочная средняя для i-й группы.
ni – объём выборки i-й группы.
X – выборочная средняя для всех групп.
Допустим средняя оценка за контрольную работу по математике составила в 10 «А» классе 3, 64, а в 10 «Б» = 3,52.
В 10 «А» учатся 22 ученика, а в 10 «Б» 21 ученик.
Выборка разбивается на 2 группы: выборочная средняя для обеих групп: 3,58.
Тогда межгрупповая дисперсия:
Dмежгр = (3,64 – 3,58)2 * 22 + (3,52 – 3,58)2 * 21 = 0,0036 * 22 + 0,0756 *21 = 0,0036, но рекомендо-
43 43-ванный в учебнике ответ = 0,0002.
Поскольку межгрупповая дисперсия = 0, мы можем сделать вывод, что оценки в одном классе очень мало отличаются от оценок в другом классе. Иначе говоря с точки зрения межгрупповой дисперсии обе группы в незначительной степени различаются по данному признаку.
Если общая выборка разбита на несколько групп, то помимо межгрупповой дисперсии рассчитывают внутригрупповую дисперсию.
Такая дисперсия является средней величиной для всех групповых дисперсий.
Существует взаимосвязь между выборочной внутригрупповой и групповой дисперсией:
Dв = Dмежгр + Dвн.гр.
Dвн.гр. = Σi=1 Di ni
Σi=1 * ni
В 10 «А» учатся 22 ученика, а в 10 «Б» 21 ученик. Выборка разбивается на 2 группы: выборочная средняя для обеих групп: 3,58.
K – кол-во групп в общей выборке.
Di – дисперсия i-ой группы объёма ni
N класса | Число удовлетворённых оценками в 1-ую неделю | Число удовлетворённых оценками во 2-ую неделю |
Можем ли мы считать, что эмпирическое разделение в 1-ую неделю исследования согласуется с эмпирическим распределением во 2-ую неделю исследования?
То есть структура удовлетворённости оценками сохраняется на протяжении данного времени.
x2 = _1_ + _1_ + _4_ + _1_ + _1_ + 0 = 0,058 + 0,111 + 0,444 + 0,333 + 0,25 =
17 9 9 3 4
= _5_ + _3_ = 1,2
9 9
df = (n1-1)(n2-1)
df = 6
Поскольку 1,2 меньше, чем 12,6, значит p < 0,05, значит, нет оснований отвергать нулевую гипотезу об одинарном распределении мнений учащихся о своей успеваемости в разные дни недели.
Можем ли мы считать, что эмпирическое разделение в 1-ую неделю исследования… То есть структура удовлетворённости оценками сохраняется на протяжении данного времени.
11.04.13
Семинар N 9
Критика Линка Уоллеса.
Разность средних > К * (сумма размахов)
n
Разность средних значений для любых двух групп.
Если неравенство выполняется, то различие между средними статистически значимы. Разность средних берётся по модулю.
Сравним средние значения в обычной школе и школе-интернате
4,750 = 4,625 = 0,125
0,125 > 1,18 * 17 = 2,507.
Неравенство не выполняется. Следовательно статистически значимых различий между средними значениями в обычной школе и школе-интернате нет.
Проверим различие между средними значениями в обычной школе и колледже.
<…>
3 > 2,5 (неравенство выполняется).
Средние значения в интернате и в колледже.
3,125 > 2,5 (тоже выполняется).
Таким образом средний показатель количества решёных задач достоверно выше в интернате и в колледже.
Надёжность метода расщепления.
Процедура расщепления позволяет разбить тест на 2 составляющие части: чётные задания и нечётные задания. Для определения надёжности применяется формула Спирмена-Брауна:
Rp = 2 Rn_
1 — Rn
Рюлона:
Rp = 1 — σ2
σx2
Rp–коэффициент надёжности полного теста.
Rn – коэффициент надёжности для половины теста.
Эта формула справедлива при равных стандартных отклонениях в обеих половинах теста. Если стандартные отклонения равны, тогда пользуемся формулой Рюлона, где:
σ2 – дисперсия разностей между результатами половин теста.
σx2 –дисперсия суммарного результата.
Главное преимущество метода расщепления по сравнению с ретестовым методом и методом параллельных форм, это отсутствие необходимости повторного тестирования. Устраняется влияние запоминания заданий. Недостаток метода: невозможность определить устойчивость по временным факторам.
Обе формулы справедливы для однородных тестов, если тест разнородный. Например, тест структуры интеллекта Амтхауера, тогда расщепление приводит к искажению результатов. В этом случае определяется надёжность каждого отдельного задания теста. Для этого используют формулы Кьюдера –Ричардсона, в которой подставляют данные о выполнении испытуемыми каждого задания:
Rn = N * (1 — Σp * g)
N – 1 σx2
где:N – число задач в тесте.
σx2 – дисперсия первичных оценок теста.
p – индекс трудности заданий.
p – доля испытуемых справившихся с заданиями.
g = 1 – p.
g – доля испытуемых не справившихся с заданиями.
N задачи | Количество | p | g | pg |
0,96 | 0,14 | 0,04 | ||
0,86 | 0,14 | 0,12 | ||
0,66 | 0,34 | 0,22 | ||
0,78 | 0,22 | 0,17 | ||
0,56 | 0,44 | 0,25 | ||
… | … | … | … | … |
0,02 | 0,98 | 0,02 | ||
0,02 | 0,98 | 0,02 | ||
Σ | 2,55 |
σx2 = 8,01
Разность средних > К * (сумма размахов) n
N = 50
Rn = 16 * (1 – 2,55) = 0,72
Rn(под корнем) = 0,72 = 0,85
Любой коэффициент надёжности можно интерпретировать в процентах дисперсии показателей, например коэффициент надёжности = 0,72 показывает, что 72% дисперсии результатов теста зависят от истинной дисперсии по измеряемому свойству. 28% от дисперсии ошибки.
Rn (под корнем) – квадратный корень из коэффициента надёжности – это индекс надёжности.
Rn (под корнем) 2 (в квадрате) – квадрат индекса надёжности – понимается как процент истинной дисперсии.
Дисперсия ошибки включает неоднородность тестовых заданий, временные показатели, измерения состояния испытуемых, влияние тренировки и другие факторы.
Коэффициент надёжности позволяет вычислить истинный балл по данной методике. Если повторные результаты выполнения теста теми же самыми испытуемыми идентичны первому результату, значит методика точна и максимально надёжна.
При этом дисперсия нового распределения выше исходного. На величину дисперсии ошибки измерения.
Надёжность в этом случае выражается формулой:
Rn = σt2
σx2
где Rn – надёжность теста (надёжность – reliability)
σt2 — истинная дисперсия.
σx2 – эмпирическая дисперсия оценок теста.
Величина ошибки измерения обратно-пропорциональна точности измерения:
σo. = (далее под корнем) 1 – Rn
Если Rn = 0,8, тогда доля дисперсии ошибки <…>
В результате эмпирического значения отклонения тестового балла от среднего получается завышенное. И для его коррекции применяется формула:
Xt = Rt * Xi + X (1 — Rt)
Xt – истинное значение тестового балла.
Xi – эмпирический балл испытуемого.
Rt – коэффициент надёжности.
x̅– Среднее значение баллов по тесту.
Например по тесту Равена: испытуемый получил 6 стэнов. Среднее значение по шкале = 4. Коэффициент надёжности = 0,7. Посчитайте истинное значение испытуемого по тесту Раввена.
Xt = 3,4.
18.04.13
Семинар N 10
Коэффициент корреляции φ.
Коэффициент корреляции φ устанавливает взаимосвязь между двумя переменными, которые обладают дихотоническими признаками.
Дихотомия – противопоставление.
Например: 0 – отсутствие, 1 – наличие признака.
Задача:
Влияет ли семейное положение на успешность учёбы студентов мужчин. Психолог опросил 12 студентов-мужчин об их семейном положении (0 = холост, 1 = женат) и об успешности обучения (0 = наличие академических задолженностей, 1 = успешное обучение).
N п/п | Семейное положение | Успешность обучения | N п/п | Семейное положение | Успешность обучения |
Обозначим семейное положение переменной x, а успешность обучения переменной y.
Формула для расчёта коэффициента корреляции φ:
φ = pxy – px * py
px (1-px) * py (1-py) (знаменатель под корнем)
px – частота или доля признака имеющего 1 по переменной x.
1 — px – частота или доля признака, имеющего 0 по x.
py – частота или доля признака имеющего 1 по переменной y.
1 – py – частота или доля признака имеющего 0 по y.
pxy – частота или доля признака имеющая 1 одновременно по x и по y.
Для вычисления частот подсчитывают количество единиц в переменной х. Полученную величину делят на N.
N – это общее число элементов переменной.
В нашей задаче N = 12.
Аналогично подсчитывают количество единиц в переменной “y” и делят на N.
Доля студентов имеющих 1 по x.
px = 5 = 0,4167
(1 – px) = 0,5833
Доля студентов имеющих 1 по y.
py = 5
(1 – py) = 0,5.
pxy – доля студентов, имеющих 1 по x и по y = 4 = 0,3333
φ = . 0,3333 – 0,4167 * 0,5 = . 0,12455 = 0,507
0,4167 * 0,5833 * 0,5 * 0,5 (знаменатель под корнем) 0,24650
Для коэффициента корреляций φ не существует таблицы критических значений. Критические значения φ вычисляются по формуле:
φкрит = |r| * n — 2 (вся дробь под корнем)
1 – r2
r – коэффициент корреляции.
n – число коррелируемых признаков.
0,507 * _12 – 2__ (дробь под корнем) = 1,86
1 – 0,5072
Вычисление критического значения проверяется по таблице t-критерия Стьюдента. Для этого определяют количество степеней свободы по формуле:
df = n-2 (то есть у нас 12-2 = 10 степеней свободы)
p<0,05 если t-критерий больше, чем 2,228.
Поскольку вычисленное критическое значение меньше табличного, значит, на уровне значимости p < 0,5 мы отклоняем альтернативную гипотезу n1 и принимаем нулевую гипотезу n0. Это значит, что успешность обучения не различается в зависимости от семейного положения.
Между успешностью обучения и семейным положением никакой связи нет.
Критерий Немени.
Этот критерий основан на ранжировании всей выборки. Если в выборке K групп по n элементов, то наименьшему наблюдению приписывается ранг «1» и так далее.
Затем суммируются ранги в каждой группе и вычисляются значения разностей сумм рангов.
Критерий Немени позволяет оценивать различия средних значений между группами. При этом группы должны быть равны по величине. Количество групп должно быть не меньше 4, но не больше 10.
Задача:
Проводим обследование 4х групп спортсменов высокой квалификации по 5 человек в группе: 1 – футболисты, 2 – гимнасты, 3 – теннисисты, 4 – пловцы. Изучалось время реакции выбора в миллисекундах (мс).
Регулируемый фактор – спортивная специализация. Результирующий признак – длительность времени реакции.
1 ранг | 2 ранг | 3 ранг | 4 ранг | ||||
балл | ранг | балл | ранг | балл | ранг | балл | ранг |
7,5 | |||||||
7,5 | |||||||
55,5 | 70,5 |
Проверим правильность ранжирования. Для этого сложим: 55,5 + 70,5 + 51 + 33 = 210.
И по формуле
k*c (k*c + 1)
k – число строк.
c – число столбцов.
20 * 21 = 210.
Результаты совпадают. Всё верно. Найдём разности сумм рангов.
Разности рангов | 1-2 | 1-3 | 1-4 |
2-3 | |55,5 – 70,5|= 15 | |55,5 — 51| = 4,3 | |55,5 — 33| = 22,5 |
2-4 | |70,5 — 51| = 19,5 | |70,5 -33| = 37,5 | |
3-4 | |57 — 33| = 18 |
p< 0,05 если D<48,1
По таблице критических значений мы находим, что при k = 4, а n = 5 (k – число строк).
p < 0,05 если критерий Немени больше 48,1.
Все разности у нас меньше критических значений. Следовательно мы принимаем нулевую гипотезу h0 и утверждаем, что различие во времени реакции между группами спортсменов оказались случайными.
Тип спортивной специализации на эти значения не влияет.
Тест 5. 18.04
1. г)2. д)
3. г)4. д)
5. д)6. в)
7. г)8. в)
9. г)10. в)
11. а)
12. в)
13. б)
14. а)
15. б)
16. б)
17. г)
18. г)
19. в)
20. г)
21. г)
Коэффициент корреляции φ устанавливает взаимосвязь между двумя… Дихотомия – противопоставление.