Статистические методы в психологии

БЕЛОРУССКИЙ ГОСУДАРСТВЕННЫЙ УНИВЕРСИТЕТ

ФАКУЛЬТЕТ ФИЛОСОФИИ И СОЦИАЛЬНЫХ НАУК

КАФЕДРА ПСИХОЛОГИИ

 

«СТАТИСТИЧЕСКИЕ МЕТОДЫ В ПСИХОЛОГИИ»

ЛЕКЦИИ

 

студента 1 курса отделения психологии

Тункевича Виктора Викторовича

 

преподаватель В.В. Сечко

 

 

Минск, 2012

Составные части математической статистики.

 

Математическую статистику можно условно подразделить на три части:

1. Описательная статистика.

2. Теория статистического вывода.

3. Планирование и анализ эксперимента.

Описательная статистика – это раздел математической статистики, занимающейся описанием, представлением и табулированием совокупности исходных данных.

Теория статистического вывода представляет собой общий класс задач, характеризующихся попытками вывести свойства большого массива данных (генеральной совокупности).

Путём исследования небольшого объёма данных (выборки).

Теория статистического вывода строится на описательной статистике.

Планирование и анализ эксперимента представляют собой статистические методы, разработанные для обнаружения и исследования взаимосвязей между изучаемыми переменными.

 

Основные этапы статистической обработки данных.

 

1-й этап: Исходный (предварительный) анализ исследуемого реального явления.

В результате этого анализа оп ределяются:

· Основные цели исследования на содержательном не формализованном уровне.

· Совокупность единиц, представляющих собой предмет статистического исследования (например: люди участвующие в психологическом эксперименте).

· Перечень отобранных из представленного специалистами априорного (до эксперимента) набора показателей характеризующих состояние каждого из исследуемых объектов.

· Степень формализации соответствующих записей при сборе исходных данных.

· Общее время и тру дозатраты на планируемые работы.

· Формализованная постановка задачи по возможности, включающая в себя статистическую модель изучаемого явления.

Трудоёмкость 1-го этапа бывает, сравнима с тру доёмкостью всех остальных вместе взятых этапов.

2-й этап: Составление детального плана сбора исходной статистической информации.

5 стр., 2148 слов

Эксперимент как метод исследования. Психологический эксперимент

... гипотез и теорий. 2. ПСИХОЛОГИЧЕСКИЙ ЭКСПЕРИМЕНТ КАК МЕТОД ИССЛЕДОВАНИЯ. Возьмем в качестве примера психологический эксперимент и рассмотрим его более подробно как метод исследования. Психологический эксперимент — ... исходом сколь угодное количество раз при неизменных входных данных, (где — количество произведённых экспериментов); должно быть доказано требование или априори принята гипотеза ...

При составлении этого плана необходимо по возможности учитывать полную схему дальнейшего статистического анализа.

При планировании особого внимания заслуживает ситуация, когда оп ределяется, какой должна быть выборка – случайной, пропорциональной, расслоенной и т.п.

3-й этап: Сбор исходных статистических данных и ввод этих данных в компьютер.

4-й этап: Первичная статистическая обработка данных.

В ходе этой обработки решаются следующие задачи:

· Отображение переменных, описанных текстом в номинальную или порядковую шкалу.

· Анализ резко выделяющихся наблюдений.

· Восстановление пропущенных наблюдений.

· Проверка статистической независимости исходных данных.

5-й этап: Составление детального плана вычислительного анализа собранного материала.

На этом этапе оп ределяются основные группы, для которых будет проводиться дальнейший статистический анализ. Желательно чётко знать блок схему анализов с указанием привлекаемых методов. Формируется критерий, на основании которого выбирается один из альтернативных методов статистической обработки исходных данных.

6-й этап: Вычислительная реализация основной части статистической обработки данных.

7-й этап: Подведение итогов исследования.

Результаты исследования и его основные выводы формулируются в содержательных терминах. На этом этапе проверяется, в какой мере достигнуты намеченные цели исследования. Если некоторые из них не достигнуты, то объясняется почему.

Работа завершается содержательной формулировкой новых задач, вытекающих из про ведённого исследования.

 

§3. Генеральная совокупность и выборка из неё. Репрезентативность выборки.

Исследование обычно начинается с некоторого предположения требующего проверки с привлечением фактов. Это предположение (гипотеза) формулируется в отношении связей, явлений или свойств в некоторой совокупности объектов.

Например: «исследователь может предположить, что женщины более тревожны, чем мужчины». В этом случае объектами носителями свойств будут все мужчины и женщины. Для проверки предположения на фактор необходимо измерить соответствующие свойства у их носителей. Но невозможно измерить тревожность у всех мужчин и женщин. Поэтому при про ведении исследования ограничиваются лишь относительно небольшой группой людей.

Генеральная совокупность – это всё множество объектов в отношении которого, формулируется исследовательская гипотеза.

В нашем примере такой генеральной совокупностью, является все мужчины и все женщины. Таким образом, генеральная совокупность – это как правило недоступное для сплошного исследования множество потенциальных испытуемых.

Выборка – это ограниченная по численности группа объектов (в психологии испытуемых), специально отбираемое из генеральной совокупности для изучения её свойств.

Фактически при статистической обработки выборкой из рассматриваемой генеральной совокупности, являются результаты ограниченного ряда наблюдений исследуемого показателя (признака — переменной).

5 стр., 2184 слов

Выборка в социологическом исследовании, ее типы и виды

... совокупности. Выборкой называется совокупность элементов объекта социологического исследования, подлежащая непосредственному изучению. Выборка как способ или процесс действия - это отбор объектов генеральной совокупности в выборочную. Выборка должна наилучшим образом репрезентировать объект исследования (генеральную совокупность). Генеральная совокупность Выборочная совокупность ... все данные, которые ...

В дальнейшем будем обозначать выборку следующим образом: х12,…,хn, где нижний индекс соответствует порядковому номеру элемента в исходной выборке.

Количество наблюдений образующих выборку, то есть, число n, называется объёмом выборки.

Изучение на выборке свойств генеральной совокупности называется выборочным исследованием.

Практически все психологические исследования являются выборочными, а их выводы, распространяются на генеральные совокупности.

Одним из важнейших вопросов от успешного лишения которого зависит достоверность выводов получаемых в результате статистической обработки данных и является вопросом репрезентативности выборки, то есть, вопрос полноты и адекватности представления выборкой интересующих нас свойств исследуемой генеральной совокупности.

Полнота чаще всего характеризуется объёмом выборки, чем больше изменчивость изучаемого

Свойства, тем больше должен быть объём выборки. К сожалению, строгих рекомендаций по предварительному оп ределению требуемого объёма выборки не существует. Тем не менее, можно сформулировать наиболее общие рекомендации (по Наследову).

1. Наибольший объём выборки необходим при разработке диагностической методике, от 200 до 1000-2000 человек.

2. Если необходимо сравнивать 2 выборки, то их общая численность должна быть не менее 50-ти человек, причём численность сравниваемых выборок должна быть приблизительно одинакова.

3. Если изучается взаимосвязь между какими-либо свойствами (признаками), то объём выборки должен быть не меньше 30-35 человек.

Под адекватностью понимают соответствие выбранной модели реальному изучаемому явлению. Таким образом, репрезентативность выборки, иными словами, её представительность – это способность выборки представлять изучаемые явления достаточно полно с точки зрения их изменчивости в генеральной совокупности.

 

1-й этап: Исходный (предварительный) анализ исследуемого реального явления. В результате этого анализа оп ределяются: · Основные цели исследования на содержательном не формализованном уровне.

Способы организации выборки.

Сущность статистических методов состоит в том, чтобы по некоторой части генеральной совокупности, то есть по выборке выносить суждения о свойствах генеральной совокупности в целом. Таким образом, после того, как сформулирована гипотеза и оп ределены соответствующие генеральные совокупности, перед исследователем возникает проблема организации выборки. Рассмотрим основные способы организации выборки:

1. Простой случайный отбор – это способ получения n объектов из конечной генеральной совокупности состоящей из N объектов при котором, каждая выборка имеет одинаковую возможность (вероятность)быть отобранным. На практике для реализации простого случайного отбора объекты генеральной совокупности нумеруют от 1 до N.

4 стр., 1581 слов

Методология психолого-педагогических исследований: общая характеристика

... развитие, формирование личности коллектива). Предмет исследования – ограниченный аспект сферы поиска внутри объекта; процессы протекания или реализации изучаемых явлений, совокупность элементов, связей, отношений. Проблема исследования – вопрос, на который надо ...

Затем, используя таблицу случайных чисел или корзину с шарами, отбирают друг за другом n объектов. Полученная таким образом выборка называется случайной.

2. Простой отбор с помощью регулярной, но не существенной для изучаемого вопроса процедуры. Например, в психологических исследованиях по первой букве фамилии.

3. Стратифицированный (расслоённый) способ отбора. В этом случае генеральную совокупность объёма N подразделяют на не пересекающиеся под совокупности. Эти под совокупности называются слоями или стратами. Из каждого слоя извлекается простая случайная выборка соответственно объёма n1 n2…nr=n. Стратифицированный отбор применяется, когда слои являются однородными, то есть входящие в них объекты, близки по своим характеристикам.

4. Серийный отбор. Используется тогда, когда удобнее использовать не отдельные элементы генеральной совокупности, а целые блоки или серии таких элементов. Например, выбираем все семьи в одном доме. Такой способ отбора иногда называют гнездовым.

5. Комбинированный (ступенчатый) отбор. он объединяет в себе сразу несколько из вышеперечисленных способов отбора, которые составляют различные ступени выборочного исследования.

6. Последовательный (активный) отбор. в основном используется при анализе физико-химических и технологических процессов и называется активным, так как исследователь может влиять на величину некоторых переменных.

 

1. Простой случайный отбор – это способ получения n объектов из конечной генеральной совокупности состоящей из N объектов при котором, каждая… Затем, используя таблицу случайных чисел или корзину с шарами, отбирают друг… 2. Простой отбор с помощью регулярной, но не существенной для изучаемого вопроса процедуры. Например, в…

Шкалы измерений.

 

Любое эмпирическое научное исследование начинается с того, что исследователь фиксирует выраженность интересующих его свойств у объектов исследования как правило, при помощи чисел. Таким образом, следует различать:

1. Объекты исследования (в психологии это чаще всего люди)

2. Их свойства (то, что интересует исследователя и составляет предмет изучения)

3. Признаки, отражающие в числовой шкале выраженность свойств

В зависимости от того, какая операция лежит в основе измерения признака, различают так называемые шкалы измерений. Рассмотрим наиболее употребляемые в статистике шкалы измерений.

1. Номинальная шкала (шкала наименований, шкала классификации)используется для отнесения объектов к оп ределённому классу. Например: пол, темперамент. Если объект может относиться только к одному из двух классов, то такая шкала называется номинальной дихотомической. Например: пол или варианты ответов на вопрос (да или нет).

2. Порядковая шкала (ранговая, ординальная), используется для отнесения объектов к оп ределённому классу в соответствии со степенью выраженности заданного свойства изучаемого объекта. Например: оценки на экзамене или уровень тревожности.

3. Количественные шкалы имеются две разновидности количественных шкал:

· Интервальная шкала

· Абсолютная шкала (шкала отношений)

Интервальная шкала позволяет классифицировать и упорядочивать объекты, а также количественно описывать различия между свойствами объектов. Для задания этой шкалы устанавливают единицу измерения и произвольную нулевую точку от счёта. Например: температура по шкале Цельсия (0С).

Абсолютная шкала отличается от интервальной шкалы, только тем, что в ней устанавливается абсолютная нулевая точка от счёта соответствующее полному отсутствию выраженности измеряемого свойства. Например: температура по шкале Кельвина (0К).

Определение того, в какой шкале измерен признак, является ключевым моментом анализа данных, так как выбор необходимого статистического метода зависит именно от этого. Данные полученные в одной шкале, можно перевести в другую шкалу только в следующем направлении.

 

 

В обратном направлении, это не возможно:

Поэтому нужно стараться по мере возможности измерять в количественной шкале, так как в этом случае мы сможем перейти к любой из рассмотренных шкал.

Однако при этом происходит частичная потеря столь ценной для нас эмпирической информации об индивидуальных различиях испытуемых. Следствием этого может являться падение статистической достоверности результатов исследования.

Перевод исходных данных из количественной шкалы в порядковую, называется ранжированием. Для этого сначала, необходимо упорядочить исходную выборку, а затем каждому элементу выборки присвоить ранг. То есть, число соответствующее порядковому номеру этого элемента в упорядоченной выборке.

 

Любое эмпирическое научное исследование начинается с того, что исследователь фиксирует выраженность интересующих его свойств у объектов исследования… 1. Объекты исследования (в психологии это чаще всего люди) 2. Их свойства (то, что интересует исследователя и составляет предмет изучения)

Табулирование данных.

Для анализа и интерпретации количественных данных их необходимо каким-то образом обобщить. Для этого часто используют табулирование данных, то есть, представляют исходную выборку в виде таблицы соответствующей структуры. Табулирование данных осуществляется в 4этапа:

R=xmax— xmin

Определение размаха выборки. Для этого необходимо из максимального элемента выборки вычесть минимальный элемент выборки.

Формула №6.1

1. Определение ширины интервала группирования данных. Для этого размах выборки делится на количество интервала.

h=

Формула №6.2

К1= и К2=


где h— ширина интервала, R— размах выборки, k— количество интервала. Одной из основных проблем на этом этапе, является выбор количество интервала. Очень небольшое количество интервалов, может слишком упростить и сгладить общую тенденцию. Слишком большое количество интервалов, может привести к излишней детализации рассматриваемого явления. Можно воспользоваться следующей рекомендацией: количество интервалов выбирается таким образом, чтобы в среднем, каждый интервал попадало 5-6 элементов выборки. Поэтому сначала вычисляются 2 числа К1 и К2 по следующим формулам:

Формула №6.3

после этого, в качестве требуемого количественного интервала выбирается целое число, находящееся между К1 и К2. Например: К1=7,3 и К2=8,8 поэтому К=8, если между К1 и К2 нет целого числа, то в качестве К выбирается ближайшее целое число. Например: К1=6,2 и К2=6,6 поэтому К=6. После оп ределения К, вычисляется ширина интервала h по формуле №6.2. При этом, для простоты дальнейших вычислений полученная величина h, округляется до целого числа, например: h=4,22≈4 или h=4,53≈5.

1. Определение границ интервалов группирования данных.

При этом необходимо обращать внимание, чтобы левая граница первого интервала оказалась слева от наименьшего элемента выборки или равнялась ему. Каждая последующая граница, получается путём прибавления ширины интервала к предыдущей границе.

2. Непосредственно само табулирование данных. На этом этапе под считывается, сколько элементов исходной выборки, попало в каждый интервал. Количество элементов выборки, попавших в интервал, называется частотой.

Результатом табулирования данных, является таблица, состоящая обычно из 2-х столбцов. 1-й столбец содержит границы интервалов, а 2-й столбец частоты.

Пример: в классе из 38 учащихся, был про ведён эксперимент, в котором измерялась скорость чтения. Были получены следующие результаты: 90, 66, 106, 84, 105, 83, 104, 82, 97, 97, 59, 95, 78, 70, 47, 95, 100, 69, 44, 80, 75, 75, 51, 109, 89, 58, 59, 72, 74, 75, 81, 71, 68, 112, 62, 91, 93, 84. Протабулировать полученные данные.

 

Хmax=112 хmin=44 n=38
K1= = ≈6,3 К2= = ≈7,6 K=7
h= = =9,7≈10   k=7 h=10

 

 

Границы интервалов Подсчёт Частоты   Примечание
40-50   Перед непосредственным под счётом частот, мы должны оп ределить для себя, в какой интервал будем включать значения, попадающие точно на границу интервала. Здесь возможны 2 ситуации: 1. Включаем левую границу. 2. Включаем правую границу. Желательно отметить этот выбор «птичкой» в 1-ом столбце таблицы.
50-60
60-70
70-80
80-90
90-100
100-110
110-120  
  n=38

 

Для некоторого контроля правильности вычислений, необходимо сложить все полученные частоты, если мы правильно сосчитали все наблюдения, то сумма частот должна равняться количеству наблюдений в выборке.

По полученной таблице, можно сделать следующую интерпретацию: основная часть учащихся, читает со средней скоростью, но есть ряд учащихся, которые обладают не высокой скоростью чтения и ряд учащихся, которые читают с достаточно высокой скоростью.

 

1. Определение границ интервалов группирования данных. При этом необходимо обращать внимание, чтобы левая граница первого интервала… 2. Непосредственно само табулирование данных. На этом этапе под считывается, сколько элементов исходной выборки, попало…

Квантили и их интерпретация.

Одним из наиболее эффективных методов обобщения исходных данных, является описание их при помощи квантилей. Квантиль – это общее, понятие частными случаями её являются: квартиль, дециль, процент иль.

Квантиль (К) – это такая точка на числовой прямой, которая делит исходные данные на 2 части с известными пропорциями (долями), в каждой из частей.

 

Обычно указывают долю наблюдений, расположенных слева от квантилей. Эта доля называется порядком или уровнем квантили. Квантиль, обычно обозначается (Кр), где р — порядок(уровень квантилей), причём, 0

 

Где М и сигма константы, принимающие для соответствующей шкалы следующие значения: шкала М δ Стены …    

Формула №10.9

 

Если β равняется нулю, то это означает, что исходная выборка (её гистограмма) является симметричной: β=0

Если β больше нуля, то говорят, что выборка имеет положительную или правую асимметрию, то есть более широкий диапазон значений расположен справа от моды выборки: β>0

 

 

Если β меньше нуля, то говорят, что выборка имеет отрицательную или левую асимметрию, то есть более широкий диапазон значений расположен слева от моды выборки: β<0

 

Эксцесс!

Одной из мер изменчивости является эксцесс, который позволяет характеризовать степень островершинности (остр оконечности) рас пределения элементов выборки, то есть аналога гистограммы. Обычно эксцесс обозначается (γ -сигма) и вычисляется по следующей формуле:

 

 

 

Формула №10.10

 

Если гамма больше нуля, то говорят, что исходные данные соответствуют остро вершинному рас пределению: γ>0.

Если гамма меньше нуля, то говорят, что исходные данные соответствуют плоско вершинному рас пределению: γ<0.

Если гамма равно нулю, то говорят, что исходные данные соответствуют средне вершинному рас пределению (таким свойством обладает нормальное рас пределение): γ=0.

Если β равняется нулю, то это означает, что исходная выборка (её гистограмма) является симметричной: β=0 Если β больше нуля, то говорят, что выборка имеет положительную или…  

Нормальное рас пределение.

 

Значение величин представляющих исходные даны, не возможно точно предугадать, даже при полностью известных условиях эксперимента, в которых они измеряются.Мы можем лишь указать вероятность, что наша исследуемая величина принимает то или иное значение, или попадает в то или иное множество значений. Последовательность этих вероятностей и называется рас пределением вероятностей интересующей нас величины. Фактически, рас пределение представляет собой предельный случай гистограммы, когда ширина интервала группирования данных, стремится к нулю, а объём выборки возрастает.

 

Зная это рас пределение, мы можем делать некоторые выводы о событиях, в которых участвуют эти величины. Однако эти выводы будут носить случайный вероятностный характер. Среди вероятностных рас пределений, некоторые встречаются на практике довольно часто, поэтому такие рас пределения детально изучены и свойства их хорошо известны.

 

Понятия нормального рас пределения!

Основным, наиболее распространённым и важным рас пределением является нормальное рас пределение.

Оно часто используется для приближённого описания многих случайных явлений, в которых на интересующий нас результат, оказывает воздействие большое количество независимых случайных факторов, среди которых нет сильно выделяющихся.

Закономерность нормального рас пределения, проявляется в том, что чаще всего встречаются средние значения исследуемого показателя и чем больше отклонение от средней величины, тем реже встречаем ость таких отклонений. Нормальное рас пределение позволяет использовать более широкий набор методов статистической обработки и как следствие, сделать выводы исследования более глубокими и содержательными.

Нормальное рас пределение зависит от двух параметров:

1. От среднего значения ϻ, которое характеризует положение графика нормального рас пределения на числовой оси, поэтому иногда этот параметр называют параметром положения.

2. Дисперсии или стандартного отклонения δ, которая характеризует степень сжатия (растяжения) графика нормального рас пределения, поэтому иногда этот параметр называют параметром масштаба.

 

График нормального рас пределения всегда является симметричным относительно среднего значения ϻ и иногда называется кривой Гаусса:

 

Чем больше дисперсия нормального рас пределения, тем «ниже и шире» расположен график нормального рас пределения.

 

Так как нормальное рас пределения является симметричным, то мода, медиана и среднее значение нормального рас пределения совпадают.

Характерное свойство нормального рас пределения состоит в том, что 68,26% из всех его наблюдений лежат в диапазоне , то есть одно стандартное отклонение от среднего значения. 95,44% в диапазоне . 99,72 % в диапазоне .

Если среднее значение нормального рас пределения ϻ=0, а дисперсия , то такое рас пределение называется стандартным нормальным рас пределением. График стандартного нормального рас пределения, является симметричным относительно вертикальной координатной оси.

 

В психологических исследованиях нормальное рас пределение используется в первую очередь при разработки и применении тестов интеллекта и способностей. Так например, показатель интеллекта IQ, соответствует закону нормального рас пределения имея среднее значение равное 100 для любой конкретной возрастной группы и стандартное отклонение, подавляющем в большинстве случаев равное 16. Однако применительно к другим психологическим категориям в первую очередь к таким как: личностная и мотивационное сферы применение нормального рас пределения представляется весьма дискуссионно. Во многих случаях «сырые» психологические данные часто дают ассиметричные «ненормальные» рас пределения. При обработке экспериментальных данных всегда целесообразно проводить оценку характера рас пределения. Эта оценка важна, потому что в зависимости от характера рас пределения, решается вопрос о возможности применения того или иного статистического метода.

 

Приближённая проверка нормальности рас пределения!

Для проверки нормальности рас пределения исходных данных, используются различные процедуры, позволяющие выяснить, отличается ли от нормального выборочное рас пределение измеренного показателя. Рассмотрим приближённую проверку нормальности рас пределения исходных данных путём расчёта показателей асимметрии и эксцесса и сопоставление их с критическими значениями. Действовать будем по следующему алгоритму:

1. По исходным данным измеренного показателя, вычисляем эмпирические значения показателей асимметрии и эксцесса по соответствующим формулам:

 
 

Формула №10.9 Формула №10.10

2.

 
 


Вычисляем критические значения показателей асимметрии и эксцесса по формулам Плохинского:

Значение величин представляющих исходные даны, не возможно точно предугадать, даже при полностью известных условиях эксперимента, в которых они…   Зная это рас пределение, мы можем делать некоторые выводы о событиях, в которых участвуют эти величины. Однако эти…

Формула №11.11

Если эмпирические значения показателей асимметрии и эксцесса по абсолютной величине меньше критических значений, то делаем вывод о том, что рас пределение измеренного показателя не отличается от нормальной. Если же хотя бы одно из эмпирических значений по абсолютной величине больше или равно соответствующего критического значения, то делаем вывод о том, что рас пределение измеренного показателя, отличается от нормального.

Пример: проверить на нормальность рас пределения исходные данные «показателя» аналогии.

Решение:

Для вычисления эмпирических значений асимметрии и эксцесса составим следующую расчётную таблицу:

Xi      
13-11=2 22=4 23=8 24=16
9-11=-2 (-2)2=4 (-2)3=-8 (-2)4=16
9-11=-2 -8
9-11=-2 -8
5-11=-6 -216
9-11=-2 -8
8-11=-3 -27
13-11=2
13-11=2
14-11=3
7-11=-4 -64
7-11=-4 -64
10-11=-1 -1
10-11=-1 -1
14-11=3
10-11=-1 -1
8-11=-3 -27
9-11=-2 -8
10-11=-1 -1
13-11=2
14-11=3
10-11=-1 -1
10-11=-1 -1
13-11=2
14-11=3
13-11=2
10-11=-1 -1
15-11=4
16-11=5
15-11=4
         

 

В результате получаем:

 

;;

 

Вычисляем критические значения асимметрии и эксцесса:

 

;

Так как модуль и модуль , то делаем вывод о том, что рас пределение показателя «аналогии» не отличается от нормального рас пределения.

 

Пример: проверить на нормальность рас пределения исходные данные «показателя» аналогии. Решение: Для вычисления эмпирических значений асимметрии и эксцесса составим следующую расчётную таблицу: Xi …

Распределения, связанные с нормальным рас пределением.

С нормальным рас пределением связаны многие другие рас пределения, среди которых в статистике чаще всего используются следующие:

1. (хи-квадрат) рас пределения Пирсона.

2. t-рас пределение Стьюдента (настоящая фамилия Госсет).

3. F-рас пределение Фишера.

Для этих рас пределений, включая нормальное имеются специальные статистические таблицы, которые позволяют находить значения того или иного рас пределения. Эту же проблему можно решить с помощью статистических функций мастера функции Excel.

 

Хи-квадрат рас пределения!

 

Хи-квадрат рас пределения получают следующим образом: берётся n независимых случайных величин, каждая из которых имеет стандартное нормальное рас пределение. Затем, они возводятся в квадрат после чего, эти квадраты суммируются. Полученная таким образом сумма обычно обозначается и называется хи-квадрат рас пределение с n степенями свободы, то есть:

.Хи-квадрат рас пределения зависит только от одного параметра n, которое называется числом степеней свободы. График хи-квадрат рас пределения не является симметричным, причём асимметрия у него положительная (правая).

График располагается в первой четверти, так как хи-квадрат рас пределения принимает только положительные значения.

 

Среднее значение хи-квадрат рас пределения равно числу степеней свободы, а дисперсия равна удвоенному числу степеней свободы. При увеличении числа степеней свободы хи-квадрат рас пределения приближается к нормальному рас пределению.

 

t-рас пределение Стьюдента!

Для получения t-рас пределения Стьюдента необходимо взять стандартную нормально рас пределённую величину и разделить её на квадратный корень из нормированной хи-квадрат рас пределённой величины. Полученная таким образом величина обозначается tn и называется t-рас пределения Стьюдента с n степенями свободы, то есть:

t-рас пределение Стьюдента зависит только от одного параметра – числа степеней свободы n. График Стьюдента является симметричным относительно вертикальной координатной оси:

 

 

При больших значениях числа степеней свободы (n>30) t-рас пределение Стьюдента практически не отличается от стандартного нормального рас пределения.

 

F-рас пределение Фишера!

F-рас пределение Фишера представляет собой отношение двух нормированных хи-квадрат рас пределённых величин соответственно с n и m степенями свободы.

Оно обычно обозначается Fn;m и называется F-рас пределением Фишера с n и m степенями свободы, то есть:

f-рас пределение Фишера, зависит от двух параметров: числа степеней свободы n и числа степеней свободы m. График F-рас пределения Фишера не является симметричным, причём асимметрия у него положительная (правая).

График располагается в первой четверти, так как F-рас пределение принимает только положительные значения

 

 

Список возможных экзаменационных задач!

1. Осуществить табулирование исходных данных и построить гистограмму.

2. Осуществить табулирование исходных данных и построить полигон частот.

3. Осуществить табулирование исходных данных и построить огиву (сглаженную кривую).

4. Вычислить моду выборки.

5. Вычислить медиану выборки.

6. Вычислить среднее значение выборки.

7. Вычислить дисперсию выборки.

8. Вычислить стандартное отклонение выборки.

 

 

 

 

Список возможных экзаменационных задач!

1. Осуществить табулирование исходных данных и построить гистограмму.

Граница интервалов Подсчёт Частоты
1 – 3 I I I I I I I
3 – 5 I I I I I
5 – 7 I I I I
7 – 9 I I I I I
9 – 11 I I I I
     

1. (хи-квадрат) рас пределения Пирсона. 2. t-рас пределение Стьюдента (настоящая фамилия Госсет).

3. F-рас пределение Фишера.

5 7 9 8 6 5 4 9 7 2 1 1 1 1 3 9 3 9 4 3 2 5 7 8 1

2. Осуществить табулирование исходных данных и построить полигон частот.

Граница интервалов Подсчёт Частоты
1 – 3 I I I I I I I
3 – 5 I I I I I
5 – 7 I I I I
7 – 9 I I I I I
9 – 11 I I I I
     

5 7 9 8 6 5 4 9 7 2 1 1 1 1 3 9 3 9 4 3 2 5 7 8 1

3. Осуществить табулирование исходных данных и построить огиву (сглаженную кривую).

Граница интервалов Подсчёт Частоты Накопленные частоты %
1 – 3 I I I I I I I
3 – 5 I I I I I 7+5=12
5 – 7 I I I I 12+4=16
7 – 9 I I I I I 16+5=21
9 – 11 I I I I 21+4=25

5 7 9 8 6 5 4 9 7 2 1 1 1 1 3 9 3 9 4 3 2 5 7 8 1

 

4. Вычислить моду выборки.

 

1 – 52 – 2

3 – 34 – 2

5 – 36 – 1

7 – 38 – 2

9 – 4Ответ: Хmod=1

 

 

5. Вычислить медиану выборки.

 

1 1 1 1 1 2 2 3 3 3 4 4 5 5 5 6 7 7 7 8 8 9 9 9 9

Если нечётное количество респондентов, то

Ответ: Хmed=5

 

 

6. Вычислить среднее значение выборки.

 

 

Округляем число до целого, из 4,8 округляем до 5.

Ответ: =5

 

 

7. Вычислить дисперсию выборки.

Хi  
   

 

 

Ответ: =12,4

8. Вычислить стандартное отклонение выборки.

 

 

Ответ: Sх=3,52

ЛИТЕРАТУРА:

1. Ермолаев О.Ю. – «Математическая статистика для психологов». Учебник (2003);

 

2. На следов А.Д. – «Математические методы в психологическом исследовании. Анализ и интерпретация данных». Учебное пособие (2006);

 

3. Сидоренко Е.В. – «Методы математической обработки в психологии» (2006).