Отличие психодиагностического обследования от научного психологического исследования

ГБОУ ВПО ОрГМА МИНЗДРАВСОЦРАЗВИТИЯ РОССИИ

Кафедра общей психологии

Контрольные работы по психодиагностике

Выполнил: Студентка 2 курса 32 кп гр.

Барковская А.П.

Проверил: Паина Л. И.

Оренбург, 2011

Ответы к письменной работе по психодиагностике.

Отличие психодиагностического обследования от научного психологического исследования.

Психодиагностическое обследование — деятельность психолога, конечным результатом которой является диагноз психологический. Выделяют три основных этапа П. о.: сбор данных в соответствии с задачей исследования; переработка и интерпретация полученных данных; вынесение решения (диагноз или прогноз).

Сбору данных с помощью психодиагностических методик (тестов) должен предшествовать период ознакомления с некоторым комплексом объективной и субъективной информации об обследуемом (напр. история болезни, заключения других специалистов и т. д.).

С этой целью могут быть использованы и опросники-анкеты. Авторы всех известных тестов обращают особое внимание на предварительное изучение обследуемого. Этим создается основной фон П. о., намечаются элементы рабочей картины личности, необходимые для диагноза и прогноза.

Поскольку П. о. всегда образует систему взаимодействия «экспериментатор-обследуемый», необходимо учитывать влияние различных переменных, включенных в эту систему (ситуационные переменные, к которым в первую очередь относятся психодиагностические ситуации, переменные цели обследования и задания, переменные исследователя и обследуемого).

При выборе психодиагностических методик следует руководствоваться сведениями об их надежности и валидности по отношению к диагностической задаче (см. Область применения теста): Этап сбора данных завершается представлением полученных результатов в виде, который задан типом методики (построение «профиля личности», перевод «сырых» оценок в стандартные величины, расчет интеллекта коэффициента и т. д.).

В процессе переработки и интерпретации диагностических данных традиционно выделяют два пути: клинический и статистический. Клинический подход ориентирован прежде всего на опыт исследователя, интуицию; его особенностью является доверие к «субъективному суждению» (А.Анастази, 1982).

Статистический подход предусматривает учет объективных (количественных) показателей, их статистическую обработку, напр., в виде уравнения регрессии. В зарубежной литературе неоднократно проводилось сравнительное изучение клинических и статистических прогнозов. Во многих исследованиях была продемонстрирована более высокая эффективность статистического прогноза. Однако вопрос об эффективности этих подходов не может быть решен альтернативно. В полноценном П. о. необходимо гармоничное сочетание клинического и статистического подходов, а не их противопоставление.

3 стр., 1308 слов

Программа изучения личности ребёнка

... посредством которого педагоги достигают тех или иных образовательно-воспитательных целей. 4.1.2. Программа изучения личности учащегося1 (первый вариант) Общие сведения об ученике Фамилия, имя. Где живет ребенок. ... труде. Дру­зья и знакомые ребенка вне школы. Состояние здоровья ученика (по данным школьного врача). Общий уровень развития ребенка Общее развитие. Культура речи, начитанность, регулярность ...

На определенном этапе П. о. нередко возникает необходимость упорядочения диагностических показателей, сведение их в систему. Эта задача многократно усложняется в случае, когда используемые диагностические методики опираются на различные теоретические положения, а полученные результаты выражаются не в общепринятых терминах. Интеграция разнородных данных может осуществляться на эмпирическом и теоретическом уровнях. В первом случае разрабатывается какая-либо схема сопоставления результатов отдельных методик без обращения к их теоретическим концепциям. Это может быть, напр., 5-балльная шкала, крайние значения которой характеризуют «высокий» и «низкий» показатели каждой методики. Теоретический уровень обобщения диагностических данных значительно сложнее. Здесь требуется систематизация полученных результатов на основе какой-либо теории и выражение их в понятиях этой теории.

На этапе принятия решения выделяют 3 уровня диагностических заключений. Практическая ценность диагноза во многом определяется возможностью осуществления на его основе прогноза психологического, который затруднен или не будет достоверным при отсутствии дополнительных данных, относящихся, в первую очередь, к среде (микросреде) жизнедеятельности личности. П. о. завершается разработкой программы действий, которые необходимо осуществить применительно к данному случаю, напр. дополнительные занятия по развитию тех или иных способностей у учащегося, направленное терапевтическое воздействие с учетом личностных особенностей пациента и т. д. для осуществления связи с полученными результатами. Итоги П. о. должны быть представлены в психологических понятиях, доступных неспециалисту.

В организации и проведении П. о. обязательно соблюдение этических норм психодиагностики. Психолог, проводящий П. о., должен иметь соответствующие задачам цели обследования уровня тестовой компетентности.

Каждое психологическое исследование на любом этапе развития психологии может быть реализовано в трех типах моделей: концептуальной, процедурной и эмпирической.

Концептуальная модель- это целостная система понятий, категорий и законов, раскрывающая теоретическую сущность данного явления и позволяющая его описывать, объяснять или непосредственно управлять им. В конкретном психологическом исследовании основу концептуальной модели составляют теоретические положения и концепции (отсюда термин «концептуальная модель»), в рамках которых выдвигается гипотеза для разрешения поставленной научной проблемы.

Процедурная модель-это определенные правила, алгоритмы, методики и методы конкретной науки по получению и переработке информации.

В эмпирической моделикак целостной системе количественных и качественных характеристик интересующего нас явления в конкретных пространственно-временных рамках реализуется степень правомерности концептуальной модели.

Научное психологическое исследование предполагает осознанный выбор цели исследования и его средств (методологию, подходы, методы, методики), ориентацию исследования на воспроизводимость результата. Научное исследование, в отличие от стихийных форм познания окружающего мира, основано на использовании научного метода познания.

3 стр., 1123 слов

Психофизиологические методики. Определения метода, методики, теста

... взаимодействия субъекта и объекта исследования на базе конкретного материала и конкретной процедуры. 3. Наука о методах обучения. Тесты – это стандартизированные методики психодиагностики, позволяющие получить сопоставимые ... 1. Как вы поняли, чем отличаются методы, методики и тесты? 2. Перечислите особенности методик высокого уровня формализации? 3. Какие методики по типу применяемых тестовых задач ...

Замысел исследования определяет его этапы, составляющие последовательность реализации замысла исследования. Обычно исследование состоит из трех основных этапов.

Первый этап — выбор проблемы и темы, определение объекта и предмета, целей и задач, разработка гипотезы исследования. В целях уточнения методики исследования, конкретизации его целей и задач иногда выделяется еще один этап — пробное (пилотажное) исследование, этот этап предваряет оформление методики исследования.

На втором этапе работы происходит выбор методов и разработка методики исследования, проверка гипотезы, непосредственно исследование, формулирование предварительных выводов, их апробирование и уточнение, обоснование заключительных выводов и практических рекомендаций.

Третий, заключительный этап строится с ориентацией на внедрение полученных результатов в практику. Работа литературно оформляется.

Логика каждого исследования специфична. Исследователь исходит из характера проблемы, целей и задач работы, конкретного материала, которым он располагает, уровня оснащенности исследования и своих возможностей.

Таким образом, главное отличие психодиагностического обследования от психологического исследования заключается в том, что в первом случае оно направлено на приложение к практике, т.е. имеет ярко выраженную практическую значимость, делается на определенный заказ и в конце делается заключение или ставится диагноз. У исследования же целью является опровержение или подтверждение какой-либо научной гипотезы. Исследование не имеет такой практической значимости, но обладает теоритической.

Способы классификации психодиагностических процедур

Психодиагностические методы объединяют в группы по разным основаниям. Вот некоторые наиболее распространенные классификации методов психодиагностики.

1. Классификации методов по Й.Шванцаре

Й.Шванцара объединяет психодиагностические методы в группы по следующим основаниям:

1. по используемому материалу (вербальные, невербальные, манипуляционные, тесты «бумаги и карандаша» и т.д.);

2. по количеству получаемых показателей (простые и комплексные);

3. тесты с «правильным» решением и тесты с возможностью различных ответов;

4. по психической активности испытуемых:

o интроспективные (сообщение испытуемого о личном опыте, отношениях): анкеты, беседа;

o экстроспективные (наблюдение и оценка разнообразных проявлений);

o проективные. Испытуемый проецирует неосознаваемые свойства личности (внутренние конфликты, скрытые влечения и др.) на малоструктурированные, многозначные стимулы;

o исполнительные. Испытуемый осуществляет какое-либо действие (перцепционное, мыслительное, моторное), количественный уровень и качественные особенности которого являются показателем интеллектуальных и личностных черт.

2. Классификации психодиагностических методов по В.К.Гайде, В.П.Захарову

Авторы этих классификаций объединяют психодиагностические методы по следующим основаниям:

1. по качеству: стандартизованные, нестандартизованные;

2. по назначению:

o общедиагностические (тесты личности по типу опросников Р.Кеттелла или Г.Айзенка, тесты общего интеллекта);

o тесты профессиональной пригодности;

o тесты специальных способностей (технических, музыкальных, тесты для пилотов);

o тесты достижений;

3. по материалу, которым оперирует испытуемый:

o бланковые;

o предметные (кубики Кооса, «сложение фигур» из набора Векслера);

o аппаратурные (устройства для изучения особенностей внимания и т.д.);

4. по количеству обследуемых: индивидуальные и групповые;

5. по форме ответа: устные и письменные;

6. по ведущей ориентации: тесты на скорость, тесты мощности, смешанные тесты. В тестах мощности задачи трудны и время решения не ограничено; исследователя интересует как успешность, так и способ решения задачи;

7. по степени однородности задач: гомогенные и гетерогенные (отличаются тем, что в гомогенных задачи схожи друг с другом и применяются для измерения вполне определенных личностных и интеллектуальных свойств; в гетерогенных тестах задачи разнообразны и применяются для оценки разнообразных характеристик интеллекта);

8. По комплексности: изолированные тесты и тестовые наборы (батареи);

9. по характеру ответов на задачи: тесты с предписанными ответами, тесты со свободными ответами;

10. по области охвата психического: тесты личности и интеллектуальные тесты;

11. по характеру умственных действий: вербальные, невербальные.

3. Классификации психодиагностических методов по А.А.Бодалеву, В.В.Столину

Авторы объединяют методы психодиагностики в группы по разным основаниям:

1. по характеристике того методического принципа, который положен в основу данного приема:

o объективные тесты (в которых возможен правильный ответ, то есть правильное выполнение задания);

o стандартизованные самоотчеты:

§ тесты-опросники, открытые опросники;

§ шкальные техники (семантический дифференциал Ч.Осгуда), субъективная классификация;

§ индивидуально-ориентированные техники (идеографические) типа ролевых репертуарных решеток;

o проективные техники;

o диалогические техники (беседы, интервью, диагностические игры);

2. по мере вовлеченности в диагностическую процедуру самого психодиагноста и степени его влияния на результат психодиагностики: объективные и диалогические. Первые характеризуются минимальной степенью вовлеченности психодиагноста в процедуру проведения, обработки и интерпретации результата, вторые – большой степенью вовлеченности. Мера вовлеченности характеризуется влиянием опыта, профессиональных навыков, личности экспериментатора и других его характеристик, самой диагностической процедурой. Ниже приведена шкала, на которой располагается весь континуум психодиагностических методов от полюса объективных до полюса диалогических.

ОБЪЕКТИВНЫЕ ДИАЛОГИЧЕСКИЕ
тесты многие опросники шкальные техники беседы интервью диагностические игры патопсихологический эксперимент некоторые проективные методики
   
   
     

 

 

Объективные тесты

Объективные тесты — методики, предназначенные для измерения результативности и способа (особенностей) выполнения заданий, тесты, в которых возможен правильный ответ, то есть правильное выполнение поставленных задач 3.объективные тесты — это диагностические МЕТОДИКИ, в которых результат в очень малой степени зависит от субъективного отношения диагноста к испытуемому, зависит только от профессионально-точного проведения методики. К числу объективных методик относятся: психофизиологические и АППАРАТУРНЫЕ методики, собственно объективные ПСИХОЛОГИЧЕСКИЕ ТЕСТЫ, ТЕСТЫ-ОПРОСНИКИ, методики ШКАЛИРОВАНИЯ. Некоторые формализованные процедуры КОНТЕНТ-АНАЛИЗА текстов также приближаются к О.Т. В методиках самоотчета (тест-опросники и субъективное шкалирование) искажения возникают не благодаря субъективности диагноста, но благодаря субъективному отношению испытуемого к процедуре (см. ПСИХОДИАГНОСТИЧЕСКАЯ СИТУАЦИЯ).

Вербальные и невербальные тесты

Эти тесты различаются по характеру стимульного материала. В вербальных тестах основным содержанием работы испытуемых являются операции с понятиями, мыслительные действия, осуществляемые в словесно-логической форме.

Составляющие эти методики задания апеллируют к памяти, воображению, мышлению в их опосредованной речевой форме. Они очень чувствительны к различиям в языковой культуре, уровню образования, профессиональным особенностям. Вербальный тип заданий наиболее распространен среди тестов интеллекта, тестов достижений, при оценке специальных способностей (например, творческих).

Невербальные тесты — это такой тип методик, в которых тестовый материал представлен в наглядной форме (в виде картинок, чертежей, графических изображений и т.п.).

Они включают речевую способность испытуемых только в плане понимания инструкций, само же выполнение этих заданий опирается на перцептивные, психомоторные функции. Самым известным невербальным тестом являются Прогрессивные матрицы Равена. Невербальные тесты уменьшают влияние языковых и культурных различий на результат обследования. Они также облегчают процедуру обследования испытуемых с нарушением речи, слуха или с низким уровнем образования. Невербальные тесты широко используются при оценке пространственного и комбинаторного мышления. В качестве отдельных субтестов они включены во многие тесты интеллекта, общих и специальных способностей, тесты достижений.

Тесты-опросники

Тесты-опросники — это набор заранее отобранных, тщательно продуманных вопросов, по ответам на которые выносится суждение о психологических качествах обследуемого индивидуума. Опросники предполагают набор пунктов (вопросов, утверждений), относительно которых испытуемый выносит суждения (как правило, используется двух — или трёхальтернативный выбор ответов) [5, с.18]. Тесты-опросники входят в группу методов, основанных на процедуре опроса. Существует несколько разновидностей этой группы методов: анкета, интервью, опросник. Анкетой называют метод, при котором испытуемый не только отвечает на ряд вопросов, но и сообщает некоторые социально-демографические данные о себе (возраст, профессию, уровень образования, место работы, должность, семейное положение и тому подобное).

Принято считать, что анкеты — социологическая методика, а тесты-опросники — психологическая. Интервью представляет собой устный вид опроса: психолог сам задаёт испытуемому вопросы и сам же записывает ответы на них. Эти вопросы определяются заранее и могут быть тех же типов, что и при письменном опросе. Опросник является письменным набором вопросов. Тесты-опросники помогают измерять у испытуемого самооценку его поведения, привычек, а также то, как он оценивает других людей.

Открытые опросники.

Предусматривают свободные ответы без каких-либо особых ограничений. Испытуемые дают ответ по своему усмотрению. Стандартизация обработки достигается путем отнесения произвольных ответов к стандартным категориям. Открытые опросники наряду с достоинствами (получение развернутой информации об испытуемом, проведение качественного анализа ответов) имеют и определенные недостатки: сложность формализации ответов и их оценок, трудности интерпретации результатов, громоздкость процедуры и большие затраты времени.

Форма ответов в личностных опросниках может быть представлена также в виде шкалы измерений. В этом случае предполагается оценка тех или иных утверждений по выраженности в них качества, представленного шкалой в виде отрезка прямой (например, двухполюсная шкала: трудный-легкий, хороший-плохой).

Обычно используются шкалы с тремя, пятью или семью подразделениями, обозначенными на отрезке прямой. Испытуемый должен отметить степень выраженности оцениваемого качества.

По содержанию личностные опросники могут быть подразделены на опросники черт личности, опросники типологические, опросники мотивов, опросники интересов, опросники ценностей, опросники установок.

Шкальные техники

Шкальные техники предполагают оценку тех или иных объектов (словесных утверждений, конкретных лиц и др.) по выраженности в них качества, заданного шкалой, например, исследование самооценки С.Я.Рубинштейн.

Испытуемый ставит на шкале черту, которая символизирует степень выраженности у него того или иного свойства.

8.Индивидуально-ориентированные техники

Типа репертуарных решёток могут по форме совпадать со шкальными, опросными методами, напоминать беседу или интервью. Их основное отличие от тест-опросников состоит в том, что параметры, которые оцениваются (оси, измерения, конструкты), не задаются извне, а выделяются на основе индивидуальных ответов данного конкретного испытуемого. Отличие этих методов от метода интервью состоит в том, что репертуарные решётки позволяют осуществлять применение современного статистического аппарата и делают довольно надёжными диагностические выводы относительно индивидуальных особенностей субъекта.

Диалогические техники.

Диалогические техники учитывают, что психодиагност вступает в контакт с обследуемым и достигает наилучших диагностических результатов за счет специфических особенностей этого контакта, релевантных диагностической задаче. Так, доверительный контакт необходим при диагностике семейных затруднений, характера личностного развития ребенка и во многих других случаях, в которых диагност одновременно выступает или в роли консультанта, или психотерапевта. Ситуация диагностического патопсихологического обследования диктует построение общения по принципу экспертизы.

Диалогические техники могут быть вербальными (интервью, беседы) и невербальными (например, игра с ребенком может выступать как невербальная диагностическая процедура).

Проективные тесты.

Проективные тесты, по мнению Л. Франка — это такой приём исследования личности, при котором испытуемого помещают в ситуацию, реакцию на которую он осуществляет в зависимости от значения для него этой ситуации, от его мыслей и чувств. Проективные техники основаны на том, что недостаточно структурированный материал, выступающий в качестве стимула, при соответствующей организации всего эксперимента в целом порождает процессы фантазии, воображения, в которых раскрываются те или иные характеристики субъекта [5, с. 19]. Главной отличительной особенностью проективных методик является относительно неструктурированная задача для испытуемого: задача, допускающая почти неограниченное разнообразие возможных ответов. Для того чтобы фантазия индивидуума смогла свободно разыграться, даются только краткие, общие инструкции. По этой же причине тестовые стимулы обычно расплывчаты и неоднозначны [1, с.450]. Проективные тесты основаны не на прямой, а на косвенной оценке тех или иных психологических качеств человека. Такая оценка получается в результате анализа того, как данный человек воспринимает и интерпретирует некоторые многозначные объекты: сюжетно неопределённые картинки, бесформенные пятна, незавершённые предложения и другие объекты. Предполагают, что, оценивая и интерпретируя подобные объекты, человек бессознательно вкладывает или проецирует самого себя.

Аппаратурные тесты.

Аппаратурные тесты — это такой тип методик, который требует применения специальных технических средств или специального оборудования для проведения исследования или регистрации полученных данных. Широко известны приборы для исследования показателей времени реакции (реактометры, рефлексометры), устройства для изучения особенностей восприятия, памяти, мышления. В последние годы аппаратурные тесты широко используют компьютерные устройства. В большинстве случаев аппаратурные тесты проводятся индивидуально.

12.Надёжность теста

Под надёжностью теста понимается степень точности, с которой тест измеряет определённое свойство или способ поведения личности. Надёжность теста – это характеристика точности его как измерительного инструмента, его устойчивости к действию помех (как внешних, так и внутренних).

Эмпирическое определение надёжности теста является обязательным условием его допуска для использования в практической деятельности психолога.

В психометрике обоснование получили три метода оценки надёжности тестов:

1) метод повторного тестирования (метод тест-ретест);

2) метод тестирования параллельной, или эквивалентной, формой теста;

3) метод деления, или расщепления теста на части. Оценка надёжности по методу повторного тестирования требует, чтобы тест дважды предъявлялся одной и той же выборке испытуемых через какое-то время. Длительность временного промежутка определяется содержанием и характером задач теста.

Второй метод оценки надёжности теста требует наличия параллельной, то есть эквивалентной, формы теста, например формы «А» и «Б». Репрезентативную выборку испытуемых, на которой проверяется надёжность теста, случайным образом делят на две примерно равночисленные группы. Затем первой группе предъявляются задачи формы «А», а второй группе – задачи формы «Б». Через некоторое время (не более одной недели) задачи формы «Б» решает первая группа, а формы «А» — вторая. После этого для всей репрезентативной выборки испытуемых отдельно вычисляются первичные результаты для форм «А» и «Б», которые затем подвергаются корреляции.

Общим недостатком первых двух методов оценки надёжности теста является то, что они зачастую дают заниженные или завышенные коэффициенты надёжности. Дело в том, что дисперсия результатов, на основе которой рассчитывается коэффициент корреляции, неоднородна по своему составу. Наряду с дисперсией действительных индивидуальных различий в неё входят частные дисперсии, обусловленные влиянием как внутренних, психологических, причин (колебания внимания, усталость и др.), так и внешних (уличный шум, поведение и высказывания исследователя и т. п.).

При этом сила и сочетание этих причин в первом и во втором тестировании могут быть различными, и оценить их влияние или полностью их нейтрализовать оказывается невозможным.

Поэтому, особенно при проверке надёжности тестов мощности (например, интеллектуальных тестов) и достижений, предпочтение следует отдавать третьему методу, поскольку он предполагает лишь однократное тестирование. Третий метод оценки надёжности включает два различных приёма расчёта: разделение тестовых задач на две части, например по принципу «чётные и нечётные», и расчёт коэффициента консистентности задач теста.

Виды валиджности и способы валидизации теста

Выделяют три вида валидности – содержательную, критериальную и конструктную20. А.Майоров приводит следующую диаграмму видов валидности18:

 

 

 

КОНСТРУКТНАЯ ВАЛИДНОСТЬ (концептуальная валидность) определяется в случаях, когда представление об измеряемом свойстве существует в форме абстрактного образа, модели. Для объяснения определенных качеств личности создается концептуальная модель, которая с помощью тестов подтверждается или опровергается.

КРИТЕРИАЛЬНАЯ ВАЛИДНОСТЬ (эмпирическая валидность) предполагает наличие внешнего критерия, корреляция с которым определяет валидность теста.

Имеется два вида критериальной валидности – текущая и прогностическая.

Текущая критериальная валидность (concurrent validity) характеризует способность теста измерять некоторые качества личности. Валидность теста подтверждается корреляцией с некоторым внешним критерием, существующим в данное время. Допустим, тест показал для некоторого испытуемого отличные знания по предмету, а школьные отметки, выставленные учителем – неудовлетворительные. Если мы в качестве внешнего, независимого и достоверного критерия выберем школьные отметки, то критериальная валидность теста – низкая, даже если он имеет высокую надежность.

Прогностическая критериальная валидность (predictive validity) характеризует способность теста предсказывать будущие качества, формирующихся в результате воздействия внешних обстоятельств или целенаправленной собственной деятельности. Этот тип валидности характеризует корреляцию результатов тестирования с внешним критерием, который появится в будущем.

СОДЕРЖАТЕЛЬНАЯ ВАЛИДНОСТЬ (content validity) характеризует тест по степени его соответствия предметной области.

Согласно А.Анастази, содержательная валидность означает систематическую проверку содержания теста, с тем чтобы установить, соответствует ли оно репрезентативной выборке измеряемой области поведения. Такая процедура валидизации обычно применяется для тестов достижений20.

Содержательная валидность необязятельно означает полноту отображения изучаемой дисциплины. Например, для нормативно-ориентированного теста, полнота охвата всех тем может быть меньше, чем для критериально-ориентированного. Здесь важнее глубина проработки отдельных подтем, вопросов. Это позволит с большей эффективность дифференцировать обучаемых. Под содержанием понимается не только совокупность фактов, понятий, терминов, но и умение применять имеющиеся знания, оценивать информацию, выполнять действия, соответствующие верхним уровням таксономии Блума.

Валидизация, основанная на критерии:

Метод требует демонстрации корреляции или другой статистической связи между тестовым баллом и уровнем выполнения «работы» (например, решением математических задач).

Другими словами, люди с высоким тестовым баллом имеют тенденцию лучше выполнять работу, чем люди с более низким тестовым баллом. Если критерий для сравнения нам известен во время проведения теста, то это называется совместной валидностью, а если значения критерия проявляются в более позднее время, то это предиктивная валидность. Например, соответствие последующей успеваемости студента с баллом вступительных экзаменов – это предиктивная валидность, а согласованность с этим баллом результатов школьных выпускных экзаменов – совместная валидность.

Валидность, основанная на критерии измеряется коэффициентом валидности. Это число между 0 и 1, которое степень близости «r» между тестом и мерой выполнения «работы» (критерием).

Чем больше значение коэффициента, тем более вы можете в предсказаниях, основанных на тестовом балле. Тем ни менее, один тест никогда не может полностью предсказать степень исполнения «работы», так как слишком много различных факторов влияют на успех в «работе». Поэтому коэффициент валидности, в отличии от коэффициентов надежности, редко превышает r = 0.40.

Валидизация, основанная на свойстве:

Метод требует демонстрации того, что тест измеряет свойство или характеристику, для которой он и предназначен. Этот метод часто применяется для тестов, которые меряют абстрактные величины. Например, валидность, основанная на свойстве, может быть использована, когда школа оценивает «хорошесть» учеников. В данном случае, «хорошесть» — не некая наблюдаемая величина, а концепция, созданная, чтобы объяснить возможное поведение учеников в будущем. Чтобы продемонстрировать, что тест имеет хорошую валидность, основанную на свойстве, школе будет необходимо показать, что, во-первых, тест действительно измеряет это свойство и, во-вторых, это свойство связано с хорошей успеваемостью учеников.

Валидность, основанная на свойстве, часто используется для измерения психологических черт личности, например, интеллигентность, самосознание или креативность. Есть несколько способов проверить валидность, основанную на свойстве. Например, можно продемонстрировать, что вопросы в тесте связаны и, таким образом, измеряют одну величину. Внутриклассовая корреляция и факторный анализ часто используются для того, чтобы продемонстрировать связь между вопросами. Другой подход – это продемонстрировать, что значения теста ведут себя так же, как вы ожидаете должны вести себя значения свойства. Например, предполагается, что мера креативности должна показывать большую корреляцию с артистическими способностями, чем со школьными успехами.

Также, для самопроверки полезно задать следующие вопросы:

— Действительно ли концептуальная основа для каждого тестируемого свойства хорошо обоснована и ясна?

— Почему мы предполагаем, что свойство связано с целью теста?

Анализ заданий.

В качестве дополнительной меры для улучшения валидности теста можно провести анализ заданий. По определению, наличие в тесте задания, провоцирующего социально одобряемые реакции, должно приводить к тому, что распределение ответов на него будет смещено, то есть не будет соответствовать нормальному распределению. Таким образом, устранением из теста заданий с распределением ответов, отличным от нормального, мы избавимся от действия установки на социально одобряемые ответы. Более того, если большинство заданий дают нормальное распределение ответов и они нагружены некоторым общим фактором, тогда установка на социально одобряемые ответы не может оказывать сильное влияние и на другие задания, относящиеся к тому же фактору. Подобные аргументы приводятся при анализе заданий с использованием бисериальной корреляции результатов выполнения каждого задания с общим показателем по тесту. Таким образом, при адекватном анализе те задания, результат выполнения которых подвержен влиянию установки на социально одобряемые ответы, должны быть устранены, если только, по нелепой случайности, все задания, выбранные нами для теста, не оказались измеряющими эту черту.

Факторы, угрожающие внутренней и внешней валидности

Приводится 12 факторов, угрожающих валидности различных экспериментальных планов. Каждый фактор будет подробнее описан при обсуждении тех планов, в которых его действие проявляется наиболее отчетливо, и этот список будет завершен после обсуждения 10 из 16 планов. Основным при составлении этого списка было различение внутренней и внешней валидности.

Внутренняя валидность — это тот минимум, без которого не может быть интерпретирован ни один эксперимент: действительно ли именно это экспериментальное воздействие привело к изменениям в данном эксперименте? Внешняя валидность относится к возможности обобщения вывода: на какие популяции, ситуации, другие независимые переменные, параметры воздействия и переменные измерения могут быть распространены результаты эксперимента. Несомненно, что оба типа критериев являются важными, хотя часто они находятся в противоречии в том смысле, что увеличение валидности одного типа может угрожать валидности другого типа. Хотя внутренняя валидность есть условие sine qua non и хотя проблема внешней валидности, как и проблема индуктивного вывода, никогда не может быть полиостью решена, очевидно, что нашим идеалом является выбор таких экспериментальных планов, которые обеспечивают оба типа валидности. Это особенно важно для педагогических исследований, где весьма желательным является распространение данных на практические ситуации определенного характера. Различия и взаимоотношения между этими двумя видами валидности станут яснее после рассмотрения примеров при обсуждении конкретных типов эксперимента.

Далее будут представлены восемь различных классов внешних переменных, относящихся к внутренней валидности. Если эти переменные не контролируются в экспериментальном плане, то они могут дать эффекты, которые смешиваются с эффектом экспериментального воздействия. Эти переменные представляют влияние:

1) фона (history) — конкретных событий, которые происходят между первым и вторым измерением наряду с экспериментальным воздействием;

2) естественного развития (maturation) — изменений испытуемых, являющихся следствием течения времени per se (не связанных с конкретными событиями), например взросление, усиление голода, усталости и т. п.;

3) эффекта тестирования (testing) — влияния выполнения заданий, применяемых для измерения, на результаты повторного испытания;

4) инструментальной погрешности, нестабильности измерительного инструмента (instrumentation), при которой изменения в калибровке инструмента или изменения, характеризующие наблюдателя или оценочные показатели, могут вызвать изменения в результатах измерения;

5) статистической регрессии (statistical regression), имеющей место тогда, когда группы отбираются на основе крайних показателей и оценок;

6) отбора испытуемых (selection) — неэквивалентности групп по составу, вызывающей появление систематической ошибки в результатах;

7) отсева в ходе эксперимента (experimental mortality) — неравномерности выбывания испытуемых из сравниваемых групп;

8) взаимодействий фактора отбора с естественным развитием и др., которые в ряде квазиэкспериментальных планов с несколькими группами (таких, как план 10) ошибочно принимаются за эффект экспериментальной переменной.

К факторам, ставящим под угрозу внешнюю валидность, или репрезентативность эксперимента, относятся:

9) реактивный эффект, или эффект взаимодействия тестирования, — возможное уменьшение или увеличение сензитивности, или восприимчивости, испытуемых к экспериментальному воздействию под влиянием предварительного тестирования. Результаты лиц, прошедших предварительное тестирование, будут нерепрезентативны по отношению к тем, кто не подвергался предварительному тестированию, то есть тем, из кого состоит генеральная совокупность, из которых были отобраны испытуемые;

10) эффекты взаимодействия фактора отбора и экспериментального воздействия;

11) условия организации эксперимента, вызывающие реакцию испытуемых на эксперимент, которая не позволяет распространить полученные данные о влиянии экспериментальной переменной на лиц, подвергающихся такому же воздействию в неэкспериментальных условиях;

12) взаимная интерференция экспериментальных воздействий, нередко возникающая, когда одни и те же испытуемые подвергаются нескольким воздействиям, поскольку влияние более ранних воздействий, как правило, не исчезает. Это относится особенно к планам экспериментов с одной группой (планы типа 8 и 9).

 

Вопросы к письменной контрольной работе по итогам семинара.

Надежность теста.

Надежность теста — фундаментальная характеристика теста, которая показывает в какой степени стабильны результаты тестирования при неоднократном обследовании. Надежность теста может определяться путем повторного тестирования (через строго определенный отрезок времени) и вычисления коэффициента корреляции между результатами первого и повторного тестирования. Надежность теста может определяться и путем тестирования с помощью нескольких вариантов одного и того же теста, деления теста на две половины и т.д. Надежность результатов тестирования зависит не только от качества самого теста, но и от процедуры проведения тестирования (она должна быть абсолютно идентичной в первом и во втором случае), социально-психологической однородности выборки (н. т. будет различной для детей, мужчин, женщин, солдат первого года – службы, старослужащих солдат и т.д.).

И может получиться, что будучи надежным для одной группы людей, тест окажется ненадежным для другой, результаты тестирования в последнем случае будут неверны. Таким образом, н.т., выражая степень неточности, возможность ошибки, возникающей неизбежно при любом тестировании, заставляет искать пути уменьшения этой ошибки, более конкретного, целеустремленного применения теста. Надежность лучших тестов составляет 0,8 — 0,9.

2. «Тест-ретест».

«Тест-ретест» показывает вероятность возникновения различных результатов при двух замерах одного и того же объекта одинаковым инструментом, но не дает никаких сведений об источнике ошибки. В частности, при повторном интервьюировании очень велика вероятность влияния первого замера на второй и последующие. Нормы морали предписывают держать свое слово, и те, у кого семь пятниц на неделе, не одобряются. Поэтому респондент склонен давать сходный ответ, если он запомнил его при первом опросе. В итоге оценка надежности инструмента будет явно завышена. На самом деле социологические признаки (особенно мнения и оценки) меняются. Если изменения будут зафиксированы, «тест-ретест» в данном случае покажет заниженную надежность.

3.Эквивалентные альтернативные формы (эквивалентные формы теста, equivalent forms of a test) являются подобными по цели и по существу, и для них полностью доказана статистическая однородность распределений вероятностей значений их показателей. В частности, для эквивалентных форм установлено, что средние, дисперсии (средние квадратические отклонения) однородны (для уровня значимости a ≤ 0,05, или то же что Q ≤ 5%), и установлено высокое значение коэффициента корреляции между ними (r ≥ 0,9 для уровня значимости a ≤ 0,05, или Q ≤ 5%).

Таким образом, деление на категории основано на степени доказанности однородности распределений вероятностей значений показателей альтернативных форм: (1) — однородность не доказана, (2) — однородность частично доказана, (3) — однородность доказана полностью.

Применение эквивалентных форм теста позволяет оценить вариативность исследуемой сущности или явления. При использовании в исследовании вероятностной методологии, когда предполагается, что вариативность сама является сущностным психофизиологическим показателем (Трифонов Е.В., 1962, …, 2002), применение эквивалентных форм теста (или субтестов) является правилом.

4. Метод расщепления состоит в том, что тест разбивают на две сопоставимые части. Респондент выполняет задания этих двух частей в течение одного сеанса с получением двух результатов (например, тест Равена содержит две части: четные и нечетные задания).

5. Все методы психологической диагностики, начиная со стандартизованных и заканчивая нестандартизованными, направлены на измерение свойств личности и особенностей интеллекта.

Каждый метод предназначен для измерения какого-либо свойства, что и определяет содержание этого метода. Сведения о степени, в которой тест действительно измеряет то, для чего он предназначен, входят в понятие валидности .

Валидность и надежность. Тест может быть надежен, но не валиден. Это означает, что он измеряет какое-то свойство очень точно, но какое именно – остается под вопросом. В такой ситуации необходима более точная валидизация теста, как содержательная, так и практическая.

6. Виды валидности:

Очевидная (внешняя валидность) — отражает, насколько по внешне­му впечатлению от методики можно определить её направленность.

Конкурентная валидность — характеризует, как результаты, получен­ные по данной методике, коррелируют с результатами по другим тестам.

Прогностическая валидность — отражает, как задания данной мето­дики коррелируют с каким-либо поздним временным критерием.

Валидность по внешнему критерию — показывает, как задания мето­дики коррелируют с каким-либо внешним критерием.

Содержательная валидность — определяет, насколько задания теста отражают все аспекты исследуемой области поведения.

Конструктная валидность.Предполагает полное описание измеряемой переменной, выдвижение системы гипотез о связях ее с другими переменными, эмпирическое подтверждение (неопровержение) этих гипотез.

7. Процедура эмпирической валидизации.

Организация выборки при эмпирической валидизации зависит от временного статуса критерия. Если этот критерий — событие в прошлом (ретроспективная валидизация), то к участию в психодиагностическом обследовании доста­точно привлечь только тех испытуемых, которые оказались на экстремальных полюсах по этому критерию. В результате применяется метод экстремальных (контрастных) групп. Коррелирование с суммарным баллом по тесту оценивается с помощью бисериального коэффициента по формуле (3.2.17).

При этом в статусе дихотомической переменной (на месте отдельного пункта) оказывается сам критерий валидности: x— сумма баллов по тесту, полученных «высокой» группой по критерию; — стандартная ошибка критерия, связанная с численностью «высокой» (р) и «низкой» (q) групп.

8. Провести теоретическую валидизацию методики – это показать, действительно ли методика измеряет именно то свойство, качество, которое она, по замыслу исследователя, должна измерять. Так, например, если какой-то тест разрабатывался для того, чтобы диагностировать умственное развитие школьников, надо проанализировать, действительно ли он измеряет именно это развитие, а не какие-то другие особенности(например, личность, характер и т.п.).

Таким образом, для теоретической валидизации кардинальной проблемой является отношение между психическими явлениями и их показателями, посредством которых эти психические явления пытаются познать. Она показывает, что замысел автора и результаты методики совпадают.

9. Приводится 12 факторов, угрожающих валидности различных экспериментальных планов. Каждый фактор будет подробнее описан при обсуждении тех планов, в которых его действие проявляется наиболее отчетливо, и этот список будет завершен после обсуждения 10 из 16 планов. Основным при составлении этого списка было различение внутренней и внешней валидности.

Внутренняя валидность — это тот минимум, без которого не может быть интерпретирован ни один эксперимент: действительно ли именно это экспериментальное воздействие привело к изменениям в данном эксперименте? Внешняя валидность относится к возможности обобщения вывода: на какие популяции, ситуации, другие независимые переменные, параметры воздействия и переменные измерения могут быть распространены результаты эксперимента. Несомненно, что оба типа критериев являются важными, хотя часто они находятся в противоречии в том смысле, что увеличение валидности одного типа может угрожать валидности другого типа. Хотя внутренняя валидность есть условие sine qua non и хотя проблема внешней валидности, как и проблема индуктивного вывода, никогда не может быть полиостью решена, очевидно, что нашим идеалом является выбор таких экспериментальных планов, которые обеспечивают оба типа валидности. Это особенно важно для педагогических исследований, где весьма желательным является распространение данных на практические ситуации определенного характера. Различия и взаимоотношения между этими двумя видами валидности станут яснее после рассмотрения примеров при обсуждении конкретных типов эксперимента.

Далее будут представлены восемь различных классов внешних переменных, относящихся к внутренней валидности. Если эти переменные не контролируются в экспериментальном плане, то они могут дать эффекты, которые смешиваются с эффектом экспериментального воздействия. Эти переменные представляют влияние:

1) фона (history) — конкретных событий, которые происходят между первым и вторым измерением наряду с экспериментальным воздействием;

2) естественного развития (maturation) — изменений испытуемых, являющихся следствием течения времени per se (не связанных с конкретными событиями), например взросление, усиление голода, усталости и т. п.;

3) эффекта тестирования (testing) — влияния выполнения заданий, применяемых для измерения, на результаты повторного испытания;

4) инструментальной погрешности, нестабильности измерительного инструмента (instrumentation), при которой изменения в калибровке инструмента или изменения, характеризующие наблюдателя или оценочные показатели, могут вызвать изменения в результатах измерения;

5) статистической регрессии (statistical regression), имеющей место тогда, когда группы отбираются на основе крайних показателей и оценок;

6) отбора испытуемых (selection) — неэквивалентности групп по составу, вызывающей появление систематической ошибки в результатах;

7) отсева в ходе эксперимента (experimental mortality) — неравномерности выбывания испытуемых из сравниваемых групп;

8) взаимодействий фактора отбора с естественным развитием и др., которые в ряде квазиэкспериментальных планов с несколькими группами (таких, как план 10) ошибочно принимаются за эффект экспериментальной переменной.

К факторам, ставящим под угрозу внешнюю валидность, или репрезентативность эксперимента, относятся:

9) реактивный эффект, или эффект взаимодействия тестирования, — возможное уменьшение или увеличение сензитивности, или восприимчивости, испытуемых к экспериментальному воздействию под влиянием предварительного тестирования. Результаты лиц, прошедших предварительное тестирование, будут нерепрезентативны по отношению к тем, кто не подвергался предварительному тестированию, то есть тем, из кого состоит генеральная совокупность, из которых были отобраны испытуемые;

10) эффекты взаимодействия фактора отбора и экспериментального воздействия;

11) условия организации эксперимента, вызывающие реакцию испытуемых на эксперимент, которая не позволяет распространить полученные данные о влиянии экспериментальной переменной на лиц, подвергающихся такому же воздействию в неэкспериментальных условиях;

12) взаимная интерференция экспериментальных воздействий, нередко возникающая, когда одни и те же испытуемые подвергаются нескольким воздействиям, поскольку влияние более ранних воздействий, как правило, не исчезает. Это относится особенно к планам экспериментов с одной группой (планы типа 8 и 9).

10. Диагностическая методика отличается от любой исследовательской тем, что она стандартизирована.

10.Стандартизация (по Анастази) – это единообразие процедуры проведения и оценки выполнения теста. Таким образом, стандартизация рассматривается в двух планах: как выработка единых требований к процедуре эксперимента и как определение единого критерия оценки результатов диагностических испытаний. Стандартизация процедуры эксперимента подразумевает унификацию инструкций, бланков обследования, способов регистрации результатов, условий проведения обследования.

 

11.Требования к проведению теста

1. инструкции следует сообщать испытуемым одинаковым образом, как правило, письменно; в случае устных указаний они даются в разных группах одними и теми же сло-вами, понятными для всех, в одинаковой манере;

2. ни одному испытуемому не следует давать никаких преимуществ перед другими;

3. в процессе теста не следует давать отдельным испытуемым дополнительные пояснения;

4. тест с разными группами следует проводить в одинаковое по возможности время дня, в сходных условиях;

5. временные ограничения в выполнении заданий для всех испытуемых должны быть одинаковыми и так далее.

12. Отдельно следует остановиться на классификации диагностических процедур по такому критерию, как характер оценки. Совершенно естественно, что практически любой вид психологической диагностики можно рассматривать как процедуру экспертизы, то есть «рассмотрение какого-либо вопроса экспертами для вынесения заключения», «исследование какого-либо вопроса, требующего специальных знаний с представлением мотивированного заключения» (Толковый словарь русского языка, 1995).
Конечной целью любой экспертизы является ответ на поставленный заказчиком вопрос, который оформляется в виде экспертного заключения. Вопросы, решаемые экспертным исследованием, определяются на основе реальных потребностей практики. Основными форм

13. Выборка стандартизации — множество испытуемых, на котором собираются диагностические нормы и проводится стандартизация диагностической шкалы.

Всякая большая совокупность людей, которую хотели бы исследо­вать или относительно которых собираются делать выводы, называет­ся генеральной совокупностью.

14. В общих чертах стандартизация диагностической методики, ориентированной на норму, осуществляется путем ее проведения на большой представительной выборке испытуемых, которая ничем не отличается от той, для которой данная методика предназначена. На этой группе испытуемых, называемой выборкой стандартизации, разрабатываются нормы, указывающие не только средний уровень выполнения, но и его относительную вариативность выше и ниже среднего уровня. В результате можно оценить разные степени успешности или неуспешности в выполнении диагностической пробы. Это позволяет определить положение конкретного испытуемого относительно выборки стандартизации.

Для вычисления статистической нормы психологи-диагносты обратились к давно применяемым в биологии приемам математической статистики.

Рассмотрим пример.

На призывной пункт явилось несколько тысяч молодых людей.

Допустим, что все они примерно одного возраста. Что мы получим при измерении их роста? Обычно оказывается, что большинство почти одного роста, совсем немного будет людей очень маленького и очень высокого роста. Остальные же распределятся симметрично, уменьшаясь по количеству от среднего максимума в ту и другую сторону. Распределение рассматриваемых величин — это нормальное распределение (или распределение по нормальному закону, кривая распределения Гаусса).

Математики показали, что для описания такого распределения достаточно знать два показателя — среднюю арифметическую и так называемое стандартное отклонение, которое получается путем несложных вычислений. Назовем среднюю арифметическую х, а стандартное отклонение ? (сигма малая).

При нормальном распределении все изучаемые величины практически находятся в пределах х + 5 ?.

Рассмотрим как определялась статистическая норма для тестов Стэн-форд-Бине. В группу испытуемых входили 4498 человек от 2,5 до 18 лет. Усилия стэнфордских психологов были направлены на то, чтобы распределение полученных по каждому возрасту данных о выполнении тестов было близко к нормальному. Этого результата удалось добиться далеко не сразу; в некоторых случаях ученым приходилось заменять одни задания другими. В конце концов эта работа была закончена, и были подготовлены тесты по каждому возрасту со средней арифметической, равной 100, и со стандартным отклонением, равным 16. Принимается, что результаты в пределах х ± ? показывают границы наиболее характерной, представительной части распределения, границы нормы для данного возраста. При ? = 16 и х = 100 эти границы нормы будут от 84 до 116. Интерпретируется это так: результаты испытуемых, которые не выходят за эти границы, находятся в пределах нормы. Те, чьи результаты менее 84, находятся ниже нормы, а те, чьи результаты более 116, — выше нормы. Нередко этот же прием применяют и для дальнейшей классификации. Тогда результаты в пределах от х — ? до х — 2 ? интерпретируются как «несколько ниже нормы», а от х — 2 ? до х — З ? — как «значительно ниже нормы». Соответственно классифицируются результаты, находящиеся выше нормы.

15. В психодиагностике существует и другой подход к оценке результатов диагностических испытаний. В нашей стране под руководством К. М. Гуревичаразрабатываются тесты, в которых в качестве точки отсчета выступает не статистическая норма, а независимый от результатов испытания, объективно заданный социально-психологический норматив.

Социально-психологический норматив реализуется в совокупности заданий, составляющих тест. Следовательно, сам тест в полном его объеме и является таким нормативом. Все сопоставления индивидуальных или групповых результатов тестирования проводятся с тем максимумом, который представляется в тесте (а это полный набор знаний).

В качестве критерия оценки выступает показатель, отражающий степень близости результатов к нормативу. Имеется разработанная схема представления групповых количественных данных.

Для анализа данных относительно их близости к социально-психологическому нормативу, условно рассматриваемому как 100 %-ное выполнение всего теста, все испытуемые подразделяются по результатам тестирования на 5 подгрупп:

1) наиболее успешные — 10%;
2) близкие к успешным — 20 %;
3) средние по успешности — 40 %;
4) мало успешные — 20 %;
5) наименее успешные — 10%.

Для каждой из подгрупп подсчитывается средний процент правильно выполненных заданий. Строится система координат, где по оси абсцисс идут номера подгрупп, по оси ординат — процент выполненных каждой из подгрупп заданий. После нанесения соответствующих точек вычерчивается график, отражающий приближение каждой из подгрупп к социально-психологическому нормативу. Такая обработка проводится по результатам как теста в целом, так и каждого субтеста в отдельности.