Педагогическое тестирование преимущества и недостатки

Содержание Введение 1. Основные понятия и определения 4 2. Из истории теста 3. Психологи о педагогическом тестировании 4. Виды тестов 5. Методика формирования теста 6. Понятие валидности и надежности теста 17 Заключение 18 Список литературы 19 Введение Тест  это объективное и стандартизированное измерение, поддающееся количественной оценке, статистической обработке и сравнительному анализу.

Тест служит оценке знаний испытуемого и должен отвечать ряду принципов: 1. Применение серии одинаковых испытаний к большому количеству испытуемых. 2. Статистическая обработка результатов. 3. выделение эталонов оценки. В данный момент тестовые задания широко используются в целях изучения и запоминания учебных материалов в образовательных учреждениях нашей страны. Целью данной работы является установление основ педагогического тестирования, выявление проблем и технических путей их разрешения.

Задачи: — дать определение теста; — рассмотреть историю развития теста; — показать психологические аспекты тестирования; — установить виды тестов; — определить методику составления тестов; — выявить основные проблемы. 1.

Основные понятия и определения

Существует несколько современных определений тестов для педагогической области. Приведем некоторые из них. Тест  это объективное и стандартизированное измерение, поддающееся количественной оценке, статистической обработке и сравнительному анализу.

Тест  это специфический инструмент, состоящий из совокупности заданий или вопросов и проводимый в стандартных условиях, позволяющий выявить типы поведения, уровень владения какими-либо видами деятельности. Тест  стандартизированное, часто ограниченное во времени испытание, предназначенное для установления количественных и качественных индивидуально-психологических особенностей.

Как правило, стандартизация подразумевает единоообразие процедуры проведения и оценки выполнения теста. Тест достижений  это система заданий специфической формы, определенного содержания возрастающей трудности, позволяющая качественно оценить структуру и эффективно измерить уровень ЗУН и представлений по изучаемой дисциплине. При кажущемся различии эти определения близки между собой. Тест в психолого-педагогическом понимании этого слова означает проверку, испытание, но это не простое установление факта наличия или отсутствия какого-либо качества или свойства.

Тест не тождественен экзаменационным вопросам, в его основе лежит специально подготовленный и прошедший экспериментальную проверку набор заданий, позволяющий объективно и надежно оценить исследуемые качества и свойства на основе использования экспертных оценок и статистических методов. В сфере педагогического тестирования существуют два основных подхода: 1. Нормативно-ориентировочный. 2. Критериально-ориентированный. Их главное отличие друг от друга заключается в способе интерпретации результатов измерения тестовых баллов.

11 стр., 5318 слов

Педагогические тесты. Термины и определения

... педагогического контроля достигается разными путями. Первый, традиционный путь - формирование коллегиальной оценки, для чего создаются различные комиссии, состав и число членов которых зависит ... оправдываются студентами как проявление товарищеской взаимопомощи, групповой солидарности. Вопрос о справедливости оценки не случайно ассоциируется в сознании студентов с понятием объективности. Мнение ...

Для первого подхода характерно сопоставление индивидуального результата с результатами других учащихся. Эти тесты лучше всего подходят для решения задач, связанных со сравнением уровня учебных достижений, ранжированием и отбором:  сравнение индивидуальных результатов учащихся со среднегрупповыми;  сравнение учебных достижений отдельных испытуемых, проведение на этой основе ранжирования учащихся;  сравнение между собой достижений учебных классов и учебных заведений;  отбор фиксированного количества испытуемых, например, при приеме в учебное заведение или переходе на следующую ступень (уровень) образования. В основе второго подхода лежит сопоставление индивидуальных результатов тестирования с общим объемом знаний, который должен быть усвоен учащимся на данном этапе обучения.

Эти тесты используются для решения задач, связанных с оценкой доли учебного материала, усвоенного испытуемым.

Основные из этих задач следующие:  оценка доли учебного материала, усвоенной учащимся;  сопоставление с требуемым стандартом образования достижений отдельных учащихся учебных групп;  аттестация учебных заведений на основании сопоставления знаний с требуемым стандартом;  выбор стратегии дальнейшего обучения;  диагностика трудностей с обучении;  отбор испытуемых, достигших необходимого уровня знаний, например, при окончании учебного заведения.

Четкое осознание задач педагогического контроля необходимо потому, что от них зависит не только выбор способа интерпретации тестовых баллов, но и методы конструирования и особенности применения педагогических тестов. Важно отметить, что возможно совмещение обоих подходов в одном тесте. Такие тесты наиболее информативны, но их разработка отличается повышенной сложностью. 2.

Из истории теста

В истории возникновения и функционирования тестового контроля можно выделить три периода.

Первый (до конца XIX века)  предыстория с донаучными формами контроля знаний и способностей, второй  классический (1920-1960 г.г.), в течение которого создается классическая теория тестов. Третий  технологический (1970 г.), в течение которого разрабатываются методы адаптивного тестирования и обучения на основе Item Response Theory, представляющей, по сути, методологию эффективной разработки тестов и тестовых заданий для параметрической оценки испытуемых по изменяющемуся латентному качеству.

Одним из первых ученых, попытавшихся измерить различия между людьми в области элементарных технических процессов, был англичанин Ф. Гальтон. Его важным вкладом в развитие теории тестов было определение трех основных принципов контроля с помощью тестирования: 4. Применение серии одинаковых испытаний к большому количеству испытуемых. 5. Статистическая обработка результатов. 6. выделение эталонов оценки.

9 стр., 4113 слов

Понятие тест, тестирование

... учебного процесса. Тесты в это время существовали полулегально, официально запрет на них не был отменен, но уже предпринима­лись попытки диссертационных исследований по проблемам тестирования, ... советской школы. И уже весной 1926 года вышли такие тесты, созданные на основе американских. Были разработаны тесты по природоведению, обществоведению, счету, решению задач, знанию географической карты, ...

Эти принципы используются и по сей день. На основе проведения серия испытаний определяются различного вида нормы для оценки результатов тестирования. Все современные тесты построены на основе статистической теории измерений, они являются стандартизированным инструментом. Дж. Кеттелл, американский психолог, некоторое время работавший в лаборатории Ф. Гальтона, считал тест средством для проведения научного эксперимента, к которому должны предъявляться следующие требования:  одинаковость условий для всех испытуемых;  ограничение времени тестирования приблизительно одним часом;  отсутствие зрителей в лаборатории, где проводятся эксперименты;  оборудование должно быть хорошим и располагать людей к тестированию;  одинаковые инструменты и четкое понимание испытуемым, что нужно делать;  результаты тестирования подвергаются статистическому анализу, находится минимальный, максимальный и средний результаты, рассчитывается среднее арифметическое и среднее отклонение. Все идеи, выдвинутые Дж. Кеттеллом, в настоящее время составляют основу современной тестологии.

В 1895-1896 г.г. в США были созданы два национальных комитета, призванных объединить усилия тестологов и продать общее направление появившимся тестологическим работам.

Количественный скачок в развитии тестологии связан с деятельностью видного французского психолога А. Бине, который может считаться родончальником современных тестов, предназначенных для определения уровня развития интеллекта.

Массовый характер тестирования вызвал необходимость перехода от индивидуальных тестов к групповым. В 1914-1918 г.г. в США появились первые групповые тесты для нужд армии. Наибольшее применение нашли тесты А. Отиса, который предложил два набора тестов (Альфа- и Бета-тесты) для владеющих английским языком и «немые» тесты для невладеющих языком.

Основные принципы, использованные при составлении тестов, были систематизированы М. С. Бернштейном и впоследствии легли в основу методологии групповых тестов: 1. Ограничение во времени  только 5 % испытуемых могут окончить за отведенное время проработку всего теста, то есть показатель уровня развития интеллекта прямо зависит от скорости выполнения заданий испытуемых. 2. Наличие детализированной инструкции  как в отношении проведения, так и в отношении оценки. 3. Введение тестов с заданием выбрать правильный ответ с указанием в случае незнания или сомнения подчеркивать наугад. 4. Тщательная статистическая обработка и экспериментальная проверка.

В то же время широко развивались методики обработки результатов тестирования. Еще Ф. Гальтон воспользовался работами бельгийского статистика А. Кеттелла для измерения умственных способностей. Ф. Гальтон первый разработал метод статистического сравнения двух рядов переменных и ввел коэффициент корреляции.

8 стр., 3737 слов

Тесты психического развития ребенка второго года жизни. От года ...

... кнопку звонка, "кормит" и баюкает куклу, возит машину, надевает носки, туфли, штанишки. Тест на развитие двигательной сферы (крупной моторики). Двухлетний малыш уже достаточно хорошо владеет своим ... может подражательно (после показа взрослым) повторить рисование вертикальных и круглых линий. Тест на оценку памяти. Двухлетний ребенок может запомнить и повторить примерно четыре действия. Попросите его ...

Ему также принадлежит заслуга изучения взаимосвязи двух переменных и построения линий регрессии. К 1896 году К. Пирсон заложил основы теории корреляции. В 1904 году Ч. Спирмен сделал следующий шаг в использовании метода корреляции для психологии. Он явился основателем двухфакторной теории и показал, что корреляция между двумя переменными свидетельствует о наличии общего фактора  причины, от которой зависят эти переменные. Дальнейшее развитие тестологии во многом определилось нуждами практики.

Разрабатывались тесты для профессионального отбора в различных сферах производственной деятельности, а также активно развивалось направление, связанное с созданием тестов для определения уровня интеллектуального развития. Наиболее известным тестом такого рода в нашей стране является тест Д. Векслера. С начала XX века выделилось и педагогическое направление в развитии тестологии. Американец В. А. Макколл разделил тесты на педагогические (Educational Test) и психологические  по определению уровня умственного развития (Intelligence Test).

Основной задачей педагогических тестов являлось измерение успешности учащихся по тем или иным дисциплинам за определенный период обучения, а также успешности применения методов преподавания и организации.

Разработка первого педагогического теста принадлежит американскому психологу Э. Торндайку, который считается основоположником педагогических измерений первым стандартизированным педагогическим тестом, созданным под его руководством, был тест на решение арифметических задач, впервые снабженный «нормами». В Америке тесты нашли особенно широкое распространение.

В 1915-1930 г.г. наблюдается настоящий бум развития тестологии. Были разработаны тесты успешности по всем учебным дисциплинам, созданы «интеллектуальные» тесты для всех школ страны. Эти тесты назывались «национальными». Американские тестологи впервые перед каждым разделом теста дали примерные упражнения.

В Европе распространение тестов проходило далеко не так благополучно. Особым путем шло проникновение тестов в Россию. Практическое значение тесты получили после 1925 года, когда была создана особая тестовая комиссия при педагогическом отделе Института методов школьной работы, в задачи которой входила разработка стандартизированных тестов для советской школы. На основе американских были разработаны тесты по природоведению, обществоведению, счету и решению задач, знанию географической карты, на понимание чтения и правописание.

Разработкой тестов вплотную занимались видные российские психологи и педагоги, в том числе и П. П. Блонский, М. С. Бернштейн, С. М. Василейский и др. Однако вскоре положение кардинально изменилось. В 1936 году постановление ЦК ВКП(б) «О педагогических извращениях в системе Наркомпроса», которое негативно сказалось на развитие педагогики в целом и тестологии в частности. Метод тестов признан буржуазным орудием дискриминации учащихся и «изгнан» из советской школы.

Только в шестидесятых годах вновь стали изучаться возможности оценивания достижений с помощью тестов. Однако тесты достижений до настоящего времени не нашли должного применения. В России вопросы создания и применения тестов отражены в работах В. П. Беспалько, И. А. Цатуровой, В. А. Аванесова и др. В 90-ых годах отмечается повышение интереса к этой проблеме. В России тесты начинают активно использоваться в вузах на вступительных и рубежных экзаменах, а также в ходе государственной аттестации, однако качество тестов не удовлетворяет пока требованиям международных стандартов. 3.

3 стр., 1378 слов

Психология понимания задания

... описание действий участников, приводится их прямая речь и т.п.) Задания кейса (поэтапные, разносторонние) Задания кейса, например, могут быть такими: 1. Выделить оперативную педагогическую задачу и ... (НЕ выбор действия из списка; тогда это будет тест) предусматривает конкретный ответ, а не общие рассуждения задания кейса содержат «деятельностные» слова: «спроектировать», «выделить», «переписать» ...

Психологи о педагогическом тестировании

На традиционных устных экзаменах преподаватель лишь на основе ответа на вопросы одного билета, представляющего весьма незначительную часть программы, вынужден судить об уровне усвоения всей программы.

Субъективизм и ошибка в оценке знаний преподавателем снижают мотивацию учебной деятельности студента, вызывают стрессы и способствуют появлению эмоциональных барьеров в отношениях между студентами и учителями. Исследования психологов показывают, что экзаменационная оценка на традиционном устном экзамене зависит не только от уровня действительных знаний студентов, но и от индивидуальной толерантности к тревоге, умения общаться, приспосабливаться к экзаменационному стрессу, а также от типовых ошибок экзаменаторов, к которым относятся: • чрезмерная снисходительность или строгость; • искусственное занижение экзаменатором оценки; • ошибки, вызванные уровнем подготовки класса (в хорошо подготовленном классе учитель склонен занижать оценки, так как невольно стремится воспроизвести свойственную ему схему распределения оценок); • ошибки, получившие название «гало-эффекта», в которых обнаруживается влияние на оценку контакта ученика с учителем на экзамене и экзаменационные установки учителя по отношению к ученику.

Результат  оценка учителя чаще всего не совпадает с той оценкой, какую дает ученику реальная жизнь. Считается, что экзаменационный тест является не только более объективным методом оценивания, но и более щадящим по сравнению с устным экзаменом.

Установлено также, что в условиях тестирования уровень тревожности у учеников ниже, а степень внимания выше и физиологические характеристики состояния организма более благоприятны.

Кроме того, к существенным преимуществам тестового экзамена относятся: 1. Унифицированные требования. 2. Единые критерии и нормы оценки. 3. Экономия времени учителя и ученика.

На тестовой проверке низка вероятность формирования у учеников отрицательных эмоций по отношению к предмету: проверка носит безличный характер, а неудача ученика не связывается с личностью учителя. 4. Виды тестов Существует много разновидностей тестов, которые разделяются на группы по нескольким основаниям: • по предмету тестирования (тому качеству, которое оценивается с помощью теста); • по особенностям используемых в тесте задач; • по материалу, предъявляемому испытуемым; • по объекту оценивания.

По предмету тесты делятся на интеллектуальные (оценивают степень развитости у человека различных познавательных процессов), личностные и межличностные. По особенностям используемых задач выделяют практические, образные и словесные (вербальные) тесты. По характеру тестовых материалов, предъявляемым испытуемым, тесты делятся на бланковые, аппаратурные. По объекту оценки  на процессуальные тесты, тесты достижений, тесты состояний и свойств. Интеллектуальные тесты предназначаются для оценки уровня развития мышления (интеллекта) человека.

4 стр., 1840 слов

Тесты экология человека

... а а-1 б-2 в-3 социального Тесты по экологии человека Вариант 2 1.Здоровье – это а) состояние ... определению ВОЗ здоровье человека – это состояние полного физического, психического и _____________ благополучия. Ключи к тесту Вариант 1 1 ... особенности;  в) мораль;  г) совесть. 17. Гармоничное эволюционное развитие человека и природы называется … а) конвергенцией;  б) корреляцией;  ...

Личностные тесты связаны с психодиагностикой устойчивых индивидуальных особенностей человека, определяющих его поступки (тесты темперамента, характера, мотиваций, эмоций, способностей).

Тесты, дающие разностороннюю, комплексную оценку состояния личности или степени развитости состояния личности называются комплексными, например, тест Кеттелла, ММР1 и другие. К числу частных можно отнести тесты, с помощью которых оцениваются отдельные черты личности.

Межличностные тесты позволяют оценивать человеческие отношения в различных социальных группах, например, социометрический тест, тест социально-психологической самоаттестации группы как коллектива. Практические тестовые задания включают в себя задачи и упражнения, которые испытуемый должен выполнить в наглядно-действенном плане, то есть практически манипулируя реальными материальными предметами или их заменителями. Образные задания содержат в себе упражнения с образами, с картинками, рисунками, схемами, представлениями.

Они предполагают активное использование воображения, мысленных преобразований образов. Вербальные тексты включают в себя задания на оперирование словами. Они предполагают, например, определение понятий, умозаключения, сравнения объема и содержание различных слов, выполнение с понятиями различных логических операций и т. п. многие задания, которые используются в тестах, имеют комплексный характер, то есть включают в себя и практические, и теоретические, и вербальные действия и упражнения.

Это связано с тем, что большинство задач, с которыми сталкивается человек в реальной жизни, являются комплексными по характеру, а тестирование проводится для того, чтобы предсказать поведение и возможные достижения человека в реальной жизни. Бланковыми называются тесты, при использовании которых испытуемый получает тестовый материал в форме различных бланков: рисунков, схем, таблиц, опросников и т. п. Аппаратурные  это такие тесты, в которых используется различного рода аппаратуры для предъявления и обработки результатов тестирования, например, аудио- и видеотехника, электронно-вычислительные машины.

Процессуальными называют тесты, с помощью которых используется какой-либо психологический или поведенческий процесс, и ему в результате дается точная качественная или количественная характеристика, например, процесс запоминания человеком материала, процесс межличностного взаимодействия индивидов в группе.

К группе тестов достижений относятся такие тесты, в итоге применения которых оцениваются успехи человека в том или ином виде деятельности, в той или иной сфере познания, скажем, продуктивности памяти, логичности мышления, устойчивость внимания, уровень развития вербального мышления и др. Тесты состояний и свойств касаются диагностики более или менее стабильных психологических качеств человека, таких, например, как черты личности, свойства темперамента, способности и т. п. В особую группу выделяются проективные тесты.

Они основаны не на прямой, а на косвенной оценке тех или иных психологических качеств человека. Такая оценка получается в результате анализа того, как данный человек воспринимает и интерпретирует некоторые многозначные объекты: сюжетно неопределенные картинки, бесформенные пятна, незавершенные предложения и др. Предполагается, что в оценке к инструкции подобных объектов человек бессознательно «вкладывает» или «проецирует» самого себя. К этой группе тестов относятся, например, тест Рармаха, Тематический Апперцептивный тест и многие другие. 5.

11 стр., 5001 слов

Тема 1.Тесты интеллекта

... Групповые тесты интеллекта: - «Групповой интеллектуальный тест» (ГИТ) Дж. Ванны. 6. Тесты интеллекта для специфических популяций: - «Культурно-свободный тест интеллекта» (Р.Кеттелл). II. Выполнение практических заданий на ... его модификации; - АСТУР (тест умственного раз­вития); - «Краткий ориентировочный тест» (КОТ) (В. Н. Бузин). II. Выполнение практических заданий на занятии. Упражнение в обработке ...

Методика формирования теста

Методика разработки и проверки тестов в определенной степени сложна и может быть представлена следующим алгоритмом: 1. Вводятся понятийные индикаторы первой и последующих ступеней: «Знание учебного предмета (курса, раздела, темы)». Понятийные индикаторы выбираются с учетом требований квалификационной характеристики будущего специалиста, а также межпредметных связей, используемых при изучении контролируемой дозы учебного материала.

При этом очерчивается поле действия учителя и ученика на этапе контрольных процедур. 2. Выбирается (задается) количество заданий теста.

Методисты рекомендуют в пределах N=30-60 тестовых заданий на раздел рабочей программы, однако в отдельных случаях могут быть значительные отклонения от этой рекомендации в зависимости от структуры программного материала. 3. Составляется план теста в зависимости от важности контролируемых вопросов в структуре учебного материала.

Например, автор решает, что тест должен состоять из 4 разделов и в зависимости от их важности на каждый планирует соответственно на I  20 %, II  30 %, III  40 %, IV  10 % общего количества тестовых заданий. Нормируются задачи тестирования, в частности, например, А  умение давать определения  достаточно иметь 10 % от общего количества заданий теста, Б  знание формул (теории)  30 %, на В  умение применять теорию  30 %, С  умение работать с графическим материалом и, наконец, Д  умение составлять программы  10 % количества заданий теста.

Результаты расчета заносятся в таблицу, которая носит название плана теста. 4. Составляются предварительные тестовые задания, количество которых может в 2-3 раза превышать требуемое. . Количество предварительных заданий по контролируемым разделам и умениям должно быть пропорционально плану теста. 5. Осуществляется опытная проверка тестовых заданий. Контролируется группа с помощью одного теста, за правильный ответ обучаемый получает 1, за неправильный  0. Особые требования к тесту: он должен дифференцировать обучаемых по уровням их знаний, поэтому задания, на которые ответили все или не ответил никто, должны быть удалены от теста.

Рекомендуется иногда оставить по одному трудному заданию, на которое может ответить хотя бы один из тысячи обучаемых.

В результате этой процедуры количество тестовых заданий доводится до плановой цифры N. 6. На основе результатов проверки оставленных тестовых заданий строится матрица теста. В качестве примера приводим фрагмент матрицы по результатам проверки десяти учащихся. Общественные методы статистической обработки результатов испытания позволяют определить качество теста в целом и каждого в отдельности. Наиболее характерными показателями являются: 1. Средний балл теста, где Xi  результат контроля по i-ому заданию; N  количество заданий. 2. Дисперсия заданий теста: , где pi  доля правильных ответов; qi  доля неправильных ответов. 4. Средняя квадратическая ошибка (стандарт): . 6.

11 стр., 5057 слов

8. Тесты их виды и общая характеристика

... достоверные сведения о количестве и качестве усвоения учащимися изучаемого материала. В.П. Беспалько весьма кратко, но достаточно емко тест определил так: «Задания на выполнение деятельности ... определенного уровня в сочетании с системой оценок». виды тестов Традиционные тесты Традиционный тест обладает составом, целостностью ...

Понятие валидности и надежности теста

Слово Valid в переводе с английского языка означает пригодынй, годный.

Таким образом, «валидность» обозначает пригодность теста для той конкретной цели, для которой он используется.

Для какой цели используется тест? Он проверяет качество усвоения всех знаний, умений, их соответствие определенному уровню. Другими словами, различают содержательную и функциональную валидность теста. Содержательная валидность показывает, соответствует ли содержание заданий объему и содержанию данной темы. Функциональная валидность характеризует следующее: соответствуют ли тестовые задания тому уровню усвоения понятий, признаков и т. п который запланирован как цель. Надежность теста есть согласованность результатов, полученных у тех же самых испытуемых при повторном тестировании тем же самым тестом или его эквивалентной формой.

Заключение

Данная работа позволяет сделать следующие выводы: Во-первых, тест это специфический инструмент, состоящий из совокупности заданий или вопросов и проводимый в стандартных условиях, позволяющий выявить типы поведения, уровень владения какими-либо видами деятельности; Во-вторых, существует много разновидностей тестов, которые разделяются на группы по нескольким основаниям: по предмету тестирования (тому качеству, которое оценивается с помощью теста); по особенностям используемых в тесте задач; по материалу, предъявляемому испытуемым; по объекту оценивания.

В-третьих, при проведении теста предъявляются специальные требования к тестируемому лицу и самому тесту: — валидность теста – применимость его к конкретному субъекту и его надежность. — точность теста. — принятие тестируемым субъектом подобной формы обучения.

В-четвертых, история тестирования насчитывают несколько тысяч лет, в течении этого времени технология тестирования развивалась и совершенствовалась.

Список литературы

1. Радугин А.А. Психология и педагогика – Москва, 2000 г. 2. Столяренко А.М. Психология и педагогика – Москва, 2001 г. 3. Харламов И.Ф. Педагогика – Москва, 1994 г. 4. Подласый И.П. Педагогика – Москва, 1996 г. 5. Савин Н.В. Педагогика – Москва, 1972 г.