Какие функции не выполняют тесты достижений. Тесты достижений. Тесты действия и ситуационные тесты

Толчком для развития тестов специальных способностей стало мощное развитие профессионального консультирования, а также профессионального отбора и распределения персонала в промышленности и военном деле. Стали появляться тесты механи-ческих, канцелярских, музыкальных, артистических способностей. Создавались тестовые батареи (комплекты) для отбора поступающих в медицинские, юридические, инженерные и другие учебные заведения. Было разработано около дюжины комплексных батарей способностей для использования в образовании и при консультировании и распределении персонала. Различаясь составом, методическими качествами, они сходны в одном - их характеризует низкая дифференциальная валидность. Учащиеся, выбирающие разные области образования или профессиональной деятельности, незначительно различаются своими тестовыми профилями.

Экспериментально-теоретической основой для построения комплексных батарей способностей стало применение особой техники обработки данных об индивидуальных различиях и корреляций между ними - факторного анализа. ФАКТОРНЫЙ АНАЛИЗ позволял точнее определить и классифицировать специальные способности. Поэтому остановимся немно-

го на истории этого направления исследований.

Английский психолог Чарльз Спирмен в статье 1904 г. пришел к выводу, что положительная корреляция между тестами на различные способности (например, математические и литературные) выявляет некоторый общий ГЕНЕРАЛЬНЫЙ ФАКТОР. Он обозначил его буквой G (от англ. General - общий). Помимо фактора, общего для всех видов деятельности, в каждом из них при его осуществлении обнаруживается специфический фактор, свойственный только данному виду деятельности («S-фактор»).

[Примечание. После Ч. Спирмена многие другие исследователи неоднократно подтверждали существование генерального фактора. В том числе вполне остроумно это делалось с помощью факторного анализа таблицы обыкновенных отметок учеников по разным школьным предметам (М. Рошлэн). Существование фактора «G» на этих данных пояснить очень просто: как правило, отличники (ученики с высоким G) и двоечники (ученики с низким G), отличающиеся соответственно более высокими или более низкими баллами по всем предметам, встречаются чаще, чем ученики с резко нестабильным профилем достижений - высокими баллами по одним предметам и низкими баллами по другим предметам. - Прим. научного редактора].

Позднее теория Спирмена уступила место МНОГОФАКТОРНЫМ ТЕОРИЯМ интеллекта (подробнее о теориях интеллекта см. 3.4). Выяснилось, что отдельные тестовые показатели объединяются в родственные подгруппы и за каждой такой подгруппой скрывается определенный «латентный фактор», определяющий общий уровень достижений испытуемого по всей подгруппе тестов. Причем в разные тесты один и тот же «латентный фактор» вносит разный вклад (вес, ФАКТОРНУЮ НАГРУЗКУ). Например, «вербальный фактор» может иметь больший вес в

Основы психодиагностики

тесте на словарный запас, меньший - в тесте ело-

весных аналогий и совсем незначительный - в тесте на математическое мышление. Корреляции тестов между собой являются результатом нагруженности их родственным им всем латентным фактором. Важно подчеркнуть, что факторы, которые выделялись в результате факторного анализа, не придумывались и не задавались учеными из теоретических соображений, а возникали как бы сами собой - в результате появления группировок скоррелированных тестов.

Одним из первых разработал и применил многофакторный анализ тестовых данных американский психолог Л. Л. Терстоун (основные работы вышли в 20-30-е гг.). С помощью разработанного им центро-идного метода факторного анализа, основываясь на обширном статистическом материале, он выделил 12 факторов, которые он обозначил как «первичные умственные способности» (см. 3.4). Дальнейшие исследования привели к увеличению факторов. Число когнитивных факторов, описанных на сегодняшний день, "Превышает 120.

На основе факторных исследований создавались многофакторные батареи тестов способностей, позволяющие измерять индивидуальный уровень каждой из способностей. Наиболее известны среди них Батарея тестов общих способностей (GATB), включающая тесты способностей для конкретных профессий.

Современное понимание факторного анализа вносит некоторое изменение в ту его трактовку, которая существовала в 20-40-х гг. Факторный анализ - это обобщение линейных корреляций. Но линейные корреляции не могут считаться универсальной формой выражения функциональной связи между психическими процессами. Следовательно, отсутствие линейных корреляций не может толковаться как отсутствие связи вообще. Поэтому факторный анализ и добываемые посредством этого анализа факторы не

Психодиагностика как научная технология

всегда верно отражают зависимости между психическими процессами- В настоящее время разрабатываются более сложные алгоритмы многомерной статистической группировки тестовых данных. К возможностям традиционного факторного анализа и к выделенным с его помощью факторам современные ученые относятся с определенной осторожностью и не считают этот анализ универсальным инструментом изучения психики, а следовательно, и безошибочным базисом для конструирования психологических тестов,

Наряду с тестами интеллекта, специальных и комплексных способностей возник и еще один тип тестов, широко применяемых в учебных заведениях, - ТЕСТЫ ДОСТИЖЕНИЙ- Этим термином западные тесто-логи-психометристы окрестили педагогические тесты предметных знаний - знаний по определенным учебным предметам, а также профессиональные тесты - на специальные профессиональные умения и навыки-

В отличие от тестов интеллекта они отражают не столько влияние многообразного накопленного опыта, сколько влияние специальных программ обучения на эффективность решения тестовых заданий-История развития этих тестов может быть прослежена с момента смены в Бостонской школе устной формы экзаменов на письменную (1845 г.). В Америке тесты достижений используются при отборе сотрудников на государственную службу, начиная уже с 1872 г., а с 1883 г. их применение становится регулярным. Наиболее значительная разработка элементов техники конструирования тестов достижений выполнена в течение первой мировой войны и сразу после нее. [Примечание. Наши обычные школьные контрольные работы на проверку знани^ и умений являются ничем иным, как не слишком хорошо формализованными и отработанными тестами дости-

Основы психодиагностики

жений. - Прим. научного редактора],

Тесты достижений относятся к наиболее многочисленной группе диагностических методик. Одним из наиболее известных тестов достижений и широко применяемых в США до сих пор является Стэнфор-дский тест достижений (SAT), впервые опубликованный в 1923 г. С его помощью оценивается уровень обученности в разных классах в средних учебных заведениях.

Значительное число тестов специальных способностей и достижений было создано в рамках психотехники (индустриальной психологии) под воздействием практических запросов со стороны промышленности и экономики. Дальнейшее развитие тестов достижений привело к появлению в середине XX века критериально-ориентированных тестов (см. 3.5).

В целом развитие исследований и сбор статистических данных о применении тестов в психодиагностике значительно продвинуло науку о тестах (ТЕС-ТОЛОГИЮ), которая в психологии составила ядро ПСИХОМЕТРИКИ (науки о психологических измерениях). С 1936 года в США выходит специализированный журнал «Психометрика». Другой ведущий журнал в этой области - «Образовательные и психологические измерения». В этих журналах еще до второй мировой войны и вскоре после нее выпущены ставшие классическими работы таких психометрис-тов, как Рюлон, Гилфорд, Кронбах, обосновавших, в частности, широко используемые ныне методы измерения НАДЕЖНОСТИ, ВАЛИДНОСТИ И РЕПРЕЗЕНТАТИВНОСТИ тестов (см. 2.3).

Психодиагностика как научная технология

Личностная психодиагностика

В практике профотбора психодиагностика оказалась накрепко увязанной с экономическими и прагматическими критериями, которые заставляют очень часто отдавать предпочтение весьма приближенным, но зато очень кратким и очень дешевым при проведении тестам достижений. Подобные тесты не столько дают развернутый психологический портрет тому, кто прошел отбор, сколько направлены на то, чтобы отсеять заведомо непригодных. (В самом деле, зачем измерять зрительную память у кандидата в летчики, который не проходит, например, по более значимому и информативному вестибулярному тесту?)

Таким образом, оптимальность программы психодиагностического обследования оказывается напрямую связана с иерархией измеряемых психических свойств (диагностических признаков) по уровню их информативности в контексте данной прикладной задачи. Наиболее информативные свойства (признаки), как это известно из теории информации, - это те, которые разделяют обследуемую популяцию при- * мерно поровну. Доля присутствия определенного 4 свойства в популяции называется в теории тестирования «БАЗОВЫМ УРОВНЕМ». Как отмечает А. Анас-тази (1982), при резком отклонении базового уровня от оптимального в 50 процентов инкрементная ВА-ЛИДНОСТЬ (см 2.3.) теста оказывается настолько малой, что его использование становится практически нецелесообразным - приращение точности над базовым уровнем не покрывает издержек на само проведение и обработку теста.

Но в медицине - другом важнейшем источнике социального заказа на психодиагностику - базовый уровень интересующих нас патологических отклонений от нормы по определению оказывается весьма

Основы психодиагностики

низким, резко отличающимся от 50 процентов. Вся основанная на модели НОРМАЛЬНОГО РАСПРЕДЕЛЕНИЯ (см. 2.3.) традиционная «гауссовская» статистика (включая такие известные статистические инструменты, как критерий Стьюдента, коэффициент линейной корреляции Пирсона) в этом случае оказывается во многом неэффективной. В медицине задача специалиста не сводится только лишь к селекции (отделению больных от здоровых), но ему нужно получить точную «диагностическую» картину заболевания с целью определения оптимального лечения, подходящего в данном конкретном индивидуальном случае. Именно эти объективные обстоятельства и условия профессиональной деятельности обусловили развитие в области медицинской психологии второго из двух сложившихся на сегодня различных подходов к диагностике - КЛИНИЧЕСКОГО- Свое название этот подход получил именно в силу теснейшей связи с диагностической деятельностью врача.

Запросы медицинской практики дали импульс развитию методов ЛИЧНОСТНОЙ ПСИХОДИАГНОСТИКИ. Она нацелена на способности не в большей мере, чем на стилевые и мотивационные черты личности. В этой сфере используются чаще всего не тесты, а особые методы, среди которых выделяются прежде всего ОПРОСНИКИ И ПРОЕКТИВНЫЕ МЕТОДИКИ.

Опросники - это большая группа методик, задания которых представлены в виде вопросов или утверждений, а задачей испытуемого является самостоятельное сообщение некоторых сведений о себе в- виде ответов. Теоретической основой этого метода можно считать интроспекционизм - психологию самонаблюдения. Метод опросников вначале рассматривался в качестве разновидности самонаблюдения. Но при заданных вариантах ответа это самонаблюде-

Психодиагностика как научная технология

ние, которому придается стандартизированный характер, по многим формальным признакам сближается с объективным тестированием.

Прототипом личностных опросников был разработанный американским психологом Робертом Вуд-вортсом в 1919 г, «Бланк данных о личности». Этот опросник был предназначен для выявления и отсеивания с военной службы лиц с невротической симптоматикой. За прошедшие с того времени десятилетия опросники получили широчайшее распространение в качестве психодиагностического метода исследования личности. Искусная косвенная постановка вопросов, маскирующая их оценочную направленность, стандартизированная процедура предъявления и подсчета баллов во многом сблизили современные опросники с объективными тестами, основанными на объективных заданиях. Здесь речь идет скорее о тест-опросниках, а не о методе стандартизированного самонаблюдения как таковом.

Последние 50 лет самый популярный личностный тест-опросник - MMPI (Миннесотский Многофазный Личностный Перечень). Он используется преимущественно в клинической практике. Но опытные психиатры и психотерапевты обращаются с MMPI, следуя скорее логике клинического обследования, а не логике измерительного теста, а именно: профиль увязывается с результатами беседы и истории болезни, применяются скорее не групповые, а ИПСАТИВНЫЕ НОРМЫ (сравнение относительных различий по шкалам внутри результатов, полученных от данного конкретного испытуемого), больше внимания уделяется качественным, а не количественным данным и т. п.

Другим известным методом диагностики личности являются ПРОЕКТИВНЫЕ МЕТОДИКИ. Их родоначальником традиционно считается метод словесных ассоциаций, возникший на базе ассоцианистского

ОСНОВЫ ПСИХОДИАГНОСТИКИ

течения в психологии.

Возникновение метода свободных словесных ассоциаций связано с именем уже упоминавшегося выше Ф. Гальтона (1822-1911). В 1879 г. он опубликовал результаты- своих ассоциативных экспериментов. Предлагая испытуемому отвечать на слово-раздражитель первой пришедшей в голову словесной ассоциацией, Гальтон с помощью секундомера фиксировал время ответа. Позднее эта методика получила развитие в исследованиях Э. Крепелина (1892), К. Юнга (1906), Г. Кента и А. Розанова (1910) и других.

Как интерпретируются результаты этой методики? Большинство исследователей сегодня склонны рассматривать ассоциативный эксперимент в качестве приема для изучения интересов и установок личности. Однако следует отметить, что интерпретация получаемых результатов определяется теоретическими взглядами исследователей. Поэтому вопрос о валидности методики (их однозначной настройки на измерение определенного психического свойства) не может быть решен однозначно вне соотнесения с теоретическими позициями ее разработчиков и пользователей.

Ассоциативный эксперимент стимулировал появление такой группы проективных методик, как «неоконченные предложения» (или «завершение предложений»). Впервые для изучения личности «завершение предложений» было использовано А. Пейном в 1928 г.

Кроме ассоцианизма теоретические истоки проективных методов можно искать в, психоанализе, ставящем во главу угла понятие бессознательного. Бессознательное принималось первоначально как.скрытый двигатель личности, мотив, слепо действующий из таинственных глубин организма. Разум, по отношению к бессознательному, служит лишь маскировочным механизмом. Для того, чтобы пси-

Психодиагностика как научная технология

хологу прорваться в область бессознательного, понять скрытые в нем тенденции, необходимо в "эксперименте направить сознание на решение особых заданий, которые позволили бы непроизвольно проявиться бессознательному в особой проективной продукции - бессюжетных словесных ассоциациях, сюжетных фантазиях, образах, выраженных в рисунках (как это делается в рисуночных проективных методиках) и т. п. Такого типа задания и включались в проективные методики.

Одна из самых популярных проективных методик была разработана в 1921 г. швейцарским психиатром Германом Роршахом, который, кстати, одним из первых ввел в обиход термин «психодиагностика». Создавая эту методику, Роршах экспериментировал с большим количеством чернильных пятен, которые он предъявлял различным группам психически больных людей. В результате своих наблюдений Роршах постепенно объединил те характеристики ответов, которые можно было соотнести с различными психическими заболеваниями, в относительно стройную систему показателей. В дальнейшем эта методика использовалась и анализировалась многими исследователями как за рубежом, так и у нас в стране.

Еще одна из старейших и наиболее распространенных в мире проективных методик - Тест тематической апперцепции (ТАТ) - была создана в США в 1935 г. X. Морган и Г. Мюрреем (см.2.5).

Завершая краткий обзор истории развития и становления психологической диагностики на Западе, отметим, что она отличается широким разнообразием используемых методик как в отношении формы, так и их содержания. Возникновение психологической диагностики вызвано требованиями практики, а развитие направлено на удовлетворение ее требований. С этим связано появление не всегда теоретичес-

Основы психодиагностики

ки обоснованных, но методически совершенных приемов и способов диагностирования.

Одновременно с обилием новых лабораторных разработок для практической западной психодиагностики после второй мировой войны стал характерным определенный консерватизм, выражающийся в приверженности к работе с немногими тестами, которые прошли серьезную многолетнюю психометрическую адаптацию, по которым собраны десятки тысяч протоколов, выполнены сотни и тысячи диссертационных работ (по проверке этих тестов на особых контингентах испытуемых и в особых условиях, созданию парциальных тестовых норм, дополнительных шкал и т. п.). Любому новому тесту, каким бы он ни был передовым в научном отношении, в этих условиях очень трудно конкурировать с «классическими» методиками, по которым накоплена огромная методическая литература. Даже новые компьютерные тесты, обладающие массой объективных достоинств (например, гибкими возможностями настройки на конкретного испытуемого - свойствами так называемого АДАПТИВНОГО ТЕСТИРОВАНИЯ), с трудом пробивают себе дорогу и до сих пор не могут сравниться в популярности с «классическими» методиками. Не случайно многие образцы современных компьютерных тестов являются не более, чем компьютерными версиями существовавших до них буклетных, или «карандашно-бумажных», методик.

Медленно завоевывают себе приверженцев на Западе и такие новые научные направления в области личностной психодиагностики, порожденные опять же компьютерной революцией второй половины XX века, которые основываются на комбинации методов стандартизированного опроса и проективных техник. Это прежде всего техники семантического шкалирования (Ч. Осгуд,1952; Дж. Келли, 1965), позволяю-

Психодиагностика как научная технология

щие в результате компьютерной многомерной обработки данных реконструировать так называемые «субъективные семантические пространства» (см. 2.4).

"Применение этой методики позволяет оценить степень владения личностью конкретными знаниями, навыками, умениями в ходе выполнения конкретной деятельности ч конкретными задачами и требованиями.

В современной психологии существуют две большие группы методов, результаты действия которых обеспечиваются совокупностью методик (тестов).

Первая группа - это проективные методы исследования личности, в основе которых лежит механизм выявления проекций в полученных данных эксперимента с последующей их интерпретацией. Сюда входят три вида тестов:

1) ассоциативные;

2) интерпретационные;

3) экспрессивные.

Вторая группа методов связана с оказанием конкретной психологической помощи на запрос конкретного человека. Это так называемые клинические методы, которые предстают как цельная, процедурно обусловлена техника преодоления критической ситуации психологической жизни человека. Клинический метод - это синтез исследовательских, аналитических, преобразующих техник взаимодействия с клиентом, которые одномоментно соединены друг с другом и используются в пространстве проблемы, с которой человек обратился к специалисту (рис. 1.17). Принято выделять еще две отдельные группы тестов: тест-опросник и тест-задание. Тест-опросник - это метод, который позволяет оценить развитие данной характеристики объекта исследования, на основе количества ответов (на поставленные вопросы), которые совпадают по своему содержанию с представлением о ней.

Тест-задача - метод суждения о психологических характеристиках данного человека осуществляется на основе анализа успешности выполнения поставленных задач, что дает возможность оценить их присутствие или отсутствие, а также степень их развития.

Среди психодиагностических методов исследования, используемых в зарубежной медицинской психологии, следует выделить: многофакторный личностный опросник (ММРІ), опросник Кеттела и опросник Айзенка.

Рис. 1.17

Опросник ММРІ основывается на анализе 550 предполагаемых ответов, изучение которых помогает определить самочувствие обследуемого, отношение к себе и к окружающему миру. За этими утверждениями составляется профиль личности, который содержит І0 шкал, а именно: женственность, паранойя, психастения, шизофрения, гіпоманія, интроверсия - ипохондрия, депрессия, истерия, психопатия, мужественность. Существуют и русскоязычные варианты опросника ММРІ (Ф. Бы. Березина, Н. П. Мирошникова, Л. Н. Собчика, 1981).

Опросник Кеттела построен на оценке полярных качеств личности, например, самоуверенный - неуверенный, хвастливый - скромный др, объединенных в сиетемокомплекси, такие как циклотимия - шизотимія, возбудимость - заторможенность, умственная способность - умственная недостаточность и тому подобное. Опросник Кеттела будет полезным для определения таких свойств личности, как экстра - и интроверсия, нейротизм и психотизм (отклонение от психической нормы).

Факторы экстра-, интроверсии и нейротизму можно изучать также с помощью опросника Айзенка, состоящий из двух параллельных форм (А и Б), которые позволяют провести исследование повторно. Эта методика привлекает внимание ученых простотой формулировок. В отличие от ММРІ, в него введены шкалу лжи для выявления лиц с желательной реактивной установкой. Опросник содержит 57 вопросов, из них 4 - по шкале экстраверсии, 24 - по шкале нейротизму и 9 - по шкале лжи. Опросник Айзенка нашел применение в нашей стране.

Среди проективных методов, основная цель которых - изучение личности как единого целого, используют тест Роршаха, ТАТ (тематический апперцепційний тест) и тому подобное.

Тест Роршаха заключается в том, что исследуемому по очереди демонстрируют 10 карточек, на которых изображены чернильные пятна разных конфигураций и цвета. Рассматривая каждую карту, человек должен ответить на вопрос: "Что это может быть?" На основании полученных ответов определяется, наряду с другими показателями, богатство воображения, способность к синтезу, критичность ума, интеллектуальная активность. По мнению 13. М. Мясищева. этот метод является ценным для клинических исследований, а не для классификации людей.

Тематический апперцепційний тест (ТАТ), созданный американскими психологами, состоит из набора (от 6 до 30) картин с определенными изображениями. Кроме того, предлагается один лист без изображения, на котором обследуемый может изобразить по своему усмотрению любую картину. Как правило, для описания изображения обследуемому предлагают более 20 картин. По каждой картине он составляет рассказ, который записывают на магнитофон или стенографують, или же обследуемый сам записывает свой рассказ на бумаге.

Для правильной оценки полученных данных (интерпретации описанных рассказов) необходимо иметь определенные сведения о прошлом и настоящем обследуемого. Достоверность определенных личностных тенденций нужно проверить и другими методами. Описаны методы, применяемые за рубежом, безусловно, имеют практическое значение для медицинских психологов и психиатров. Большинство из них, модифицированная отечественными авторами, применяется и в нашей стране. Результаты, получаемые при использовании некоторых методов у нас, отличаются, поскольку отечественные исследователи, интерпретируя данные получаются из других методических позиций.

Задача или вопрос, из которых состоит тест, должны добираться по критериям выгодности (соответствия психическому явлению, которое изучается), надежности (устойчивости результатов измерения). Тесты, которые не имеют валидности, называют инвалидными, они непригодны для практического использования. Но в истории известны случаи, когда тесты, признанные инвалидными для измерения одних качеств, оказывались валидными для измерения других. Такой парадокс объясняется наличием такой неотъемлемой условии валидности тестов, как надежность. Ненадежный тест не может быть валидным, и, наоборот, валидный тест всегда надежен. Также надежность теста не может превышать валидность и наоборот.

Своеобразным представителем психологических методов является метод социометрии. Социометрия применяется для оценки межличностных эмоциональных связей в группе. Методично социометрия представляет собой цикл измерительных процедур и математических методов обработки первичных данных опросной методики. Метод социометрии используется для изучения социальных ролей в малых группах и на группе в целом. Рабочим инструментом в соціометричному исследовании является так называемый "социометрический критерий". Этот критерий делится на две группы. К первой относятся коммуникативные и гностические; ко второй - официальные и неофициальные.

Широкое применение в психологических исследованиях занимают математические методы. Чаще всего используется две группы математических методов, которые различаются в зависимости от их функционального назначения:

1) методы математического моделирования;

2) методы математической статистики.

Функциональное назначение методов математического моделирования заключается в построении алгоритмов действий и преобразующей деятельности в виде объяснительных, развивающих, обучающих и компьютерных моделей.

Статистические методы - это методы прикладной математической статистики. Наиболее распространенными видами этого метода является корреляционный, факторный, регрессионный анализ.

Корреляционный анализ - это комплекс процедур статистического исследования взаимозависимости переменных, находящихся в корреляционных отношениях. При этом преобладает их зависимость не линейная: это означает, что значению любой отдельно взято.

в Общем большинства психологических методик присущи некоторые общие черты их проведения. Как правило, исследование делится на четыре основных этапа.

Первый этап - подготовительный, где определяется предмет исследования и его первичный анализ. В ходе этого этапа исследователь проводит теоретизацию предмета познания, то есть рассматривает его как многомерное целостное и самостоятельное явление, которое взаимодействует с другими явлениями. Главное в этом этапе то, что исследователь формирует гипотезу о сущности психологического факта, который изучается. Эта гипотеза должна быть им зафиксирована и проверена.

Второй этап - конкретно экспериментальный, что определяет эмпирические критерии рассматриваемого явления. Во время проведения этого этапа исследования исследователь имеет возможность непосредственно контактировать с сущностью данного явления, что составляет центральный момент эксперимента.

Третий этап - количественный анализ, интерпретация и толкование данных, полученных первыми двумя способами. Это позволяет утверждать о достоверности полученных данных направлены на подтверждение изначально поставленной гипотезы. При нем довольно часто используются математические методы психологии.

Четвертый, заключительный этап - интерпретация полученных данных. Этот этап предусматривает "выяснение правильности или ошибочности гипотезы исследования".

Как и в каждой науке, методы современной психологии воспроизводят объективный процесс научного познания, поэтому их широкое использование обеспечивает высокий уровень исследований.

История создания и общая характеристика тестов достижений. Примеры наиболее известных методик. Широкоориентированные тесты достижений (батареи общих достижений), тесты достижений по конкретным учебным предметам. Тесты академической оценки SAT I, SAT II, ЕГЭ .

История создания тестов достижений

Этим термином западные тестологии обозначили педагогические тесты предметных знаний - знаний по определенным учебным предметам, а также профессиональные тесты - на специальные профессиональные умения и навыки.

В отличие от тестов интеллекта они отражают не столько влияние многообразного накопленного индивидуального опыта, сколько влияние специальных программ обучения на эффективность решения тестовых заданий. (Обычные контрольные работы в наших школах являются, по сути, ничем иным, как не слишком хорошо формализованными и отработанными тестами достижений).

История развития этих тестов начинается с момента смены в Бостонской школе устной формы экзаменов на письменную (1845г.). В Америке тесты достижений используются при отборе сотрудников на государственную службу, начиная уже с 1872г., а с 1883г. их применение становится регулярным. Наиболее значительная разработка элементов техники конструирования тестов достижений выполнена в течение первой мировой войны и сразу после нее.

Тесты достижений относятся к наиболее многочисленной группе диагностических методик. Одним из наиболее известных тестов и наиболее применяемых в США является Стенфордский тест достижений (SAT), впервые опубликованный в 1923г. С его помощью оценивается уровень обученности в разных классах в средних учебных заведениях.

Значительное количество тестов было создано в рамках индустриальной психологии (психотехники) под воздействием запросов со стороны промышленности и экономики. Дальнейшее развитие тестов достижений:

Первой попыткой введения стандартизированных методов тестов успешности была работа английского школьного учителя Фишера составившего в 1869г. «Книгу шкал», в которой приводились образцы различных ученических работ, расположенные по возрастающей степени совершенства шкал. Сравнивая работы данного ученика с приведенными в книге образцами педагог мог дать более точную и объективную оценку достижений ученика и вместе с тем мог указать какой стадии обучения по данной шкале соответствуют данные достижения. Широкого распространения метод Фишера не получил. Причиной этого была примитивность предложенных им шкал и не возможность более обстоятельной разработки их вследствие отсутствия соответствующих статистических методов. Для построения более совершенных шкал необходимо было перейти от простого коллекционирования школьных работ к собиранию их при помощи испытаний при строго определенных, однообразных условиях и затем установить стандарты, обосновав их путем соответствующей статистической обработке собранного материала.

Первым, кто начал разрабатывать стандартизированные тесты учета школьной успешности был американский педагог Райс. Первой его работой в этой области было исследование навыка учащихся в орфографии (1894-1895г.) Желая точно учесть успешность учащихся в орфографии при различных методах обучения он составил специальные таблицы слов, написание которых учащимися представляло наибольший интерес с точки зрения обучения, и обследовал по этим таблицам свыше 60 000 школьников.

Он сделал интересные замечания на основе данных исследования – ученики, тратившие в течение 8 лет в среднем по 40 минут в день на занятия орфографией, пишут не лучше, чем ученики, занимавшиеся орфографией в течение того же времени в среднем по 10 минут в день.

Возможность измерения школьных достижений с помощью специальных заданий после публикации Фишера вызвала бурную дискуссию среди педагогов. Вслед за тестами для орфографии Райсом были составлены тесты для учета навыков в счете и языке. При этом Райс, прежде всего, ставил целью оценку методов обучения, Ане определение стандартов (норм).

Совершенно определенно вопрос о стандартах впервые поставил Торндайк, которого современные авторы называют отцом стандартизированных методов учета. Заинтересовавшись школьными тестами в 1903г. Торндайк особое внимание обратил на психологическое и статистическое обоснование метода тестового учета и на тщательную статистическую обработку получаемого с помощью этого метода материала. В течение ряда лет им был разработан ряд ценных тестов по учету навыков в чтении, письме и счете, послуживших образцом для позднейших исследователей, и дан ряд стандартов для различных годов обучения. Его капитальные работы по методике психологических и педагогических измерений «Mental and Social Measurements», «Educational Psychology» подвели научную базу под стандартизированные методы учета, а вышедшая в 1922г. книга «Психология арифметики» является образцом изучения процесса школьной работы на основе объективных методов измерения успешности.

Вслед за Торндайком к разработке объективных методов учения успешности при помощи тестов преступил целый ряд других психологов: в США - Кортис, Старг, Эйрис, Мкколл, Монро, Вуди, Требю и др. В Англии - Берт, Баллард. В Австрии - Раншбург.

В 20 годы 20 века в США были организованы при университетах и администрациях в педагогических центрах ряд специальных исследовательских бюро, которые занимались разработкой стандартизированных методов учета, руководили проведением учета и обработкой получаемых результатов. Метод стандартизированного учета школьной успешности получил широкое распространение в Америке, им пользуются и психологи, и педагоги, и методисты для:

оценки методов обучения
учета эффективности работы педагога
изучения индивидуальных особенностей учащихся
анализа работы школ.

Было разработано большое количество разнообразных форм тестов достижений.

Общая характеристика

Тесты достижений обычно дают конечную оценку достижений индивида по завершении обучения, в них основной интерес сосредоточен на том, что индивид может делать к настоящему времени.

Таким образом, тесты достижений предназначаются для определения соответствия достижений некой идеальной общенациональной учебной программе (часто основанной на обобщении материала различных учебников).

Выделяют две группы тестов достижений: широкоориентированные тесты достижений (батареи общих достижений), тесты достижений по конкретным учебным предметам.

Широкоориентированные тесты достижений ориентированы на оценку навыков по основным целям обучения (например, тесты на понимание научных принципов). Батареи общих достижений представляют собой широко ориентированные тесты, они применяются для оценки достижений главных, долгосрочных целей обучения. Разработка таких батарей широко применяется в образовательной практике США. Большинство тестовых батарей охватывают все уровни школьного обучения и являются скоординированной серией тестов,позволяющей сопоставить результаты учащихся от 1 до 12 класса. Такую серию например составляют Тесты академической оценки SAT

Тесты достижений по конкретным предметам (достижения в чтении и математике) ориентированы на оценку усвоения элементов учебных программ, конкретных тем, уровня владения навыками (например, счетными).

Стандартизированные тесты по отдельным учебным предметам измеряют уровень достижений в предметных областях знаний, изучаемых в школе и колледже. Применений таких тестов существенно возрастает в связи с тем, что современные школьники специализируются на изучении конкретных научных дисциплин.

В США стандартизированные тесты разработаны почти по каждому предмету: от истории до физической культуре. Такие узко ориентированные тесты используются в качестве итоговых экзаменов по курсу обучения. Также они выполняют не менее важную функцию – определение «сильных» и «слабых» сторон в усвоении предметно-специфических навыков и знаний. Постепенно возрастает использование специализированных тестов достижений в качестве замены вступительных экзаменов в колледжи и университеты.

Такие тесты выполняют несколько функций:

выступают как средство оценки знаний,
выявляют недостатки обучения,
подсказывают направление последующего обучения,
обеспечивают мотивацию учащегося,
помогают приспособить обучение к потребностям индивида,
дают информацию об уровне знаний, усвоенных учащимися.

Особое место среди стандартизированных тестов достижений занимают тесты оценки уровня базовых навыков, используемые в качестве средства подтверждения образовательного минимума и как основы для выдачи аттестата об окончании средней школы. Неоходимость разработки и применения такого рода тестов США была инициирована докладом «Нация в опасности», представленным Национальной комиссией улучшения образования. В нем утверждалось, что американская нация стоит перед непосредственной угрозой снижения общего образовательного уровня. В связи с этим докладчики настаивали на введении минимального тестового стандарта, общей тестовой батареи, на основе которой будет устанавливаться минимальный уровень школьной успешности.

Тесты на минимум базовых навыков разрабатываются и для взрослых в связи с реализацией образовательных программ в учреждениях особого типа (например, в тюрьмах) и обеспечением эффективности программ профессиональной подготовки. Пример: Тесты базового образования взрослых TABE. Батарея TABE содержит 5 ступенчатых уровней трудности для 5 предметных областей, включая чтение, язык и прикладную математику.

Для понимания различий между педагогическими и психологическими тестами необходимо ввести понятие тестов достижений и тестов способностей. Среди всех типов стандартизованных тестов тесты достижений численно превосходят все остальные. Они создавались для измерения эффективности программ и процесса обучения. Именно этот тип тестов в общем смысле ассоциируется с названием «педагогический тест». Тесты достижений принято противопоставлять психологическим тестам способностей, состоящим из тестов общего интеллекта, комплексных батарей способностей и тестов специальных способностей. А. Анастази считает, что «с определенной точки зрения, различия между тестами достижений и способностей есть различия в степени единообразия соответствующего предшествующего опыта. А это значит, что тесты достижений измеряют влияние относительно стандартизованного курса обучения, такого как курс биологии, физики или программирования. В отличие от тестов достижений выполнение тестов способностей отражает совокупное влияние разнообразного опыта повседневной жизни». Можно сказать, что тесты способностей измеряют эффективность обучения в относительно неконтролируемых и неизвестных условиях, в то время как тесты достижений измеряют эффективность обучения при частично известных и контролируемых условиях.

Другим отличием тестов способностей от тестов достижений являются цели их использования. Тесты способностей предоставляют некоторый срез психологических данных, на основе которых прогнозируется выполнение той или иной деятельности и делается предположение о возможных достижениях в новой ситуации. Результаты тестов способностей содержат информацию, позволяющую произвести оценку целесообразности прохождения индивидом специальных курсов обучения. Напротив, тесты достижений обычно дают конечную оценку достижений индивида по завершении обучения, в них основной интерес сосредоточен на том, какой информацией индивид владеет и что может делать к настоящему времени. Эта разница между тестами, пожалуй, лучше всего видна, когда оценивается их валидность. Лучший способ оценить тесты способностей – это осуществить прогностическую, критериально ориентированную валидацию, тогда как тесты достижений в основном оцениваются в терминах валидности по содержанию.

Тем не менее, нужно признать, что различия между тестами способностей и достижений не столь однозначны. Некоторые тесты способностей могут отражать достаточно конкретную и единообразную предшествующую образовательную программу, а тесты достижений – охватывать относительно широкий нестандартизованный курс обучения и использоваться в качестве вероятностной информации о возможностях предстоящего обучения. В сущности, тесты достижений служат тем же целям, что и тесты способностей. Скажем, успехи ученика по математике были определены по его показателю в тесте достижений, который можно затем использовать для прогнозирования его успехов в алгебре.

При рассмотрении различий между тестами способностей и достижений не следует думать, что тесты достижений измеряют эффективность обучения, а тесты способностей – врожденные, не зависящие от обучения способности. Столь ошибочное суждение было достаточно распространено на заре психологического тестирования, но в значительной степени пересмотрено при уточнении смысла используемых в психометрии понятий. Без сомнения, все психологические тесты измеряют наличное поведение индивида, а оно неизбежно отражает воздействие прошедшего обучения. Тем не менее, факт, что каждый тестовый показатель связан с «прошлым», не устраняет его связи с «будущим».

Важное отличие психологических тестов от педагогических видится в том, что при составлении первых исследователи стараются учесть предрасположенность учеников к различным видам репрезентативных систем (визуалы, аудиалы, кинестетики) и различные типы интеллекта (вербальный, логический, пространственный и т.д.). К сожалению, в педагогике возможности такого учета значительно ограничены, во-первых, преобладанием в школе знаково-логической визуальной информации, направленной на развитие соответствующих типов интеллекта. Как правило, от учеников требуется воспроизведение рационализированной и вербальной (письменной или устной) информации о фактах. Поэтому часто дети с более развитыми пространственными способностями выглядят неуспевающими, а дети с более развитыми по сравнению с пространственными вербальными способностями кажутся необыкновенно талантливыми.

Многочисленные функции тестов достижений давно признаны в образовании. Как средство выставления оценок подобные тесты хороши своей объективностью и единообразием. Если они должным образом построены, то обладают и другими достоинствами: их содержание адекватно изучаемому предмету, они сводят на нет в процедуре оценивания действие случайных факторов. Тесты достижений составляют также важный компонент корригирующих программ обучения, поскольку их можно использовать как для выявления учащихся, не способных к отдельным видам обучения, тан и для измерения успехов в выполнении корригирующих программ.

При всех типах обучения периодическое применение правильно построенных и соответственно подобранных тестов достижений облегчает этот процесс. Такие тесты выявляют недостатки прошлого обучения, подсказывают направление последующего и обеспечивают мотивацию обучающегося. Побудительную силу знания своих результатов неоднократно выявляли психологические эксперименты с самыми разнообразными ситуациями обучения: варьировали возраст испытуемых и их образовательный уровень. Эффективность такой самопроверки обычно сказывается немедленно. Поэтому, когда проверка достижений применяется главным образом как средство обучения, желательно, чтобы учащиеся узнали о допущенных ошибках как можно раньше.

Кроме того, тесты достижений помогают приспособить курс обучения к потребностям индивида. Учение происходит более плодотворно, когда начинается с той стадии, на которой уже находится обучающийся. Проведение тестирования в начале учебного года позволяет предпринять конструктивные шаги по ликвидации обнаруженных при выполнении тестов основных пробелов в знаниях учащихся.

Особенно важно в связи с этим видеть многочисленные условия, влияющие как на выполнение теста, так и на школьное обучение, в том числе кумулятивное влияние предшествующего и настоящего жизненного опыта, приобретаемого вне школьной среды.

Так, интеллект часто связывается с развитыми логико-математическими способностями или высокой осведомленностью человека. Но сегодня такая трактовка представляется явно упрощенной и ограниченной. Интеллект – это наша способность успешно реагировать на новые ситуации и учиться на опыте (Г. Гарднер). Возможности творческого развития человека и успешность будущей профессиональной и жизненной адаптации детерминируются с развитием семи видов интеллекта.

1. Вербальный интеллект – это способности, предполагающие умение аргументировать, убеждать, беседовать, поддерживать и учить с помощью речевых навыков. Этот вид интеллекта просто необходим журналистам, адвокатам, писателям, учителям. Тренировка вербального интеллекта успешно происходит в операциях чтения, письма, сочинительства и в процессе публичных выступлений (дискуссий, монологов, задавания вопросов и ответов на них).

2.Логико-математический интеллект – умение проводить операции с числами и логикой, способность думать в понятиях причины и следствия, формулировать тезисы, развивать концепции, анализировать, классифицировать и обобщать.

3.Пространственно-визуальный интеллект – этот вид интеллекта работает в образах, метафорах и пространственных представлениях. Люди с развитым пространственным интеллектом отличаются наблюдательностью, способностью легко ориентироваться на местности и в незнакомой среде, предпочтением выражать свои идеи графически. Этот вид интеллекта является основой профессиональной деятельности архитекторов, фотографов, художников, скульпторов, пилотов, механиков, инженеров.

4.Музыкально-ритмический интеллект связан со способностью человека к восприятию ритмов и мелодий, гармонии и дисгармонии, запоминанию музыкальных интонаций, ладов и звукосочетания.

5. Телесно-кинестетический интеллект – интеллект нашего тела. К нему относятся: способность контролировать движения, ловко оперировать частями тела, способность развивать и сохранять физические качества. К сожалению, в учебном процессе этим интеллектом недопустимо пренебрегают.

6.Межличностный интеллект – под этим понимается способность осуществлять коммуникацию, вступать во взаимодействие с людьми, понимать, чувствовать и учитывать уникальность каждого, а также умение адекватно предъявляться, без попытки спрятаться за других, за свои проекции, шаблоны, стереотипы. Развитие этого интеллекта возможно лишь в условиях интерактивного обучения.

1.Сущность тестов достижений.

2. Типы и подтипы тестов достижений.

3. Нормоориентированные и критериально-ориентированные тесты достижений.

4. Стандартизированные тесты и неформальные тесты достижений.

5. Тесты специальных способностей и достижений.

Практическая часть.

Тесты достижений (они же тесты успешности, тесты успеваемости) являются диагностическим инструментом объективной оценки и контроля результатов образовательной или профессиональнойподготовки.

В 1894 г. американский ученый Дж. М. Райе применил таблицы по проверке знаний орфографии для изучения эффективности разработанных им методических приемов. В первое столетие XX столетия тесты достижений начали использоваться к образовательной и профессиональной практике США, Германии, Великобритании, России и других стран, однако в децентрализованной, прагматически ориентированной и активно развивающейся системе эти тесты получили более широкое распространение и развитие. На сегодняшний день тестовая методика в США рассматривается как универсальное средство проверки знаний, умений, профессиональной подготовки во всех областях человеческой деятельности. Для допуска практически к любому занятию, требующему навыков и знаний, необходимо получение сертификата. Тесты диагностики достижений в профессиональной деятельности, разумеется, намного сложнее. Индивидуальные экзамены сохранились лишь в тех областях, где требуются специальные знания, по которым подготовка дорогостоящих тестов нецелесообразна просто по финансовым соображениям. Таковы, например, экзамены в аспирантуре или в некоторых областях медици

ны. Если же речь идет о более или менее широком контингенте испытуемых, то для них всегда используются тесты.

В процессе реформирования отечественной системы образования и ее интеграции в мировую образовательную практику тесты достижений переживают второе рождение. Начиная с 1998 г. Центром тестирования Минобразования России начат эксперимент по проведению централизованного абитуриентского тестирования в вузы, который стимулировал создание и внедрение итоговых тестов достижений по отдельным дисциплинам. Создается единый банк тестовых заданий; сформирован перечень обобщенных умений по географии, физике, истории, химии; создана стандартизированная спецификация тестов; осуществляется классификация тестовых заданий.

Опыт централизованного абитуриентского и репетиционного тестирования послужил основой для перехода к следующему этапу - единому государственному тестовому экзамену выпускников средних школ, который в порядке эксперимента проводится с 2001 г. Исследователи публикуют различные предложения по разрешению поставленных проблем отбора содержания для единого экзамена. В частности, для аттестации выпускников общеобразовательных учреждений предлагаются такие тестовые задания, которые позволяют судить о минимально допустимой компетентности выпускников. Рекомендуется использование критериально-ориентированных тестов, посредством которых определяется то, что испытуемый знает и чего он не знает из заданного стандарта.

Единый государственный экзамен по каждой дисциплине состоит из двух частей. Первая часть (А) - это аттестационный экзамен по курсу Х-Х1 классов, обязательный для всех учащихся. Предлагаются два варианта аттестации: А 1 - контроль обязательного уровня подготовки выпускников и А 2 - повышенного уровня. Результат тестирования переводится в 5-балльную шкалу для отметки в аттестате. Вторая часть (В) - по желанию выпускников для поступления в вузы, состоящая также из вариантов В 1 (базовый уровень) и В 2 (повышенный уровень). По совокупным ответам на задания частей А (А, и А 2) иВ(В,и В 2) выдается сертификат единого государственного экзамена. Наиболее удобной для оценивания результатов тестирования абитуриентов является 100-балльная Т-шкала, по которой в настоящее время стал выставляться сертификационный балл выпускников средних школ.

Пока нормативная база отечественной системы образования (за исключением рассмотренного выше перехода школа-вуз) не разрешает проводить тестовые экзамены итогового и заключительного уровней, однако во всех компонентах этой системы ведется большая подготовительная работа. Наиболее актуальной становится разработка текущих, тематических и рубежных тестов, используемых в учебном процессе всех образовательных структур. Для сравнения можно указать, что в США ежегодно знания и способности учащихся проверяются с помощью 47 млн тестовых бланков, выпускаемых 400 тестовыми компаниями. Подавляющее большинство из них представляют бланки текущего, тематического и рубежного уровней достижений.

Сущностьтестовдостижений

Тесты достижений предназначены для того, чтобы оценить успешность овладения конкретным, ограниченным определенными рамками учебного материала. Этим они отличаются от собственно психологических тестов - тестов способностей, умственного развития.

Как уже отмечалось ранее, выполнение тестов способностей отражает совокупное влияние разнообразного опыта жизни индивида. В отличие от тестов достижений тесты способностей измеряют результаты обучения в относительно неконтролируемых и неизвестных условиях. Так, на формирование пространственных способностей влияние отдельных разделов учебной программы (например, геометрические преобразования) хотя и нельзя отрицать, но их усвоение не является единственным фактором, определяющим уровень развития этих способностей. Поэтому при диагностике способностей трудно найти в условиях обучения однозначное объяснение высокой или низкой степени их развития у испытуемого.

Другое различие между тестами способностей и достижений относится к их назначению. Тесты способностей направлены главным образом на выявление предпосылок к тем или иным видам деятельности и претендуют на прогнозирование выбора для индивида наиболее подходящей профессии или профиля обучения. Напротив, тесты достижений применяются для оценки текущих или итоговых результатов усвоения тех или иных дисциплин либо их разделов. Главное значение в этих тестах придается тому, что конкретный индивид умеет делать в настоящий момент.

Такие авторитетные текстологи, как А. Анастази и Л. Кронбах, признают, что между тестами способностей и тестами достижений невозможно провести жесткую границу. Некоторые тесты способностейсоздаются в расчете на весьма специфическое предметное обучение, а некоторые тесты достижений могут охватывать относительно широкий образовательный опыт. Тесты достижений.могут в определенной степени предсказывать темпы продвижения учащихся в усвоении той или иной образовательной программы. Предметные тесты достижений, предваряющие профессиональную подготовку, могут служить предикторами успешности профессионального обучения.

Тесты достижений отличаются также и от тестов умственного развития, которые направлены на диагностику умений совершать с понятиями (пусть даже и учебными) определенные умственные действия, такие как аналогия, классификация, обобщение и др. Это отражено и в формулировании конкретных заданий тестов того и другого типа.

Для того чтобы правильно ответить на вопросы, входящие в тест достижений, необходимо знание конкретных фактов. Для того чтобы справиться с тестом умственного развития, необходимо логическое умение работать с понятиями (в нашем примере с понятиями «слово» и «предложение»), анализировать их, находить существенные признаки, устанавливать логические связи и т. д.

Тесты достижений противопоставляют субъективным методам проверки знаний, таким как устный и письменный опрос. Прежде всего, тесты обеспечивают объективность проведения испытания. Например, при проверке орфографических навыков диктант не даст такой объективной информации, какую предоставит специально разработанный тест. Преподаватели диктуют в разном темпе, с разной акцентуацией, и один и тот же ученик, пишущий диктант на одни и те же орфограммы, у разных учителей может сделать разные ошибки. В инструкции к тесту даются точные указания, как произносится слово, когда и в каком классе проводится тестирование, устанавливается, как следует диктовать предложения, сколько раз можно повторять слово и т. д. Объективность тестов достижений обеспечивается обработкой результатов испытания. Оценки одной и той же письменной работы разными учителями могут значительно отличаться друг от друга. Среди факторов, оказывающих воздействие на учителей при оценивании письменных работ, обычно выделяют следующие: объем письменной продукции, грамматические и орфографические ошибки (даже если оценивается исключительно содержание), почерк, последовательность, в которой оценивались работы, пол преподавателя и ученика, отношение к ученику. Тестовые задания составляют так, что для их выполнения достаточно написать число, слово, поставить крестик или подчеркнуть нужный ответ. Составленные таким образом, снабженные ключами и образцами типичных ответов, задания практически исключают расхождения при обработке результатов.

Тесту достижения, как и всякому другому тесту, присуща объективность интерпретации результатов измерения. Выставляя отметки, учитель пользуется не установленными стандартами выполнения, а своим личным масштабом оценки качества, часто ориентируясь на уровень усваемости класса, на то или иное место учебной дисциплины в образовательной программе. Так, отметка за один и тот же рисунок одного п того же ученика учителем школы с эстетическим уклоном и учителем общеобразовательной школы может быть совершенно различной. Гесты достижений лишены этих недостатков, разумеется, при условии грамотного их составления и применения.