Іван Павлович Підласий, професор, доктор педагогічних наук, Челябінський державний педагогічний університет.
Якість навчання безпосередньо залежить від кількості, глибини, своєчасності та об'єктивності оцінки отриманих знань. Грамотно складені тести дозволяють визначати рівень засвоєння знань і ступінь формування навичок в процесі навчання.
Застосування діагностичних тестів в зарубіжних школах має давню історію. Визнаний авторитет у галузі педагогічного тестування Е. Торндайк (1874-1949) виділяє три етапи впровадження тестування в практику американської школи:
1. Період пошуків (1900-1915). На цьому етапі відбувалося усвідомлення і первинне впровадження тестів пам'яті, уваги, сприйняття і інших, запропонованих французьким психологом А. Біне. Розробляються і перевіряються тести інтелекту, що дозволяють визначати коефіцієнт розумового розвитку.
2. Наступні 15 років - роки «шуму» у розвитку шкільного тестування, що призвели до остаточного осмислення його ролі і місця, можливостей і обмежень. Були розроблені і впроваджені тести О. Стоуна з арифметики, Б. Зекінгема для перевірки правопису, Е. Торндайка з діагностики більшості шкільних предметів. Т. Келлі розробив спосіб вимірювання інтересів і нахилів учнів (при вивченні алгебри), а Ч. Спірмена запропонував загальні основи використання кореляційного аналізу для стандартизації тестів.
3. З 1931 року починається сучасний етап розвитку шкільного тестування. Пошуки фахівців спрямовуються на підвищення об'єктивності тестів, створення безперервної (наскрізний) системи шкільної тестової діагностики, підпорядкованій єдиній ідеї і загальним принципах, створення нових, більш досконалих засобів пред'явлення і обробки тестів, накопичення і використання діагностичної інформації.
Нагадаємо в зв'язку з цим, що педагогіка, що розвинулася в Росії на початку століття, беззастережно прийняла тестову основу об'єктивного шкільного контролю.
Після відомої постанови ЦК ВКП (б) «Про педологічні перекручення в системі Наркомосу» (1936) були ліквідовані не тільки інтелектуальні, але й прості тести успішності. Спроби відродити їх в 70-х роках ні до чого не привели. У цій області наша наука і практика значно відстали від зарубіжної.
У школах розвинених країн впровадження і вдосконалення тестів йшло швидкими темпами. Широке поширення отримали діагностичні тести успішності, що використовують форму альтернативного вибору правильної відповіді з декількох правдоподібних, написання дуже короткої відповіді (заповнення пропусків), дописування букв, цифр, слів, частин формул і т. П. За допомогою цих нескладних завдань вдається накопичувати значний статистичний матеріал , піддавати його математичної обробки, отримувати об'єктивні висновки в межах тих завдань, які пред'являються до тестової перевірки. Тести друкуються у вигляді збірників, додаються до підручників, поширюються на цифрових носіях.
Проблема співвідношення усних і письмових форм контролю дозволяється в більшості випадків на користь останніх. Вважається, що хоча усний контроль більше сприяє виробленню швидкої реакції на питання, розвиває зв'язне мовлення, він не забезпечує належної об'єктивності. Письмова перевірка, забезпечуючи більш високу об'єктивність, крім того, сприяє розвитку логічного мислення, цілеспрямованості: той, якого навчають при письмовому контролі більш зосереджений, він глибше вникає в суть питання, обдумує варіанти вирішення і побудови відповіді. Письмовий контроль привчає до точності, лаконічності, зв'язності викладу думок.
В області визначення системи оцінок (відміток) спостерігається велика різноманітність як в принципах, так і в конкретних підходах, виборі способів оцінювання і виставлення оцінок. У зарубіжних освітніх закладах практикуються різні системи оцінювання знань, умінь, навичок, прийняті різні шкали оцінок, включаючи сто-, дванадцяти, десяти-, двобальну і ін. У французькому ліцеї, наприклад, при здачі випускних іспитів результати визначаються за 20-бальною шкалою . При цьому для кожного предмета встановлюється певний ваговий коефіцієнт, що визначає значимість даного предмета для обраної учнем спеціальності, профілю або відділення ліцею. Завдяки цьому оцінки з профілюючих предметів набувають більшу вагомість.
При значній децентралізації більшості зарубіжних освітніх систем, за умови вільного вибору школою навчальних планів і програм, а тими, хто навчається - навчальних предметів рідко проводяться централізовані перевірки і оцінювання знань, умінь. У Великобританії, наприклад, функцію практичного контролю за якістю академічної підготовки беруть на себе університетські комісії, до яких на період здачі випускних іспитів прикріплюються всі граматичні і привілейовані школи, які орієнтуються в підготовці своїх випускників на подальше університетську освіту.
В цілому ж потрібно визнати, контроль і облік успішності, діагностування навченості в зарубіжних школах носять характер об'єктивної констатації результатів. Він не передбачає турботу про всеобучу. Загальноприйнятий принцип індивідуалізації навчання диктує один підхід - кожен йде своїм шляхом і темпом, навчається в міру своїх можливостей, потреб, реальних оцінок майбутнього.
До революції в Росії існувала шестибальною системою оцінки знань з балами від нуля до п'яти. У 1918 р оцінка «0» була скасована. Але поступово і оцінка «1» стала використовуватися все рідше, а починаючи з 50-х років все менше стала використовуватися і оцінка «2». П'ятибальна система оцінок фактично перетворилася в трибальну, а для більшості учнів, які не можуть навчатися на «4» і «5», ця шкала стала двухбалльной. Така оціночна система дуже слабо стимулює навчальний працю, «сходинка» між трійкою і четвіркою нездоланна для більшості учнів.
Однак багато педагогів використовують «доповнення» до звичайної п'ятибальною шкалою у вигляді знаків «плюс», «мінус». Реально виходить три градації п'ятірки ( «п'ять з плюсом», «п'ять», «п'ять з мінусом»), три градації четвірки (аналогічно), три градації трійки і двійки. Виходить типова десятибальна шкала оцінок.
Науково-дослідні установи РАО запропонували нові оціночні шкали, які проходять експериментальну перевірку в різних регіонах країни. Деякі регіони схильні прийняти дванадцятибальною систему оцінок, в якій крім названих десяти балів існує два екстремальних: бал «1» - «рятуйте» - свідчить про те, що учень вимагає негайної індивідуальної допомоги або особливої уваги, аж до приміщення в спеціальний навчальний заклад; вищий бал «12» - екстремальний максимум ( «ура»), що свідчить про появу здатного і надзвичайно обдарованого учня, якого слід навчати індивідуально за спеціальною програмою або ж у навчальному закладі з поглибленим вивченням предметів.
Тестування досягнень і розвитку
Слово «тест» англійського походження і на мові оригіналу означає «випробування», «перевірка». Тест навченості - це сукупність завдань, зорієнтованих на визначення (вимір) рівня (ступеня) засвоєння певних аспектів (частин) змісту навчання.
Правильно складені тести навченості повинні задовольняти ряду вимог. Вони мають бути:
щодо короткостроковими, т. е. не вимагати великих витрат часу;
однозначними, т. е. не допускати довільного тлумачення тестового завдання;
правильними, т. е. виключати можливість формулювання багатозначних відповідей;
щодо короткими, які вимагають стислих відповідей;
інформаційними, т. е. такими, які забезпечують можливість співвіднесення кількісної оцінки за виконання тесту з порядкової або навіть інтервального шкалою вимірювань;
зручними, т. е. придатними для швидкої математичної обробки результатів;
стандартними, т. е. придатними для широкого практичного використання - вимірювання рівня навченості можливо більш широких контингентів учнів, які оволодівають однаковим об'ємом знань на одному і тому ж рівні навчання.
Якщо в основу класифікації тестів покласти різні аспекти (компоненти) розвитку і формування людських якостей, то вона буде виглядати наступним чином:
1. Тести загальних розумових здібностей, розумового розвитку.
2. Тести спеціальних здібностей в різних областях діяльності.
3. Тести навченості, успішності, академічних досягнень.
4. Тести для визначення окремих якостей (рис) особистості (пам'яті, мислення, характеру та ін.).
5. Тести для визначення рівня вихованості (сформованості загальнолюдських, моральних, соціальних та інших якостей).
Застосування тих чи інших тестів буде найбільш успішним і забезпечить надійні висновки лише за умови правильного їх поєднання з усіма іншими групами тестів. Тому тестові випробування завжди мають комплексний характер. Робити загальні висновки, наприклад, про рівень розвитку учнів на основі застосування лише тестів навченості було б великою помилкою. Коли ставиться завдання діагностування навченості в зв'язку з досягненнями і розвитком особистості, потрібно застосовувати відповідні види тестових завдань і покладені на них методики вимірювання, не забуваючи про локальний характер діагностування.
При розробці тестів важливо, наскільки вони відповідають запроектованим цілям навчання, освіти, розвитку учнів. Найважливішими критеріями діагностичних тестів навченості є дієвість (валідність, показовість), надійність (ймовірність, правильність), диференційована (розрізнення).
Дієвість тесту за своїм змістом близька до вимоги повноти, всебічності перевірки, пропорційного представлення всіх елементів досліджуваних знань, умінь. Термін «дієвість» має, як мінімум, два синоніма - валідність (від англ. Valid - має значення, цінний) і показовість, наочність, які тлумачаться так само, як репрезентативність. Завжди мається на увазі, що укладач тесту зобов'язаний ретельно вивчити всі розділи навчальної програми, навчальні книги, добре знати мету і конкретні завдання навчання. Лише тоді він зможе скласти тести, які будуть дієвими для певної категорії учнів.
Чітка і ясна постановка питання в межах освоєних знань - невід'ємна умова дієвості тесту. Якщо тест виходить за межі освоєного змісту або ж не досягає цими межами, перевищує запроектований рівень навчання, то він не буде дієвим для тих учнів, яким він адресований. Дієвість тесту визначається статистичними методами. Величина 0,7-0,9 свідчить про високу дієвість тестів навченості. Якщо ж коефіцієнт кореляції досягає 0,45-0,55, то дієвість тесту вважається задовільною, при більш низьких значеннях вона вважається незадовільною.
Ступінь надійності характеризується стабільністю, стійкістю показників при повторних вимірах за допомогою того ж тіста або його рівноцінного замінника. Кількісно цей показник характеризується ймовірністю досягнення запроектованих результатів (правильністю значень). Грамотно складені та апробовані тести навченості дозволяють досягти коефіцієнта надійності 0,9. Встановлено, що надійність тесту підвищується при збільшенні кількості тестових завдань.
Встановлено також, що чим вище тематичне, змістовне різноманітність тестових завдань, тим нижче надійність тесту. Це слід розуміти так: тест, націлений на перевірку засвоєння конкретної теми, завжди буде більш надійним, ніж тест, спрямований на перевірку всього розділу (курсу), що охоплює значну кількість матеріалу - закономірностей, концепцій, фактів. Відбувається це саме тому, що змістовне різноманітність останнього вище.
Надійність тестів навченості значно залежить від труднощі їх виконання.Труднощі визначається по співвідношенню правильних і неправильних відповідей на тестові питання. Включення до складу тестів таких завдань, на які всі учні відповідають правильно або ж, навпаки, неправильно, різко знижує надійність тесту в цілому. Найбільшу практичну цінність мають завдання, на які правильно відповідають 45-80% учнів.
Характеристика диференційованості (розрізнення) пов'язана з використанням таких тестів, де потрібно вибирати правильну відповідь з декількох можливих альтернатив. Якщо, скажімо, всі учні безпомилково знаходять правильну відповідь на одне питання і також дружно не можуть відповісти на інший, то це сигнал для вдосконалення тесту в цілому. Його необхідно диференціювати, зробити помітним. Інакше подібні завдання не допоможуть відокремити тих, хто засвоїв матеріал на необхідному рівні, від тих, хто заданого рівня не досяг. Практично диференціюють тести за результатами статистичного аналізу, порівнюючи результати виконання тесту в цілому з результатами виконання окремих завдань. Якщо коефіцієнт кореляції між відповідями на конкретні завдання і на тест в цілому більше 0,5, то це свідчить про достатню диференційованості тесту.
При підготовці матеріалів для тестового контролю необхідно дотримуватися таких основних правил:
1. Не можна включати відповіді, неправильність яких на момент тестування не може бути обгрунтована учнями.
2. Неправильні відповіді повинні конструюватися на основі типових помилок і повинні бути правдоподібними.
3. Правильні відповіді серед всіх пропонованих відповідей повинні розміщуватися у випадковому порядку.
4. Питання не повинні повторювати формулювань підручника.
5. Відповіді на одні запитання не повинні бути підказками для відповідей на інші.
6. Питання не повинні містити «пасток».
Тести навченості застосовуються на всіх етапах дидактичного процесу. З їх допомогою забезпечується попередній, поточний, тематичний і підсумковий контроль знань, умінь, облік успішності, академічних досягнень.
Попередній контроль. Успіх вивчення будь-якої теми (розділу або курсу) залежить від ступеня засвоєння тих понять, термінів, положень і т.д., які вивчалися на попередніх етапах навчання. Якщо інформації про це у викладача немає, то він позбавлений можливості проектування і управління в навчальному процесі, вибору оптимального його варіанту. Необхідну інформацію викладач отримує, застосовуючи попередній контроль (облік) знань. Останній необхідний ще і для того, щоб зафіксувати (зробити зріз) вихідний рівень навченості. Порівняння вихідного початкового рівня навченості з кінцевим (досягнутим) дозволяє вимірювати «приріст» знань, ступінь сформованості умінь і навичок. Якщо відомі вхідні і вихідні характеристики системи, проблеми її оптимізації вважаються багато в чому вирішеними.
Зібрати максимальний обсяг інформації про вхідних характеристиках навченості і оцінити їх у кількісних показниках вдається за допомогою тестування, яке здійснюється за допомогою спеціально розроблених для цієї мети завдань.
Поточний контроль. Він необхідний для діагностування ходу дидактичного процесу, виявлення динаміки останнього, зіставлення реально досягнутих на окремих етапах результатів з запроектованими. Крім власне прогностичної функції поточний контроль і облік знань, умінь стимулює навчальний працю учнів, сприяє своєчасному визначенню прогалин в засвоєнні матеріалу, підвищенню загальної продуктивності навчальної праці.
Тематичний контроль. Складання тематичного тестового завдання вимагає копіткої і ретельної праці. Адже мова йде не просто про перевірку засвоєння окремих елементів, а про розуміння системи, яка об'єднує ці елементи. Значну роль при цьому відіграють синтетичні, комплексні завдання, які об'єднують питання про окремі поняття теми, спрямовані на виявлення інформаційних зв'язків між ними.
Підсумковий контроль. Здійснюється під час заключного повторення, а також в процесі іспитів (заліків). Саме на цьому етапі дидактичного процесу систематизується і узагальнюється навчальний матеріал. З високою успішністю можуть бути застосовані відповідним чином складені тести навченості.
Природно, не всі необхідні характеристики засвоєння можна отримати засобами тестування. Такі, наприклад, показники, як уміння конкретизувати свою відповідь прикладами, знання фактів, уміння зв'язно, логічно і доказово висловлювати свої думки, деякі інші характеристики знань, умінь, навичок діагностувати тестуванням неможливо. Це означає, що тестування має обов'язково поєднуватися з іншими традиційними формами і методами перевірки.
|