Подпишитесь на Telegram-канал, чтобы получать уведомления о новых публикациях!

Хватит ли Вашего логического мышления для работы в роли методиста — разработчика тестовых заданий? (онлайн-тест и его результаты)

Итак, три дня отведенных на наш условный конкурс (на самом деле очень дружеский) завершились! На удивление тест оказался популярным. Его выполнили уже 61 человек (и это еще не окончательная цифра — мы продолжаем держать тест открытым). Причем более трети (22 человека, или 37%) показали максимальный 100-процентный результат (!). Вот как выглядит гистограмма распределения тестовых баллов:

Из претендентов на льготное участие в нашей школе мы пока выбрали третьего участника (третьим показавшего 100-процентный результат по времени, а первые двое — это два наших сотрудника-методиста, которые, разумеется, выступили вне конкурса). Имя этого победителя — Анастасия (мейл, разумеется, я скрываю). Надо сказать, что из 20 победителей 12 указали все-таки свой мейл. Мы, видимо, напишем приглашение каждому. Ну а там посмотрим, будут ли среди них желающие участвовать в нашей летней школе КТЗ-25.

Что еще интересно заметить? — Много было очень легких заданий (я намеренно вначале такие поставил, чтобы возник комфортного 100-процентного понимания и обучаемости). При этом интересно то, что самый высокий показатель КД (коэффициент дискриминативности) обнаружен у самого трудного последнего задания. По наполнению клеток четырехклеточной таблицы сопряженности (ЧТС) мы видим, что ошибочные ответы дали только представители «низкой группы» — люди с общим низким баллов по тесту (относительно низким). Таких оказалось в клеточке D (в правой нижней), как видим, всего 17 человек. А вот из высокой группы ни один испытуемый не ошибся: в левой нижней клеточке C стоит значение 0. Кстати на этом скриншоте указано, что тест уже выполнили не 61, а 62 человека. Это пока я писал данную статью появился еще один протокол…

Средняя продолжительность выполнения 15 заданий — 11 минут. Но… появился и такой участник по имени Александр, который показал 100-процентный результат быстрее, чем за 5 минут (!). Так что в данном случае различия скорее проявились в скорости выполнения, чем в набранных баллах. Тоже любопытный факт!

Ниже повторяю исходный текст приглашающей статьи.

=========================

Уважаемые коллеги!

Я уже более 40 лет преподаю такую особую дисциплину как «Разработка тестов» (Test construction). Из них 40 лет я преподавал эту дисциплину в формате спецпрактикума для весьма одаренных студентов МГУ имени М.В.Ломоносова. Среди этих студентов тоже встречались иной раз субъекты со слаборазвитым логическим мышлением, но большинство справлялись вполне успешно. Более серьезные проблемы у меня начались, когда я стал предлагать аналогичный практикум другому контингенту — людям, которые называют сами себя «эйчарами», но при этом получили …гм…самое разное образование, иной раз весьма «условное», и редко кто из них изучал математическую логику.

Вот тут-то примерно половина участников практикума начали сталкиваться с существенными проблемами. Проблемы эти начинались буквально с первого экрана на моих слайд-лекциях, где я предлагаю воспользоваться «круговыми диаграммами Эйлера». Оказалось, что сам язык этих диаграмм участникам наших онлайн-курсов оказывается малознакомым, слишком абстрактным, неестественным (?!). А ведь эти диаграммы — надежный и наглядный инструмент, который позволяет в явном виде описать структуру ключевых утверждений в тестовых заданиях, добиться безупречной логики в этих заданиях — особенно в тестах на знания и способности.

Сейчас в преддверии летнего цикла занятий хотелось бы Вам предложить выполнить такой тест:

https://test.ht-inc.ru/test/9efd4f3c295bee707114b3d126293c51

Это тест займет у Вас не больше 7-10 минут и позволит достаточно надежно измерить степень Вашей готовности к восприятию материалов нашего дистанционного курса. Вот ссылка на лэндинг самого курса «КТЗ-25», где на него можно сразу же записаться (скриншот ниже — кликабельный):

ВАЖНО: предложенный вам тест «Логические круги» является не только измерительным, но во многом обучающим. Ведь после каждого задания Вы будете получать обратную связь о том, насколько ваш ответ оказался правильным. Этот тест без преувеличения поможет Вам подготовиться к нашим занятиям, если Вы уже настроены на то, чтобы в этом сезоне принять в них участие.

=========== ОТДЕЛЬНЫЕ ПРИМЕРЫ ЛОГИЧЕСКИХ ОШИБОК =============

В ходе занятий нашего практикума слушатели должны оценить логическую правильность заданий, которые создают другие участники. Каким образом? — А мы применяем особую онлайн-процедуру взаимной круговой оценки: каждый оценивает задания созданные другими участниками и, в свою очередь, получает оценки и комментарии к своим заданиям. Уже в ходе таких взаимных оценок и комментариев проявляются логические ошибки как у авторов тестовых заданиях, так и у тех же авторов, выступающих в роли «экспертов — оценщиков».

Даю упрощенный пример из такой научной сферы (биологии), которая со школьной скамьи известна всем, как строгая логическая классификация видов животных, анатомические и функционально-поведенческие свойства которых давно и хорошо изучены.

Предположим, начинающий автор формулирует свое задание так:

Укажите единственной правильное суждение из данного набора суждений:

а) парнокопытные кормят своих детенышей молоком

б) птицы умеют летать

в) только рыбы умеют плавать под водой

Очевидно, что автор задумал задание так, что правильный (ключевой) ответ — это суждение А про парнокопытных. Но некоторые «эксперты-оценщики» обрушивают на такое задание следующую критику: они утверждают с пылом и жаром, что задание содержит больше одного правильного ответа. Объяснение такое: ведь в самом деле большинство птиц умеет летать, ведь это отличительный признак именно птиц в отличие от других «хордовых» — приспособленность к полету (!).

На самом деле надо бы более осторожно критиковать автора этого тестового задания — лишь за то, что он не указал точный логический объем суждения В — относится ли оно ко всем птицам или к некоторым. Чтобы суждение Б было заведомо ошибочным (так называемым «дистрактором») надо было бы написать так: «Все птицы умеют летать». А если бы хотели сделать это суждение истинным, то надо было бы написать так «Некоторые птицы умеют летать». В первом случае слово «все» — это естественно-речевой аналог так называемого логического оператора «квантор всеобщности». Во втором случае слово «некоторые» — это естественно-речевой аналог логического «квантора существования».

Нередко определенная «демагогия» (не вполне логичное умствование) возникает и по поводу суждения С. Хотя мы видим, что в данном случае автор попытался использовать логически важное слово «только», чтобы избежать критики. Но люди со слаборазвитым логическим мышлением начинают и здесь «мудрствовать»: киты и дельфины не являются рыбами, да, но… они не плавают, а ныряют; в том смысле, что не дышат под водой. Так что… получается у них, что все три суждения оказываются правильными (!).

Еще пример ситуации, когда споры возникают вокруг заданий, которые в принципе составлены достаточно правильно, но провокационно в логическом смысле — то есть у людей со слабым логическим мышлением такие задания провоцируют логические ошибки.

Укажите народ Российской Федерации, у которого национальный танец — лезгинка:

а) осетины

б) татары

в) калмыки

Темпераментные представители других кавказских народов, которые тоже танцуют лезгинку, считают в данном случае необходимым не только возразить, но даже… ОБИДЕТЬСЯ (?!). Мол, как так?! — Вы не назвали здесь дагестанцев (кабардинцев, аварцев, ингушей и т.п.). Приходится долго, терпеливо и уважительно объяснять, что тестовое задание отличается от параграфа в учебнике тем, что оно НЕ обязано содержать полное перечисление всех возможных правильных ответов. Достаточно только иметь один правильный ответ! И в данном случае один правильный ответ есть — это ответ А. А все остальные ответы Б и В не являются правильными.

Примеров можно было привести гораздо больше, но надеюсь продолжить этот разговор с теми читателями, которые станут слушателями нашей летней школы КТЗ-25.

P.S.

С появлением нейросетей типа ChatGPT или DeepSeek возникла такая иллюзия, что эти системы могут освободить разработчика тестовых заданий от… всякого логического напряжения. На самом деле это не более, чем иллющия. В рамках летней школы мы запланировали особый вебинар, на котором детательно и на примерах покажем, как необходимо СВОИМ УМОМ работать — критически проверять те задания, которые в большом количестве могут Вам «нагенерить» эти системы.

комментировать

15 ответов

  1. Виктор Щапов

    Песня про тоску и кораблик Аллы Пугачевой… Можно увидеть музыку в тестах. Некоторые её видят в математике. Надо же до такого дойти!

    1. Шмелёв А.Г.

      Виктор, ваша аналогия с корабликом и музыкой от меня, признаться, ускользает. Это важно? Спасибо за ваше участие в этом почти что шуточном и заведомо дружеском тест-конкурсе.

  2. Ольга Меркулова

    Что-то мне в последнем вопросе теста кажется, что один из дистракторов не совсем корректно сформулирован и его тоже можно считать правильным… — не хватает там (IMHO), что не все _из них_ (можно понять, что в первой части предложения речь идет о некоторых объектах В, а во второй — о не всех объектах тоже из В, а не из тех некоторых, которые обсуждаются в первой части предложения). Согласна, что другой вариант правильный, но в ночи все-таки концентрация подвела и не стала в него вчитываться, так как ошибочно выбранный показался правильным…

    На скидку не претендую, просто хотела убедиться, что не совсем забыла матлогику)

    1. Шмелёв А.Г.

      Ольга, Вы оказались правы. Ошибка исправлена. Баллы всех 20 вчерашних участников пересчитаны. Увы, в самом деле именно в последнем 15-м задании «рука бойца колоть устала», так что оказались перепутаны правильный ответ и дистрактор. СПАСИБО ВАМ за проявленную бдительность и настойчивость. У Вас, кстати, после пересчета получился 100% результат и …кажется, именно ваш максимальный результат оказался первым среди таких. Так что Вы как раз и являетесь первым претендентом на нашу скидку. Впрочем, остальные обладатели 100%-результатов тоже могут заявить о своем желании участвовать. Вопросы о скидках для них будем решать в индивидуальном порядке. Если есть желание, то напишите заявку по адресу нашей школы — lk@ht.ru.

      1. Ольга Меркулова

        Александр Георгиевич, рада, что не зря в ночи комментарий написала. С удовольствием бы поучилась у вас. Но придется и дальше при необходимости обращаться к книжке — увы, времени катастрофически не хватает, чтобы заниматься чем-то не критично важным с точки зрения текущих профессиональных и жизненных задач.

        1. Шмелёв А.Г.

          Я за много лет вычислил эту печальную закономерность: у самых способных людей в нашей стране совсем нет резервов свободного времени, уж очень они загружены и перегружены уже принятыми обязательствами и задачами. Например, отзывы на мою э-книгу «Психология конкуренции» (и соответствующий дистанционный курс) написали наши бывшие соотечественники, которые теперь живут и работают за рубежом (на пресловутом Западе). Почему? — А им там не надо для выживания хвататься за «подработки».

          Ольга, спасибо, что Вы в явном виде написали о своей ситуации. Воспринимаю это как знак уважения.

          1. Алексей

            Совсем не ясно, как изменился дистрактор в 15 задании. При существующем на начало акции, логически правильным был вариант, который сейчас исключен из накопленных баллов. Получившие 100% правильных ответов в таком случае — добросовестно выполнили тест, в том числе и я. Но тут у них забрали достижение, переформатировав базу, сместив дистрактор. По меньшей мере неуместно.

          2. Шмелёв А.Г.

            Алексей, ответы в задании номер 15 остались прежними. Просто исправлена ошибка в ключе. Это видно по коэффициенту КД. Теперь это положительный, а не отрицательный коэффициент. Это означает, что более точные и логичные испытуемые теперь выбирают правильный ответ. Я благодарил тех участников, которые помогли обнаружить этот технический просчет. Данный случай хорошо иллюстрирует, как подсчет КД помогает обнаружить ошибку разработчика (кроме отзывов сознательных и активных участников).

            Что касается Вас лично, то Вы, к сожалению, допустили ошибку именно в этом 15 заданий, так что при пересчете баллов Ваш результат стал немного отличаться от 100%. Все равно это вполне приличное достижение. Благодарю Вас за активное и заинтересованное участие, Алексей

          3. Алексей

            Я не мог ошибиться в выборе ответа, и на момент выполнения задания, выбранный мною вариант числился правильным. Еще раз пересмотрев задание, остается не ясным, как можно выбрать вариант, относящийся к дистрактору. Все равно даю ответ, который является верным. В таком случае, если исключить возможность, при выставленной публично оферте, подтасовки результатов или искажения по вине разработчика, то добросовестному разработчику следует результат выполнения 15 задания считать как правильный у всех выполнивших его до внесения изменений, наравне с выбравшими «не дистрактор».

          4. Шмелёв А.Г.

            Алексей, Вы исходите в своих рассуждениях из ложного утверждения: «Я не мог ошибиться в выборе ответа». На самом деле ошибаются все. Только одни признают это, а другие не могут это признать.

            Кроме того традиции наших тест-конкурсов таковы (в рамках клуба КИТТ, в частности), что немедленный отчет — это всегда предварительный результат, который может быть скорректирован после завершения конкурса.

          5. Алексей

            И все-таки хотелось бы увидеть потокол с ответами. Отключать кнопку ответа в сообщении как минимум некрасиво.

  3. Qwerty

    Какой же бред делать выводы о пригодности к работе методистом или программистом на основании того, что тестируемый разобрался в кругах Эйлера)))) Это лишь одно из множества качеств, причем далеко не главное. Если вы разложите профессионально важные качества методиста на диаграммы Эйлера — это будет наглядно. Есть существенно более важные ПВК у методиста, и если их нет, то понимание диаграмм Эйлера никак не поможет:)

    1. Шмелёв А.Г.

      Уважаемый пользователь, предпочитающий скрываться под очень оригинальным ником Qwerty. Вы совершенно правы в том, что для работы методистом нужно обладать множеством разных качеств. В том числе это ЧЮ — Чувство Юмора. Прошу Вас подумать о том, хватило ли Вам самому этого качества при восприятии данной методики. Да, я не написал в явном виде, что предложенная интерпретация результатов этого теста — это ШУТКА (!). Не написал потому, что считаю так: людям, обладающим ЧЮ, не надо в явном виде указывать, когда именно появляется шутка 🙂

  4. Алексей

    Как увидеть свой результат?

    1. Шмелёв А.Г.

      Алексей, я вам высылаю отчет на указанный Вами адрес почты.


Добавить комментарий для Ольга Меркулова Отменить ответ

Ваш адрес email не будет опубликован. Обязательные поля помечены *

Актуальный опрос

Ваши вопросы

Есть вопрос к автору блога?
Вы можете задать его здесь -> <клик>

Рубрики

Последние комментарии:

  1. В принципе, подобная постановка вопроса представляется вполне риторический: да, безусловно, нужны. Возникающие же вопросы (а они, естественно, не могут не…

  2. Ольга, спасибо за вашу характеристику группы активистов, которые активно откликаются на публикации ПГ. У меня сложилось впечатление, очень сходное с…

Облако меток