ИИ превзошел студентов в университетских экзаменах, но показал ограничения

Изображение: Лапухина Мария © ИА Красная Весна
Робот сдает экзамены
Робот сдает экзамены

Искусственный интеллект (ИИ) смог успешно сдать университетские экзамены, но на более высоких курсах люди показали лучшие результаты. Такой итог показал эксперимент, проведенный учеными из Редингского университета под руководством Питера Скарфа, сообщило 29 июня издание Ars Technica.

Согласно отчету, экзаменационные работы, созданные с помощью ChatGPT, получили более высокие оценки, чем работы студентов.

Исследователи использовали более 30 фиктивных учетных записей для сдачи экзаменов по психологии, охватывая пять модулей бакалавриата и задания для всех трех лет обучения. В результате 94% работ, созданных ИИ, прошли без обнаружения этого факта экзаменаторами, а почти 84% из них были оценены выше, чем работы реальных студентов.

Питер Скарф выразил удивление результатами, отметив, что некоторые работы ИИ были замечены не из-за их роботизированности, а из-за чрезмерно высокого качества. Эксперимент также выявил слабости существующих систем обнаружения ИИ-контента, таких, как GPTZero и Turnitin, которые показывают хорошие результаты в лабораторных условиях, но теряют эффективность в реальных условиях.

Тем не менее на последнем курсе, где требовалось более глубокое понимание и сложные аналитические навыки, студенты показали лучшие результаты, чем ChatGPT. Скарф подчеркнул необходимость адаптации университетов к использованию ИИ в образовательном процессе, учитывая его постоянное совершенствование и отсутствие надежных методов обнаружения.

Он заключил, что современные университеты должны готовить студентов к использованию ИИ в профессиональной карьере, что требует пересмотра методов обучения и экзаменации уже сегодня.