ChatGPT самостоятельно решил открытую математическую задачу Эрдёша

Исследователь Neel Somani сообщил, что новая версия ChatGPT смогла самостоятельно получить корректное доказательство открытой математической задачи.

Разработчик и исследователь Neel Somani обнаружил, что новая версия ChatGPT смогла самостоятельно решить сложную математическую задачу, относящуюся к числу так называемых открытых проблем. Для эксперимента он загрузил формулировку задачи в чат-модель и оставил её работать без вмешательства примерно на 15 минут. По возвращении Somani получил полный ответ, который затем проверил и формализовал с помощью инструмента Harmonic. Анализ показал, что представленное доказательство является корректным.

По словам Somani, изначально он стремился понять, на каком уровне сложности большие языковые модели способны решать открытые математические задачи и где проходят границы их возможностей. Результаты работы последней версии модели оказались для него неожиданными и показали, что этот предел сдвинулся дальше, чем предполагалось ранее.

В ходе рассуждений ChatGPT использовал ряд фундаментальных математических понятий и формул, включая формулу Лежандра и постулат Бертрана. Модель также опиралась на идеи, опубликованные в 2013 году на платформе MathOverflow, где американский математик Ноам Элкис предлагал решение близкой по смыслу задачи. При этом вывод, полученный ИИ, отличался от известного подхода и оказался более полным применительно к варианту задачи, предложенному Паулем Эрдёшем.

Somani отметил, что после выхода версии GPT 5.2 заметно выросли способности моделей к математическим рассуждениям. Количество задач, которые они могут решать без прямого участия человека, увеличилось настолько, что этот прогресс сложно не учитывать. Это, по его мнению, поднимает вопросы о потенциальном влиянии таких систем на развитие науки.

Исследователь также напомнил, что первые автономные решения математических задач подобного уровня появились ещё в ноябре в модели AlphaEvolve на базе Gemini. Однако именно в последние недели GPT 5.2 продемонстрировал особенно уверенную работу с высокоуровневыми математическими проблемами.

Даже известные математики, включая Терренса Тао, по словам Somani, оценивают эти достижения с осторожным оптимизмом. Они указывают на то, что ИИ хорошо подходит для систематической работы с обширным списком задач Эрдёша, многие из которых имеют относительно прямые решения, но долгое время оставались нерешёнными. Эксперты портала «boda» считают, что подобные успехи не заменяют человека, но усиливают роль ИИ как инструмента современной математики.