Китайцы научили ИИ играть в безлимитный техасский холдем как профи

Робот-судья. Цитата из х/ф «Элизиум. Рай не на Земле». Реж. Н. Блокамп. 2013. США
Робот-судья. Цитата из х/ф «Элизиум. Рай не на Земле». Реж. Н. Блокамп. 2013. США

Китайские ученые разработали программу искусственного интеллекта (ИИ), которая быстро думает и находится на одном уровне с профессиональными игроками-людьми в безлимитном техасском холдеме, сообщает 12 декабря агентство Синьхуа.

Согласно документу, который будет представлен на AAAI 2022, глобальной конференции по искусственному интеллекту, которая состоится в Ванкувере в феврале следующего года, программа искусственного интеллекта под названием AlphaHoldem равнялась четырем опытным игрокам-людям в соревновании на 10 000 рук для двух игроков, после трех дней самообучения.

Техасский холдем — популярная игра в покер, в которой игроки часто обманывают и блефуют. Для компьютера это серьезная проблема в сравнении с шахматами или го, поскольку решения принимаются с использованием проблематичной информации.

Исследователи из Института автоматизации при Китайской академии наук (CAS) сообщили, что AlphaHoldem удалось научить быстро играть с затратами всего около трех-четырех миллисекунд на каждый ход, что примерно в 1000 раз быстрее, чем у компьютерных игроков в холдем с искусственным интеллектом первого поколения DeepStack и Libratus.

По данным исследователей, AlphaHoldem одержал верх над DeepStack в соревновании на 100 000 раздач. DeepStack, разработанный Университетом Альберты, и Libratus, разработанный Университетом Карнеги-Меллона, обыграли профессиональных игроков в безлимитном холдеме для двух игроков в 2016 и 2017 годах.

По словам исследователей, два предыдущих ИИ-игрока, основанные на алгоритме, называемом минимизацией контрфактического сожаления, тратили соответственно три и четыре секунды на каждое движение, потребляя большое количество вычислительной мощности.

AlphaHoldem, которая использует новую структуру, включая глубокое обучение в новый алгоритм самостоятельного воспроизведения, использовала во время обучения только восемь графических процессоров, что значительно проще по сравнению с 13 000 графическими процессорами DeepStack, согласно недавнему выпуску новостей CAS.

Исследователи заявили, что в будущем они будут применять базовую технологию в других играх, таких как маджонг и бридж, способствуя развитию более интеллектуального ИИ.