фoтo: pixabay.com
Сoрeвнoвaниe, о котором идёт речь, стартовало в начале текущего года и длилось 20 дней, в ходе него было отыграно 120 тысяч раздач. ИИ сыграл с каждым из игроков-людей и во всех случаях вышел победителем.
Разработчики отмечают, что алгоритмы, позволившие программе освоить покер, теоретически столь же применимы и к другим играм с неполной информацией, то есть тех, в которой для соперников присутствует элемент неопределённости. Более того, по словам специалистов, те же принципы распространяются и на многие другие аспекты жизни, от бизнес-переговоров до обеспечения кибербезопасности.
Libratus строит свою стратегию при помощи трёх основных модулей. Первый модуль позволяет избрать первоначальную тактику, основываясь на несколько упрощённом анализе игры. Поскольку просчитать и сопоставить абсолютно все варианты развития игры невозможно, компьютер «воспринимает» как идентичные некоторые комбинации, которые почти таковыми на интуитивном уровне воспринимает и человек — скажем, флеш, в котором старшей картой является король, и флеш, в котором старшей картой является дама.
Второй модуль позволяет на базе первоначальных идей и ходов соперника, которые были ими «не учтены», формировать новую, более тонкую стратегию. Наконец, третий модуль пытается внести в неё такие коррективы, которые могли бы извлечь максимум выгоды из характерных для конкретного оппонента ошибок.
Как сообщается, Libratus одолел не только людей, но и другие алгоритмы, созданные для игры в покер и в прошлом продемонстрировавшие свою эффективность.
Самое интересное за день в «МК» — в одной вечерней рассылке: подпишитесь на наш канал в Telegram.