Канадские ученые разработали робота, который способен обыграть в Texas Hold’em любого

Лучшие онлайн казино за 2020 год, честный рейтинг:
  • Сол Казино
    Сол Казино

    1 место! Самый высокий процент отдачи!

  • ФРЭШ Казино
    ФРЭШ Казино

    Свежий дизайн и высокая отдача денег!

Канадские ученые создали непобедимого «игрока» в покер

Канадские ученые разработали и представили компьютерную программу, являющуюся «непобедимым игроком» в покер, сообщает сайт Университета провинции Альберта.

В заявлении говорится, что пока программа «Цефей» (Cepheus) обучена играть только в одну разновидность популярной карточной игры — техасский холдем с двумя партнерами и ставками фиксированного размера.

Отмечается, что «Цефей» развивал свои способности без вмешательства человеческих экспертов — программу только ознакомили с правилами игры, после чего она тренировалась самостоятельно. По словам ученых, «электронный картежник» на протяжении двух месяцев использовал более четырех тысяч процессоров, на которых каждую секунду разыгрывались шесть миллиардов партий в покер — больше, чем человечество сыграло за всю свою историю.

Создатели программы считают, что она является ключевым этапом в области исследований искусственного интеллекта и теории игр. Они напоминают, что покер является игрой с неполной информацией в отличие от шашек, алгоритм игры в которые полностью просчитан, и шахмат, при игре в которые компьютеры побеждают людей-шахматистов.

Все желающие имеют возможность проверить силу «Цефея» и сыграть с ним в покер — для этого на сайте проекта предусмотрена отдельная вкладка.

Человек доказал свое превосходство над компьютером в безлимитном покере

Фото: Globallookpress.com / Imagebroker / Christian Prandl

Двухнедельный турнир по покеру между лучшей компьютерной программой и четырьмя профессионалами (из первой десятки рейтинга лучших игроков мира) закончился победой человека. Разработанная в Университете Карнеги-Меллон программа Claudico проиграла в безлимитный техасский холдем около 732 тысяч долларов. О научно значимых результатах турнира сообщается в пресс-релизе университета.

Соревнование проходило в питтсбургском казино Rivers. Люди и компьютер соревновались ежедневно с 11 утра до 10 вечера. Всего прошло около 80 тысяч раздач. Три игрока закончили турнир с выигрышем 529, 213 и 70 тысяч долларов, а один — с проигрышем 80 тысяч.

Однако при всей величине выигрыша превосходство людей на самом деле оказалось весьма шатким: 732 тысячи долларов при общем объеме ставок в 170 миллионов. Таким образом, истинным итогом оказалась статистическая ничья (сумма выигрыша не дотянула до статистически значимой).

Онлайн казино полностью на русском языке:
  • Сол Казино
    Сол Казино

    1 место! Самый высокий процент отдачи!

  • ФРЭШ Казино
    ФРЭШ Казино

    Свежий дизайн и высокая отдача денег!

«Наша цель — это не победить человека. Мы стремимся создать искусственный интеллект, который поможет людям принимать решения в ситуациях с множеством неизвестных фактов — в лечении болезней, в деловых переговорах, при покупке машины», — отметил главный разработчик Claudico Туомас Сандхольм (Tuomas Sandholm).

Стратегия системы опирается на ее собственные алгоритмы, а не на ходы и тактику известных игр с участием человека. Claudico уже сыграл сам с собой несколько триллионов партий. Запускаются эти алгоритмы на суперкомпьютере Blacklight, причем единственной информацией на вводе являются правила игры в покер. К концу игры файлы со стратегией Claudico заняли около двух терабайт — гораздо больше, чем способны изучить исследователи.

Сильной стороной системы оказалась способность быстро и случайным образом переключаться между различными стратегиями, слабой — медленная настройка на манеру игры индивидуального противника.

«Это хороший, но не выдающийся игрок. Некоторые его ставки ставили меня в тупик. Вряд ли какой человек поставит 19 тысяч, чтобы сорвать банк 700 долларов. Зато Claudico никогда не теряет хладнокровия — даже огромный проигрыш не влияет на его дальнейшую игру», — поделился своими впечатлениями один из участников турнира Дуг Полк (Doug Polk).

Покер является важнейшим испытанием для искусственного интеллекта, так как это игра с неполной информацией, где участники обладают скрытым от остальных знанием о своих картах, а также могут использовать эту информацию в свою пользу (например, блефовать). Если в играх с полной информацией (например, шахматах, где оба игрока видят положение всех фигур на доске) искусственный интеллект или обыгрывает человека, или как минимум добивается паритета с ним, то над покером программисты безуспешно бьются с 2006 года (когда прошел первый ежегодный чемпионат по этой игре среди компьютеров).

В январе 2020 года канадским ученым удалось написать компьютерную программу, способную на слабое решение техасского холдема с лимитированными ставками. Иными словами, компьютер смог создать стратегию игры, настолько близкую к оптимальной, что никакой человек не способен обыграть его (со статистическим уровнем значимости) за всю свою жизнь.

Канадские ученые разработали робота, который способен обыграть в Texas Hold’em любого

«Те приемы, которые мы разработали при создании этой системы искусственного интеллекта, не являются специфичными для покера, и их можно применять при решении любых других проблем, когда у нас нет полной информации для принятия решений. Такие задачи встречаются повсеместно, и мы ожидаем, что идеи, заложенные в Libratus, будут играть решающую роль в дальнейшем развитии и распространении ИИ», — заявил Ной Браун (Noam Brown) из университета Карнеги-Меллон в Питтсбурге (США).

За последние два года программисты и математики совершили настоящий прорыв в области создания систем искусственного разума, превосходящих человека в умении играть в определенные стратегические и азартные игры. К примеру, в прошлом году ученые создали ИИ AlphaGo, способную играть в древнекитайскую стратегию го лучше чемпионов Европы и мира, а в этом году они представили ее новую версию, способную учиться без участия человека.

Помимо го, системам ИИ покорилась еще одна сверхсложная игра – покер. В марте прошлого года канадские программисты из университета Альберты создали искусственный разум DeepStack, способный играть в одну из простейших версий покера. Ему удалось стать победителем на одном из турниров по покеру, который проводился под эгидой Международной федерации покера.

Покер, как объясняет Браун, одновременно и сложнее, и легче, чем го – вариантов в нем меньше, чем в китайской стратегии, но при этом у него есть одно существенное различие. В отличие от игроков в го, любители покера не вынуждены действовать, не имея полных данных о том, что знает или не знает их соперник, какие карты он имеет на руках и что он может сделать.

Единственным источником информации для них являются те карты, которые имеются у них на руках, возможный набор из нескольких резервных карт, который крупье выкладывает на стол, а также мимика, жесты и прочие аспекты поведения соперников. Оценка всех этих факторов является неимоверно сложной задачей для машины, что часто вынуждает ученых идти на использование различных «заготовок» для облегчения ей задачи или на упрощение правил игры.

Браун и его коллега Туомас Сандхольм (Tuomas Sandholm) создали систему ИИ, не нуждающуюся в подобной поддержке, научив свое детище, Libratus, мыслить «абстрактно». Иными словами, эта версия искусственного разума умеет находить общие черты в различных комбинациях карт, ставок и прочих элементов игры, и считать их примерно одним и тем же вариантом развития событий, что существенно упрощает игру и позволяет находить простые решения для самых очевидных комбинаций карт и вариантов ходов соперника.

Если же ход партнера по игре является неожиданным для машины, то она просчитывает его последствия отдельно, используя мощности суперкомпьютера, и ищет безопасные варианты продолжения игры, которые помогли бы ей выиграть или хотя бы минимизировать потери.

Удачные версии этих новых ходов записываются в специальную «книгу стратегий», которую Libratus использует в последующих раундах игры.
Протестировав работу этой системы в играх с предыдущими версиями ИИ, ученые пригласили четырех ведущих игроков в «техасский холдем» – Джейсона Леса, Дона Кима, Дэниэла Макоули и Джимми Чоу — сыграть с машиной в небольшой турнир с призовым фондом в 200 тысяч долларов, 10% которого гарантированно доставались каждому мастеру.

Этот чемпионат завершился разгромом людей – к концу соревнования на «руках» Libratus имелось огромное число фишек, чья совокупная стоимость составляла 1,8 миллиона долларов, которые он выиграл у каждого игрока по-отдельности. По сути, если бы чемпионат проводился полностью «честно», то весь призовой фонд ушел бы искусственному разуму.

Как отмечают ученые, Libratus можно применять и для решения других стратегических задач, встречающихся в реальном мире, а также для создания игровых систем для других видов покера и прочих азартных или «обычных» игр.

Тут самые большие бонусы:
  • Сол Казино
    Сол Казино

    1 место! Самый высокий процент отдачи!

  • ФРЭШ Казино
    ФРЭШ Казино

    Свежий дизайн и высокая отдача денег!

Добавить комментарий