Бот победи в покер с шестима – и какво от това?

Pluribus постигна свръхчовешка производителност в мултиплеър покер, което е критичен пробив в областта на изкуствения интелект и в теорията на игрите

Сигурно сте чули вече – програма с изкуствен интелект е победила група от най-добрите покер играчи в игра за шестима. Ботът е проектиран от дивизията на Facebook за изкуствен интелект и учени от университета Карнеги Мелън. За него съобщи авторитетното списание Science.

В продължение на над 12 дена и 10 000 ръце ИИ системата, наречена Pluribus, се изправи срещу 12 професионалисти, подбрани от група от играчи, предварително дали съгласието си за това. Играта бе разигравана в два различни варианта. В единия ботът играе заедно с петима играчи; в другия пет версии на бота играят с един играч (без компютърните програми да си сътрудничат в този сценарий).

В крайна сметка Pluribus спечели средно по 5 долара на ръка с почасови печалби от около 1000 долара – „решаващ марж на победата”, според изследователите.

Сложност

Програмите за изкуствен интелект в игри са побеждавали хората и преди. Ботовете се справят отлично в партии на шах, покер за двама и други игри, в които има само двама играчи. Ала да победиш в покер с множество играчи е нещо, което досега не е постигано от ИИ.

Предшественикът на Pluribus, наречен Libratus, стана известен преди две години, като победи най-добрите играчи на покер – но програмата играеше само с по един играч.

„Pluribus постигна свръхчовешка производителност в мултиплеър покер, което е критичен пробив в областта на изкуствения интелект и в теорията на игрите”, казва Туомас Сандхолм, професор по компютърни науки в Карнеги Мелън. Досега подобни постижения са били ограничени само до игри за двама, добави той.

Още по-интересно е, че програмата играе досущ като човек, включително умее да блъфира много успешно. Според накои от професионалистите, програмата прави това по-сполучливо от човек.

Но как?

Първо учените „научили” Pluribus да играе покер, като го накарали да играе срещу свои копия – процес, известен като самостоятелна игра. Това е обичайна техника за обучение по ИИ, при който системата се самообучава чрез проби и грешки; тя играе стотици хиляди ръце срещу себе си.

Този процес на обучение се оказал забележително ефективен: Pluribus е създаден само за осем дена, използвайки 64-ядрен сървър, оборудван с по-малко от 512GB RAM. Обучението на такава програма в „облака” би струвало нещо от порядъка на 150 долара, казват учените – а това го прави перфектна сделка в сравнение с други модерни системи.

Приложения

Според създателите на Pluribus, технологията може да бъде използвана за решаване на „голямо разнообразие от реални проблеми”, които, подобно на покера, включват участници, които блъфират или крият ключова информация.

Според Сандхолм, алгоритъмът има потенциал за приложения, вариращи от киберсигурност до инвестиционно банкиране, превенция на финансовите измами, стратегии за договаряне и дори военни тактики. Всички области, в които има някакъв елемент на криене на информация и блъфиране, могат да се възползват от подобен алгоритъм.

„Дори може да е полезно за неща като управление на трафика при безпилотните автомобили”, казват учените.

Жертва на успеха си

За спечелването на победата Pluribus е използвал толкова ловко изненадващи стратегии и блъфиране като опитен професионалист, че изглежда е притеснил своите създатели. Затова сега изследователите са решили да не публикуват и споделят кода на програмата, тъй като се притесняват, че тя може да попадне в злонамерени ръце, които да „източат” касите на покер компаниите.

Източник: technews.bg

Facebook коментари

Коментари в сайта

Последни новини