ربات‌‌ پوکر فیسبوک چیست ؟ همه چیز در مورد ربات پوکر فیسبوک و حواشی پیرامون آن !

توسط Hichkas

ربات‌‌ ها را در فیلم‌های زیادی در ژانر علمی- تخیلی دیده‌ایم که مربوط به سال‌های آینده زمین می‌شوند، زمانی که هوش‌های مصنوعی به وفور دیده می‌شوند و ربات‌‌ها کار انسان‌ها را انجام می‌دهند اما برخی از هوش‌های مصنوعی که به مشکل بر می‌خورند برای کره زمین و بشر مشکل ایجاد می‌کنند. که امیدواریم داستانی مانند ترمیناتور برای ما پیش نیایید .

دو ربات‌‌ تولید فیسبوک !

حال  در این میان مشکلی که دو ربات‌‌ برای شرکت فیسبوک ایجاد کردند بی شباهت به این موضوع نیست. فیسبوک دو ربات‌‌ خود که از فناوری هوش مصنوعی بهره می‌بردند را به دلیل مکالمات عجیب و غریبی که با یکدیگر داشتند و تنها خودشان متوجه آن می‌شدند، از کار انداخت!

پس از این داستان که در سال 2017 رخ داد در سال 2020 شاهد فعالیت دوباره این کمپانی برای طراحی روباتی برای بازی پوکر بود .

Noam Brown ، سخنگوی تیم محققان هوش مصنوعی فیس بوک ، در گفتگو با بی بی سی گفت: “مردم فکر می کنند بلاف زدن یک ویژگی کاملا انسانی است. اما در واقع بلاف زدن توجیه ریاضی دارد. وقتی ربات‌‌ «بلوف می زند» ، آن را فریب کارانه یا غلط نمی بیند، این فقط راهی برای کسب درآمد بیشتر است. “

فقط برای استفاده مجازی

آقای براون گفت نه او و نه فیس بوک برنامه ای برای استفاده از هوش مصنوعی در بازی های واقعی پوکر ندارند. در واقع ، این شرکت گفته است که بخاطر ترس از تاثیر منفی بر جامعه پوکر ، بسیاری از کدها را فاش نمی کند.

برای مدت زیاد، بازی پوکر چالش مهم و بزرگ برای محققان هوش مصنوعی بوده است. چون پوکر بازی اطلاعات پنهان است. در پوکر کارت حریف را نمی دانیم و بلاف زدن لازمه ی موفقیت و برد در بازی است که برای مثال در بازی شطرنج نیست. همین تفاوت، پوکر را در برابر تکنیک های هوش مصنوعی تا حد زیادی مقاوم ساخته. در حالی که بازی مانند شطرنج کاملا برای هوش مصنوعی حل شده است.

در سال های اخیر فناوری های هوش مصنوعی قادر به ساخت رباتی که بتواند انسان را در بازی 2 نفره شکست دهد، بوده .اما توسعه سیستم هوش مصنوعی قادر به شکست دادن بازیکنان پوکر در مقیاس کامل 6 نفره نقطه عطف اصلی باقی مانده در میان فعالان این زمینه بوده است.

تست مسابقات ربات‌‌ ها و انسان ها

Pluberis،  بازیکنان حرفه ای را در دو قالب “۵ربات‌‌ +۱ انسان” و ” ۵ انسان +۱ ربات‌‌ ” شکست داد. اگر ارزش هر چیپ را 1 دلار در نظر بگیریم. به طور میانگین در هر دست موفق شد 5 دلار ( 1000 دلار/ ساعت) برنده شود. این آمار میان بازیکنان حرفه ای نیز یک آمار خارق العاده محسوب می شود.

این اولین باری است که یک ربات‌‌ هوش مصنوعی موفق به شکست دادن انسان در بازی های استراتژیک با بیشتر از 2 بازیکن می شود. در این مقاله ما به جزئیات بیشتر Pluberis  می پردازیم.

Pluberis با کمک فناوری و اطلاعات موجود از Libratus ، رباتی که در سال 2017 موفق به شکست انسان در بازی دو نفره No Limit Hold’em شده بود و همچنین الگوریتم و کد های توسعه یافته دیگر که در سایت Tuamos Sandholm دانشگاه Carnegie Mellon ساخته شده است. به طور خاص ، Pluribus یک الگوریتم جستجوی آنلاین جدید را در خود جای داده است که می تواند انتخاب های خود را با یافتن چند حرکت زود تر و نه تنها تا پایان بازی ، ارزیابی کند. 

Pluribus همچنین برای بازی هایی با اطلاعات پنهان از الگوریتم های جدید و سریعتر استفاده می کند. درمجموع ، این پیشرفت ها باعث می شود Pluribus را با استفاده از قدرت پردازش و حافظه بسیار کم – معادل کمتر از 150 دلار از منابع محاسبات ابری – آموزش داده شود. در حالی که برای سایر پروژه های هوش مصنوعی ، حدود 1 میلیون دلار ارزش منابع محاسباتی برای آموزش لازم است.

درک طرح استراتژی Pluribus

سته اصلی استراتژی Pluribus از طریق بازی خود محاسبه می شود ، که در آن ربات‌‌ ، با نسخه هایی از خودش بازی می کند ، بدون اینکه از داده های گیم پلی انسانی استفاده شود. هوش مصنوعی از ابتدا با بازی تصادفی شروع می شود و به تدریج بهبود می یابد زیرا تعیین می کند کدام یک از اقدامات ، و توزیع احتمال در این اقدامات ، منجر به نتایج بهتری در برابر نسخه های قبلی استراتژی خود می شود. نسخه آزمون خطا استفاده شده در Pluribus یک نوع بهبود یافته از الگوریتم تکراری مونت کارلو CFR (MCCFR) است.

MCCFR در هر تکرار از الگوریتم ، یک بازیکن را به عنوان “گذر” معرفی می کند که استراتژی فعلی آن در مورد تکرار به روز می شود. در شروع تکرار ، MCCFR یک دست پوکر را براساس استراتژی فعلی همه بازیکنان (که در ابتدا کاملاً تصادفی است) شبیه سازی می کند. پس از اتمام دست شبیه سازی شده ، الگوریتم هر تصمیمی را که گذر گرفته است بررسی می کند و بررسی می کند که با انتخاب سایر اقدامات موجود ، به جای آن ، چه کاری بهتر یا بدتر می توانست انجام دهد. در مرحله بعد ، هوش مصنوعی شایستگی های هر تصمیم فرضی را که می توانست به دنبال اقدامات دیگر موجود در نظر گرفته شود ، ارزیابی می کند

تست ربات‌‌ ها در مقابل نوابغ !

فهم سایر نتایج فرضی امکان پذیر است زیرا هوش مصنوعی در برابر نسخه هایی از خود بازی می کند. اگر هوش مصنوعی می خواهد بداند که درصورت اقدامات دیگر، چه اتفاقی می افتد ، فقط باید از خود بپرسید که چگونه به متغیرهای دیگر پاسخ می داد.

ارزیابی دقیق تر عملکرد Pluribus در برابر بازیکنان حرفه ای را در برابر گروهی از نوابغ صنعت پوکر امتحان کردیم. گروه بازیکنان شامل

Chris “Jesus” Ferguson (the 2000 World Series of Poker Main Event champion)

 Greg Merson (the 2012 World Series of Poker Main Event champion)

 Darren Elias (four-time World Poker Tour champion)

Jimmy Chou

Seth Davies

Michael Gagliano

Anthony Gregg

Dong Kim

Jason Les

Linus Loeliger

Daniel McAulay

Nick Petrangelo

Sean Ruane

Trevor Savage

Trevor Savage

Jake Toole

هر یک از این بازیکنان در دوران حرفه ای خود حداقل 1 میلیون دلار و بسیاری تا 10 میلیون دلار برنده شدند.

همچنین ممکن است دوست داشته باشید

دیدگاهی بنویسید