هوش مصنوعی گوگل با توانایی یادگیری شطرنج و پک من

هوش مصنوعی که توسط گوگل توسعه پیدا کرده است MuZero نام دارد که توانایی دارد به بازی هایی که قانون محور هستند ورود کند. ویژگی جدید این کار این است که می تواند به طور همزمان دو نوع بازی متفاوت را انجام دهد.

هوش مصنوعی در بازی شطرنج موفق شده است که انسان را شکست دهد. بازی شطرنج اگر چه یک بازی است با بی شمار ترکیب احتمالی از بازی های مختلف، اما به دلیل اینکه تمامی حالت ها قابل پیش بینی هستند به یک بازی تبدیل شده است که کاملا بر اساس بازی طرف مقابل می توان بازی کرد. دلیل آن هم این است که این بازی از قوانین خاصی تبعیت می کند.

اما خیلی از بازی های دیگر ممکن است که این ویژگی بازی شطرنج را نداشته باشند. اگر که تجربه بازی پک من را داشته باشید این نکته را تایید می کنید که محاسبه انواع حالت های ممکن با توجه به انواع گزینه هایی که در این بازی وجود دارد سرسام آور است. تاکنون بارها از هوش مصنوعی برای بازی پک من استفاده شده است اما در آنها از روش های متفاوتی نسبت به بازی شطرنج استفاده می شود. کاری که اخیرا گوگل انجام داده است ایجاد یک هوش مصنوعی است که همزمان می تواند هر دو نوع بازی انجام دهد و نتایج خوبی هم به دست آورد.

اعمال درخت‌ها

هوش مصنوعی در بازی شطرنج ار قانون درختی تبعیت می کند به این معنی در هر حرکت تمامی حالت های بعدی را بر اساس قوانین بازی پیش بینی می کند این الگوریتم خیلی زمان بر و هزینه زیادی هم دارد اما با این حال برای تعیین حرکت خود تمامی حالت ها را پیش بینی کند.

در بازی های دیگر لزومی به پیش بینی حالت های بعدی نیست و یا در بعضی موارد اصلا امکان انجام آن نیست و بنابراین نمی توان روی حالت های مختلف ممکن بررسی را انجام داد بلکه فقط باید در هر لحظه وضعیت بازی را بررسی کرد و بر اساس آن واکنش مناسبی را نشان داد و اصلا قابلیت مدل سازی ندارد.

در هوش مصنوعی جدید MuZero بخشی از این سیستم برگرفته از سیستم آلفا زیرو است و از آن یادگیری حاصل شده است با این تفاوت که نسبت یه آن قوی تر است و هوشمندانه تر عمل می کند و قابلیت یادگیری تقویتی دارد. بنابراین به این گونه عمل می کند که بر اساس آن چیزی که در بازی می بیند روی مدلسازی وضعیت بازی عمل می کند و بنابراین از انعطاف بسیار بالایی برخوردار است. ویژگی جالب این سیستم این است که متوجه می شود که چه زمانی از اطلاعات مدل برای تصمیم گیری استفاده کند

پیش‌بینی‌ها

در هوش مصنوعی موزیرو پیش بینی ها بر اساس برآورد تمامی حالت های ممکن انجام نمی شود بلکه بر اساس بررسی وضعیت موجود و وضعیت بازی در نتیجه‌ی حرکت انجام می شود. بر این اساس انعطاف پذیری و سرعت در پردازش بسیار بالاتر می رود

به طور کلی الگوریتم موزیرو بر اساس این 3 مرحله کار انجام می دهد: اول اینکه حرکت بعدی را با توجه به وضعیت فعلی بازی تعیین می کند مرحله دوم پیش بینی نتیجه انجام این حرکت و پیامدهای آن است و مرحله سوم ارزیابی تجربه های قبلی و استفاده از یادگیری های صورت تاکنون در این زمینه در جهت حداکثر سازی نتیجه حاصل است.

موزیرو علاوه بر شطرنج در بازی آتاری هم بر انسان به برتری رسیده است. درحالیکه تا قبل از موزیرو این امر محقق نشده بود. موزیرو بر اساس تست های انجام شده در بین 57 بازی موفق شده است که در 42بازی نتیجه بالاتر از متوسطی را کسب کند. بنابراین موزیرو موفق شده است هم در بازی هم رقابتی نتیجه خوبی را به دست آورد و هم در بازی های قانون محور مثل شطرنج. این نتیجه ما را به پیچیدگی های بالایی که هوش مصنوعی می تواند داشته باشد می رساند و نتایج خارق العاده ای که می توان از آن انتظار داشت. تا پیش از این استفاده از هوش مصنوعی در این حد بود که بتوان با آن عکس یک گربه را از میان عکس ها پیدا کند. اما الان هوش مصنوعی می تواند قابلیت های مهمی نظیر انتخاب، حرکت و پیش بینی رفتارهای بعدی را داشته باشد.

به نظر شما این مطلب چه اندازه مفید بود؟

میانگین امتیازات ۵ از ۵

از مجموع ۱ رای

Post Views: 100