تئوری بازی ها (هوش مصنوعی) (pptx) 45 اسلاید
دسته بندی : پاورپوینت
نوع فایل : PowerPoint (.pptx) ( قابل ویرایش و آماده پرینت )
تعداد اسلاید: 45 اسلاید
قسمتی از متن PowerPoint (.pptx) :
تئوری بازی
ها
(هوش
مصنوعی)
تئوري
بازي
ها
Game Theory
فصل
ششم:
تئوري
بازيها
–
جستجوهاي
رقابتي
بازي
ها
چه هستند
و چرا مطالعه
ميشوند
؟
هر عامل
نياز
به در نظر گرفتن
ساير
عاملها و
چگونگي
تأثير
آنها دارد
تمايز
بين
محيطهاي
چند عامل
رقابتي
و همکار
محيطهاي
رقابتي
، که در آنها اهداف عاملها با
يکديگر
برخورد
دارند، منجر به مسئله
هاي
رقابتي
ميشود
که به عنوان
بازي
شناخته
ميشوند
بازي
ها:
حالتي
از
محيطهاي
چند
عاملي
را نشان
مي
دهند که:
فصل
ششم:
تئوري
بازيها
–
ادامه
قابليتهاي
هوشمندي
انسانها را به کار
ميگيرند
ماهيت
انتزاعي
بازي
ها
حالت
بازي
را به
راحتي
ميتوان
نمايش
داد و عاملها معمولا به مجموعه
کوچکي
از
فعاليتها
محدود هستند که
نتايج
آنها با
قوانين
دقيقي
تعريف
شده
اند
و چرا
بازي
ها مطالعه
مي
شوند
:
بازي شطرنج کامپيوتري اثباتي بر وجود ماشيني است که اعمال هوشمندانهاي را انجام ميدهند.
سادگي قوانين
وضعيت دنيا کاملاً براي برنامه شناخته شده است
. (
بازنمايي بازي به عنوان يک جستجو از طريق فضاي موقعيت
هاي ممکن بازي، ساده است
.)
به عنوان مثال:
دلايلي
که
محققين قديم
،
شطرنج را
بهعنوان
موضوعي
در
AI
برگزيدند
:
عدم
قطعيت
به علت وجود اطلاعات گم شده رخ نميدهد،
بلکه
به علت اينکه فرد زماني براي محاسبه دقيق نتايج حرکت ندارد عدم قطعيت بوجود ميآيد
.
پيچيدگي بازي
ها،
به طور کامل نوعي از عدم قطعيت را معرفي ميکنند.
در
اين
مورد، فرد بر اساس
تجربيات
گذشته
ميتواند
بهترين
حدس را بزند.
فصل
ششم:
تئوري
بازيها
–
ادامه
يک
نمونه
بازي
-
يک بازي با
دو بازيکن
را در نظر ميگيريم که آن را
MIN-MAX
ميناميم.
-
بدين
معناست که هر
يک
از
بازيکن
ها ، حرکت خود را در جهت
افزايش
برد خود (
max
) و
نيز
در جهت کاهش برد
حريف
(
min
) انجام
مي
دهد.
- پس
هميشه
حرکت با
max
است. قبل از حرکت
گرافي
از
ديد
بازيکن
max
رسم
مي
شود که بتواند
بهترين
حرکت را انتخاب کند:
حالت اوليه:
موقعيت
صفحه و
شناسايي
حرکت مجاز
عملگرها
:
ليستي
از
(حالت,حرکت)
که معرف
يک
حرکت معتبر است
آزمون هدف:
پايان
بازي
چه موقع است؟ (
حالتهاي
پايانه
)
تابع
سودمندي
:
براي
هر
حالت
پايانه
يک
مقدار
عددي
را ارائه
ميکند
.
مثلاً:
برنده
(1+)
و بازنده
(1-)
و
مساوي
(0)
بازي
به عنوان
يک
جستجو:
فصل
ششم:
تئوري
بازيها
–
بازي
Minimax
مثال :
بازيکن
:
انتخاب
بهترين
حالت
حريف
:
انتخاب
بهترين
موقعيت
براي
خودش
يا
بدترين
وضعيت
براي
بازيکن
حالت اوليه و حرکات معتبر
براي
هر
بازيکن
، درخت
بازي
را
براي
آن
بازي
ايجاد
ميکند
فصل
ششم:
تئوري
بازيها
–
بازي
Minimax
فصل
ششم:
تئوري
بازيها
–
تصميمات
کامل
تصميمات کامل در بازيهاي دونفره(ترسيم درخت بطور کامل):
اگر به آن به عنوان يک مسئله جستجو نگاه شود، جستجو براي دنبالهاي از حرکات که
منتهي به حالت پاياني
ميشد (مطابق با تابع سودمندي)، و سپس پيشروي و ساخت اولين حرکت در دنباله بود.
با توجه به اينکه حرکت
MIN
غيرقابل پيش بيني است
بنابراين
MAX
بايد استراتژياي را بيابد که به يک حالت پاياني برنده بدون توجه به عملکرد
MIN
منجر شود، که اين استراتژي شامل حرکات درست براي
MAX
براي هر حرکت ممکن از
MIN
ميباشد.
فصل
ششم:
تئوري
بازيها
–
الگوريتم
Minimax
الگوريتم
:MIN-MAX
توليد درخت کامل بازي
،
تمام راه تا مراحل پاياني
درخواست تابع سودمندي
براي هر حالت پاياني به منظور بدست آوردن مقدارش.
از سودمندي حالات پاياني به منظور تعيين سودمندي
گرهها يک مرحله بالاتر
در
درخت جستجو استفاده کنيد.
بررسي مقادير را از گرههاي برگي تا ريشه
،
يک لايه در هر لحظه، ادامه دهيد.
احتمالاً مقادير به بالاي درخت ميرسند
،
MAX
حرکتي را انتخاب ميکند که به بالاترين مقدار منتهي ميشود.
به منظور تعيين استراتژي بهينه براي
MAX
طراحي شده است و از اينرو ميتوان
بهترين حرکت
را تصميمگيري کرد. الگوريتم شامل 5 مرحله است:
2
7
1
8
2
7
1
8
2
1
2
7
1
8
2
1
2
2
7
1
8
2
1
This is the move
selected by
min-max
Static evaluator
value
Max
Max
Min
Max
Min
2
فصل
ششم:
تئوري
بازيها
–
الگوريتم
Minimax
مثال:
اگر
:
پيچيدگي
زماني
:
الگوريتم
minimax
،
O(
b
m
)
است.
الگوريتم يک جستجو عمقي است.
کامل
بودن:
بله (اگر درخت محدود باشد
)
پيچيدگي
فضا:
O(
bm
)
m
:
حداکثر عمق درخت
،
b
:
تعداد
حرک
ا
ت قانوني در هر نقطه
،
بهينگي
:
بله
فصل
ششم:
تئوري
بازيها
–
الگوريتم
Minimax