تعادل نش. نظریه بازی برای اقتصاددانان (جان نش)

2024 نویسنده: Henry Conors | [email protected]. آخرین اصلاح شده: 2024-02-12 06:39

در دهه 1930، جان فون نویمان و اسکار مورگنسترن بنیانگذاران شاخه جدید و جالبی از ریاضیات به نام "نظریه بازی" شدند. در دهه 1950، جان نش، ریاضیدان جوان به این سمت علاقه مند شد. نظریه تعادل موضوع پایان نامه او شد که در 21 سالگی آن را نوشت. بنابراین یک استراتژی بازی جدید به نام "تعادل نش" متولد شد که سال ها بعد جایزه نوبل را دریافت کرد - در سال 1994.

فاصله طولانی بین نوشتن پایان نامه و شناخت عمومی به آزمونی برای یک ریاضیدان تبدیل شده است. نابغه بدون شناخت منجر به اختلالات روانی جدی شد، اما جان نش به لطف ذهن منطقی عالی خود توانست این مشکل را حل کند. نظریه تعادل نش او برنده جایزه نوبل شد و زندگی او در ذهن زیبا فیلمبرداری شد.

مختصر درباره تئوری بازی

از آنجایی که تئوری تعادل نش رفتار افراد را در شرایط تعامل توضیح می دهد، ارزش توجه به مفاهیم اساسی نظریه بازی را دارد.

تئوری بازی رفتار شرکت کنندگان (کارگزاران) را از نظر تعامل با یکدیگر مانند یک بازی مطالعه می کند، زمانی که نتیجه به تصمیم و رفتار چند نفر بستگی دارد.شرکت کننده بر اساس پیش بینی های خود در مورد رفتار دیگران تصمیم می گیرد که به آن استراتژی بازی می گویند.

همچنین یک استراتژی غالب وجود دارد که در آن شرکت کننده بهترین نتیجه را برای هر رفتار سایر شرکت کنندگان می گیرد. این بهترین استراتژی برد-برد بازیکن است.

معضل زندانی و پیشرفت علمی

معمای زندانی موردی از بازی است که در آن شرکت کنندگان مجبور می شوند در مواجهه با تضاد گزینه ها، تصمیمات منطقی بگیرند و به یک هدف مشترک دست یابند. سوال این است که او با درک منافع شخصی و عمومی و همچنین عدم امکان دستیابی به هر دو، کدام یک از این گزینه ها را انتخاب خواهد کرد. به نظر می رسد که بازیکنان در یک محیط بازی سخت زندانی شده اند، که گاهی باعث می شود آنها بسیار سازنده فکر کنند.

این معضل توسط ریاضیدان آمریکایی جان نش بررسی شد. تعادلی که او ایجاد کرد در نوع خود انقلابی بود. این تفکر جدید به‌ویژه بر عقیده اقتصاددانان در مورد نحوه انتخاب بازیگران بازار با در نظر گرفتن منافع دیگران، با تعامل نزدیک و تلاقی منافع تأثیر گذاشت.

بهتر است تئوری بازی ها را از طریق مثال های عینی مطالعه کنید، زیرا این رشته ریاضی به خودی خود کاملاً نظری نیست.

مثال معضل زندانی

مثال دو نفر دست به سرقت زدند، به دست پلیس افتادند و در سلول های جداگانه بازجویی می شوند. در عین حال، افسران پلیس به هر یک از شرکت‌کنندگان شرایط مساعدی را پیشنهاد می‌کنند که در صورت شهادت علیه شریک زندگی‌اش آزاد می‌شوند. هر کدام ازمجرمان مجموعه ای از استراتژی ها را دارند که او در نظر خواهد گرفت:

هر دو همزمان شهادت می دهند و 2.5 سال زندان می گیرند.
هر دو به طور همزمان سکوت می کنند و هر کدام یک سال مهلت می گیرند، زیرا در این صورت مدارک مجرمیت آنها اندک خواهد بود.
یکی شهادت می دهد و آزاد می شود و دیگری سکوت می کند و به 5 سال زندان محکوم می شود.

بدیهی است که نتیجه پرونده به تصمیم هر دو شرکت کننده بستگی دارد، اما آنها نمی توانند توافق کنند، زیرا در سلول های مختلف نشسته اند. تضاد منافع شخصی آنها در مبارزه برای منافع مشترک نیز به وضوح قابل مشاهده است. هر یک از زندانیان دو گزینه برای اقدام و 4 گزینه برای نتیجه دارند.

زنجیره استنتاج های منطقی

بنابراین، مجرم A گزینه های زیر را در نظر گرفته است:

من ساکت هستم و شریک زندگیم ساکت است - هر دو به یک سال زندان محکوم می شویم.
من شریکم را تحویل می دهم و او مرا تحویل می دهد - هر دوی ما 2.5 سال زندان می گیریم.
من ساکتم و شریک زندگیم به من خیانت می کند - ۵ سال زندان می گیرم و او آزاد می شود.
من شریکم را تحویل می دهم اما او سکوت می کند - من آزادی می گیرم و او 5 سال زندان می گیرد.

بیایید ماتریسی از راه حل ها و نتایج ممکن را برای وضوح ارائه دهیم.

جدول نتایج احتمالی معضل زندانی.

سوال این است که هر شرکت کننده چه چیزی را انتخاب می کند؟

"ساکت باش، نمی توانی صحبت کنی" یا "تو نمی توانی سکوت کنی، نمی توانی حرف بزنی"

برای درک انتخاب شرکت کننده، باید از زنجیره افکار او عبور کنید. با توجه به استدلال مجرم الف: اگر من سکوت کنم و شریک زندگیم سکوت کند حداقل مدت (1 سال) به ما تعلق می گیرد.نمی دانم چگونه رفتار خواهد کرد. اگر علیه من شهادت داد، بهتر است شهادت بدهم وگرنه می توانم 5 سال بنشینم. ترجیح می دهم 2.5 سال بنشینم تا 5 سال. اگر او سکوت کند، من بیشتر به شهادت نیاز دارم، زیرا از این طریق آزادی خود را به دست خواهم آورد. شرکت‌کننده B.

سخت نیست که ببینیم استراتژی غالب برای هر یک از مجرمان شهادت دادن است. نقطه مطلوب این بازی زمانی است که هر دو جنایتکار شهادت می دهند و "جایزه" خود را دریافت می کنند - 2.5 سال زندان. نظریه بازی نش این را تعادل می نامد.

محلول Nash بهینه غیربهینه

ماهیت انقلابی دیدگاه نشیان این است که چنین تعادلی هنگام در نظر گرفتن فرد شرکت کننده و منافع شخصی او مطلوب نیست. بالاخره بهترین گزینه سکوت و رهایی است.

تعادل نش نقطه همگرایی منافع است، که در آن هر شرکت کننده تنها در صورتی گزینه ای را که برای او بهینه است انتخاب می کند.

با در نظر گرفتن گزینه ای که هر دو مجرم ساکت هستند و فقط 1 سال دریافت می کنند، می توانیم آن را گزینه پارتو بهینه بنامیم. با این حال، تنها در صورتی امکان پذیر است که مجرمان بتوانند از قبل توافق کنند. اما حتی این نیز این نتیجه را تضمین نمی کند، زیرا وسوسه عقب نشینی از توافق و اجتناب از مجازات بسیار زیاد است. عدم اعتماد کامل به یکدیگر و خطر 5 سال گرفتن مجبور به انتخاب گزینه با شناخت است. در مورد آنچه شرکت کنندگان به آن پایبند هستند فکر کنیدگزینه با سکوت، بازیگری در کنسرت، به سادگی غیرمنطقی است. اگر تعادل نش را مطالعه کنیم می‌توان چنین نتیجه‌ای گرفت. مثال‌ها فقط حق شما را ثابت می‌کند.

خودخواه یا منطقی

نظریه تعادل نش نتایج شگفت انگیزی به دست آورد که اصولی را که قبلا وجود داشت رد کرد. به عنوان مثال، آدام اسمیت رفتار هر یک از شرکت کنندگان را کاملاً خودخواهانه در نظر گرفت که سیستم را به تعادل رساند. این نظریه "دست نامرئی بازار" نامیده شد.

جان نش دید که اگر همه شرکت کنندگان در راستای منافع خود عمل کنند، این هرگز منجر به نتیجه مطلوب گروهی نخواهد شد. با توجه به اینکه تفکر منطقی در هر شرکت کننده ذاتی است، انتخاب پیشنهادی توسط استراتژی تعادل نش محتمل تر است.

آزمایش کاملاً مردانه

یک مثال بارز، بازی پارادوکس بلوند است، که اگرچه به ظاهر نابجاست، اما تصویر واضحی از نحوه عملکرد نظریه بازی نش است.

در این بازی باید تصور کنید که یک گروه از بچه های رایگان به یک بار آمدند. در همین حوالی گروهی از دختران وجود دارد که مثلاً یک بلوند یکی از آنها بر دیگران ارجحیت دارد. پسرها چگونه برای به دست آوردن بهترین دوست دختر برای خود عمل می کنند؟

بنابراین، استدلال بچه ها: اگر همه شروع به آشنایی با بلوند کنند، به احتمال زیاد، هیچ کس آن را نخواهد گرفت، پس دوستان او نمی خواهند با آنها آشنا شوند. هیچ‌کس نمی‌خواهد که بک دوم باشد. اما اگر پسرها تصمیم بگیرند که اجتناب کنندبلوند، پس احتمال اینکه هر یک از پسرها یک دوست دختر خوب در بین دخترها پیدا کنند، زیاد است.

وضعیت تعادل نش برای پسرها بهینه نیست، زیرا هر کس فقط به دنبال منافع خودخواهانه خود، بلوند را انتخاب می کند. مشاهده می شود که تنها دنبال کردن منافع خودخواهانه، مساوی با فروپاشی منافع گروهی خواهد بود. تعادل نش به این معنی است که هر مرد در راستای منافع خود عمل می کند که با منافع کل گروه در ارتباط است. این بهترین گزینه برای همه شخصا نیست، اما بهترین گزینه برای همه است، بر اساس استراتژی کلی برای موفقیت.

تمام زندگی ما یک بازی است

تصمیم گیری در دنیای واقعی بسیار شبیه یک بازی است که در آن انتظار رفتارهای منطقی خاصی از سایر شرکت کنندگان نیز دارید. در تجارت، در محل کار، در یک تیم، در یک شرکت و حتی در روابط با جنس مخالف. از معاملات بزرگ گرفته تا موقعیت های معمولی زندگی، همه چیز از یک قانون یا قانون دیگر پیروی می کند.

البته، موقعیت های بازی فوق با مجرمان و یک نوار فقط تصاویر عالی هستند که تعادل نش را نشان می دهند. نمونه‌هایی از این دوراهی‌ها اغلب در بازار واقعی به وجود می‌آیند، و این به ویژه در مواردی که دو انحصارگر بازار را کنترل می‌کنند، کار می‌کند.

راهبردهای ترکیبی

اغلب ما در یک بازی نه، بلکه در چندین بازی درگیر می شویم. انتخاب یکی از گزینه ها در یک بازی، با هدایت یک استراتژی منطقی، اما در نهایت به بازی دیگری می رسید. پس از چند تصمیم منطقی، ممکن است متوجه شوید که نتیجه شما مورد پسند شما نیست. چیبگیرم؟

بیایید دو نوع استراتژی را در نظر بگیریم:

استراتژی خالص رفتار شرکت کننده است که از فکر کردن درباره رفتار احتمالی سایر شرکت کنندگان ناشی می شود.
استراتژی مختلط یا استراتژی تصادفی، تناوب استراتژی های خالص به صورت تصادفی یا انتخاب یک استراتژی خالص با احتمال معین است. به این استراتژی تصادفی نیز می گویند.

با توجه به این رفتار، نگاه جدیدی به تعادل نش داریم. اگر قبلا گفته می شد که بازیکن یک بار استراتژی را انتخاب می کند، می توان رفتار دیگری را تصور کرد. می توان فرض کرد که بازیکنان یک استراتژی را به طور تصادفی با احتمال خاصی انتخاب می کنند. بازی‌هایی که نمی‌توانند تعادل نش را در استراتژی‌های خالص پیدا کنند، همیشه در استراتژی‌های ترکیبی هستند.

تعادل نش در استراتژی های مختلط را تعادل مختلط می گویند. این تعادلی است که در آن هر شرکت‌کننده فرکانس بهینه انتخاب استراتژی‌های خود را انتخاب می‌کند، مشروط بر اینکه سایر شرکت‌کنندگان استراتژی‌های خود را با فرکانس معین انتخاب کنند.

پنالتی و استراتژی مختلط

نمونه ای از یک استراتژی ترکیبی را می توان در بازی فوتبال یافت. بهترین مثال از یک استراتژی ترکیبی شاید ضربات پنالتی باشد. بنابراین، ما یک دروازه بان داریم که فقط می تواند به یک گوشه بپرد، و یک بازیکن که پنالتی را می زند.

بنابراین، اگر بار اول بازیکن استراتژی شوت به گوشه چپ را انتخاب کند، و دروازه بان نیز در این گوشه بیفتد و توپ را بگیرد، چگونه می تواند برای بار دوم پیشرفت کند؟ اگر بازیکندر گوشه مخالف ضربه خواهد زد، این به احتمال زیاد خیلی واضح است، اما ضربه زدن در همان گوشه کمتر آشکار نیست. بنابراین، هم دروازه بان و هم ضربه زن، چاره ای جز تکیه بر انتخاب تصادفی ندارند.

بنابراین، با تناوب انتخاب تصادفی با یک استراتژی ناب خاص، بازیکن و دروازه بان سعی می کنند حداکثر نتیجه را به دست آورند.