, ,

کتاب مباحث پیشرفته در طراحی الگوریتم‌های یادگیری تقویتی چندعامله

تومان249,950

انتخاب پلن

torobpay
هر قسط با ترب‌پی: تومان62,488
۴ قسط ماهانه. بدون سود، چک و ضامن.

📚 محتوای این محصول آموزشی (پکیج کامل)

💡 این محصول یک نسخهٔ کامل و جامع است

تمامی محتوای آموزشی این کتاب در قالب یک بسته‌ی کامل و یکپارچه ارائه می‌شود و شامل تمام نسخه‌ها و فایل‌های موردنیاز برای یادگیری است.

🎁 محتویات کامل بسته دانلودی

🎯 این بسته یک دورهٔ آموزشی کامل و چندلایه است؛ شامل کتاب‌ها، تمرین‌ها و خودآزمایی .


ℹ️ نکات مهم هنگام خرید

  • این محصول به صورت فایل دانلودی کامل ارائه می‌شود و نسخهٔ چاپی ندارد.
  • توجه: لینک‌های اختصاصی دوره طی حداکثر 24 ساعت پس از ثبت سفارش ارسال می‌شوند.
  • دقت کنید لینک ها به شماره موبایل شما ارسال می شوند. پس در ارائه شماره موبایل صحیح دقت کنید.
  • برای راهنمایی در مورد نحوه دانلود به شماره 09395106248 پیامک دهید یا تماس بگیرید. (ایده آل ترین گزینه ارسال پیام در یکی از پیام رسان ها به همین شماره است تا سریعا لینک های کتاب همانجا برای شما ارسال گردد.)
  • اگر پرداخت انجام شده ولی بعد از 24 ساعت هنوز لینک‌ها را دریافت نکرده‌اید، نام و نام خانوادگی و نام محصول را پیامک کنید تا لینک‌ها دوباره ارسال شوند.

💬 راه‌های ارتباطی پشتیبانی:
واتس‌اپ یا هر پیام رسان داخلی یا پیامک: 09395106248
تلگرام: @ma_limbs

📚 کتاب آموزشی جامع

📚 اطلاعات کتاب

عنوان کتاب: کتاب مباحث پیشرفته در طراحی الگوریتم‌های یادگیری تقویتی چندعامله

موضوع کلی: یادگیری تقویتی چندعامله (MARL)

موضوع میانی: الگوریتم‌های MARL

📋 سرفصل‌های کتاب (100 موضوع)

  • 1. مقدمات یادگیری تقویتی چندعامله
  • 2. مبانی یادگیری تقویتی
  • 3. مبانی یادگیری ماشین
  • 4. مبانی نظریه بازی‌ها
  • 5. مبانی هوش مصنوعی
  • 6. مقدمه بر عامل‌های هوشمند
  • 7. مفهوم محیط و عامل
  • 8. تابع پاداش
  • 9. تابع ارزش
  • 10. استراتژی (سیاست)
  • 11. فرآیندهای تصمیم‌گیری مارکوف (MDP)
  • 12. مدل‌های خطی مارکوف (LDP)
  • 13. فرآیندهای تصمیم‌گیری نیمه مارکوف (Semi-MDP)
  • 14. حالات و عملگرهای ناپیوسته
  • 15. حالات و عملگرهای پیوسته
  • 16. فضاهای حالت با ابعاد بالا
  • 17. فضاهای عمل با ابعاد بالا
  • 18. محیط‌های پویا
  • 19. محیط‌های ایستا
  • 20. محیط‌های نیمه پویا
  • 21. محیط‌های تصادفی
  • 22. محیط‌های قطعی
  • 23. یادگیری تقویتی تک عامله
  • 24. روش‌های ارزش‌گذاری
  • 25. یادگیری مبتنی بر جدول (Tabular Methods)
  • 26. Q-Learning
  • 27. SARSA
  • 28. Deep Q-Networks (DQN)
  • 29. Double DQN
  • 30. Dueling DQN
  • 31. Prioritized Experience Replay
  • 32. Rainbow DQN
  • 33. روش‌های مبتنی بر مدل (Model-Based Methods)
  • 34. Dynamic Programming
  • 35. Value Iteration
  • 36. Policy Iteration
  • 37. Model Learning
  • 38. Model Predictive Control (MPC)
  • 39. روش‌های مبتنی بر گرادیان سیاست (Policy Gradient Methods)
  • 40. REINFORCE
  • 41. Actor-Critic Methods
  • 42. A2C (Advantage Actor-Critic)
  • 43. A3C (Asynchronous Advantage Actor-Critic)
  • 44. TRPO (Trust Region Policy Optimization)
  • 45. PPO (Proximal Policy Optimization)
  • 46. SAC (Soft Actor-Critic)
  • 47. DDPG (Deep Deterministic Policy Gradient)
  • 48. TD3 (Twin Delayed Deep Deterministic Policy Gradient)
  • 49. یادگیری تقویتی چندعامله (MARL)
  • 50. چالش‌های MARL
  • 51. همکاری (Cooperation)
  • 52. رقابت (Competition)
  • 53. مختلط (Mixed)
  • 54. حالت‌های مشترک (Joint States)
  • 55. عمل‌های مشترک (Joint Actions)
  • 56. پاداش‌های مشترک (Joint Rewards)
  • 57. پاداش‌های مجزا (Individual Rewards)
  • 58. فضای حالت مشترک (Joint State Space)
  • 59. فضای عمل مشترک (Joint Action Space)
  • 60. هم‌تکامل (Co-evolution)
  • 61. تکامل مشترک (Joint Evolution)
  • 62. یادگیری سیاست‌های مشترک (Joint Policy Learning)
  • 63. یادگیری سیاست‌های مجزا (Individual Policy Learning)
  • 64. توازن نش (Nash Equilibrium)
  • 65. توازن کورنو (Cournot Equilibrium)
  • 66. توازن استاکلبرگ (Stackelberg Equilibrium)
  • 67. توازن هابرت (Hubert Equilibrium)
  • 68. توازن کامل (Perfect Equilibrium)
  • 69. توازن زیربازی کامل (Subgame Perfect Equilibrium)
  • 70. توازن بیز (Bayesian Equilibrium)
  • 71. توازن بتای تطبیقی (Adaptive Beta Equilibrium)
  • 72. توازن بتا (Beta Equilibrium)
  • 73. توازن آلفا (Alpha Equilibrium)
  • 74. توازن گاما (Gamma Equilibrium)
  • 75. توازن دلتا (Delta Equilibrium)
  • 76. توازن اپسیلون (Epsilon Equilibrium)
  • 77. توازن موکد (Strong Equilibrium)
  • 78. توازن ضعیف (Weak Equilibrium)
  • 79. توازن ناپایدار (Unstable Equilibrium)
  • 80. توازن پایدار (Stable Equilibrium)
  • 81. توازن محلی (Local Equilibrium)
  • 82. توازن سراسری (Global Equilibrium)
  • 83. توازن خودسازگار (Self-Adaptive Equilibrium)
  • 84. توازن تطبیقی (Adaptive Equilibrium)
  • 85. توازن متغیر (Variable Equilibrium)
  • 86. توازن پویا (Dynamic Equilibrium)
  • 87. توازن ایستا (Static Equilibrium)
  • 88. توازن استوار (Robust Equilibrium)
  • 89. توازن تصادفی (Stochastic Equilibrium)
  • 90. توازن قطعی (Deterministic Equilibrium)
  • 91. توازن با عدم قطعیت (Equilibrium under Uncertainty)
  • 92. توازن با اطلاعات ناقص (Equilibrium with Incomplete Information)
  • 93. توازن با اطلاعات نامتقارن (Equilibrium with Asymmetric Information)
  • 94. توازن با اطلاعات کامل (Equilibrium with Complete Information)
  • 95. توازن با اطلاعات محدود (Equilibrium with Limited Information)
  • 96. توازن با اطلاعات نامحدود (Equilibrium with Unlimited Information)
  • 97. توازن با اطلاعات شخصی (Equilibrium with Personal Information)
  • 98. توازن با اطلاعات گروهی (Equilibrium with Group Information)
  • 99. توازن با اطلاعات عمومی (Equilibrium with Public Information)
  • 100. توازن با اطلاعات خصوصی (Equilibrium with Private Information)

📚 محتوای این محصول آموزشی (پکیج کامل)

💡 این محصول یک نسخهٔ کامل و جامع است

تمامی محتوای آموزشی این کتاب در قالب یک بسته‌ی کامل و یکپارچه ارائه می‌شود و شامل تمام نسخه‌ها و فایل‌های موردنیاز برای یادگیری است.

🎁 محتویات کامل بسته دانلودی

🎯 این بسته یک دورهٔ آموزشی کامل و چندلایه است؛ شامل کتاب‌ها، تمرین‌ها و خودآزمایی .


ℹ️ نکات مهم هنگام خرید

  • این محصول به صورت فایل دانلودی کامل ارائه می‌شود و نسخهٔ چاپی ندارد.
  • توجه: لینک‌های اختصاصی دوره طی حداکثر 24 ساعت پس از ثبت سفارش ارسال می‌شوند.
  • دقت کنید لینک ها به شماره موبایل شما ارسال می شوند. پس در ارائه شماره موبایل صحیح دقت کنید.
  • برای راهنمایی در مورد نحوه دانلود به شماره 09395106248 پیامک دهید یا تماس بگیرید. (ایده آل ترین گزینه ارسال پیام در یکی از پیام رسان ها به همین شماره است تا سریعا لینک های کتاب همانجا برای شما ارسال گردد.)
  • اگر پرداخت انجام شده ولی بعد از 24 ساعت هنوز لینک‌ها را دریافت نکرده‌اید، نام و نام خانوادگی و نام محصول را پیامک کنید تا لینک‌ها دوباره ارسال شوند.

💬 راه‌های ارتباطی پشتیبانی:
واتس‌اپ یا هر پیام رسان داخلی یا پیامک: 09395106248
تلگرام: @ma_limbs

دیدگاهها

هیچ دیدگاهی برای این محصول نوشته نشده است.

اولین نفری باشید که دیدگاهی را ارسال می کنید برای “کتاب مباحث پیشرفته در طراحی الگوریتم‌های یادگیری تقویتی چندعامله”

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *

پیمایش به بالا