, ,

کتاب یادگیری تقویتی چندعامله با رویکرد تعاونی: از نظریه تا عمل

تومان249,950

انتخاب پلن

torobpay
هر قسط با ترب‌پی: تومان62,488
۴ قسط ماهانه. بدون سود، چک و ضامن.

📚 محتوای این محصول آموزشی (پکیج کامل)

💡 این محصول یک نسخهٔ کامل و جامع است

تمامی محتوای آموزشی این کتاب در قالب یک بسته‌ی کامل و یکپارچه ارائه می‌شود و شامل تمام نسخه‌ها و فایل‌های موردنیاز برای یادگیری است.

🎁 محتویات کامل بسته دانلودی

🎯 این بسته یک دورهٔ آموزشی کامل و چندلایه است؛ شامل کتاب‌ها، تمرین‌ها و خودآزمایی .


ℹ️ نکات مهم هنگام خرید

  • این محصول به صورت فایل دانلودی کامل ارائه می‌شود و نسخهٔ چاپی ندارد.
  • توجه: لینک‌های اختصاصی دوره طی حداکثر 24 ساعت پس از ثبت سفارش ارسال می‌شوند.
  • دقت کنید لینک ها به شماره موبایل شما ارسال می شوند. پس در ارائه شماره موبایل صحیح دقت کنید.
  • برای راهنمایی در مورد نحوه دانلود به شماره 09395106248 پیامک دهید یا تماس بگیرید. (ایده آل ترین گزینه ارسال پیام در یکی از پیام رسان ها به همین شماره است تا سریعا لینک های کتاب همانجا برای شما ارسال گردد.)
  • اگر پرداخت انجام شده ولی بعد از 24 ساعت هنوز لینک‌ها را دریافت نکرده‌اید، نام و نام خانوادگی و نام محصول را پیامک کنید تا لینک‌ها دوباره ارسال شوند.

💬 راه‌های ارتباطی پشتیبانی:
واتس‌اپ یا هر پیام رسان داخلی یا پیامک: 09395106248
تلگرام: @ma_limbs

📚 کتاب آموزشی جامع

📚 اطلاعات کتاب

عنوان کتاب: کتاب یادگیری تقویتی چندعامله با رویکرد تعاونی: از نظریه تا عمل

موضوع کلی: یادگیری تقویتی چندعامله (MARL)

موضوع میانی: همکاری (Cooperative MARL)

📋 سرفصل‌های کتاب (100 موضوع)

  • 1. مقدمه ای بر یادگیری تقویتی چندعامله
  • 2. مفاهیم اساسی یادگیری تقویتی
  • 3. ماموریت های یادگیری تقویتی
  • 4. عامل ها، محیط، حالت، عمل، پاداش
  • 5. فرایند تصمیم گیری مارکوف (MDP)
  • 6. MDP های گسسته و پیوسته
  • 7. مفهوم سیاست
  • 8. سیاست های بهینه
  • 9. تابع ارزش
  • 10. تابع ارزش حالت
  • 11. تابع ارزش عمل-حالت
  • 12. معادلات بلمن
  • 13. تکامل تابع ارزش
  • 14. روش های مبتنی بر ارزش
  • 15. یادگیری Q
  • 16. یادگیری Q ساده
  • 17. یادگیری Q عمیق (DQN)
  • 18. معماری شبکه عصبی برای DQN
  • 19. حافظه بازپخش
  • 20. هدف‌گیری شبکه
  • 21. یادگیری تقویتی بدون مدل
  • 22. یادگیری تقویتی با مدل
  • 23. روش های مبتنی بر سیاست
  • 24. گرادیان سیاست
  • 25. روش Actor-Critic
  • 26. روش Actor-Critic عمیق
  • 27. روش های ترکیبی
  • 28. مقدمه ای بر یادگیری تقویتی چندعامله (MARL)
  • 29. تفاوت های MARL با RL تک عامله
  • 30. چالش های MARL
  • 31. غیر ایستا بودن محیط
  • 32. ناسازگاری داده های آموزشی
  • 33. مسئله هماهنگی
  • 34. مسئله ارتباطات
  • 35. مسئله ناشناختگی عاملهای دیگر
  • 36. رویکردهای کلی در MARL
  • 37. رویکردهای متمرکز
  • 38. رویکردهای غیرمتمرکز
  • 39. رویکردهای ترکیبی (متمرکز-غیرمتمرکز)
  • 40. یادگیری تقویتی تعاونی
  • 41. تعریف یادگیری تقویتی تعا
  • 42. هدف در یادگیری تقویتی تعا
  • 43. پاداش مشترک
  • 44. پاداش تفکیک شده
  • 45. چالش های یادگیری تقویتی تعا
  • 46. هماهنگی در عامل های تعا
  • 47. کشف هماهنگی
  • 48. یادگیری هماهنگی
  • 49. روش های یادگیری تقویتی تعا
  • 50. روش های مبتنی بر ارزش در MARL تعا
  • 51. Q-learning متمرکز
  • 52. Value Decomposition Networks (VDN)
  • 53. QMIX
  • 54. CommNet
  • 55. MADDPG
  • 56. IQL (Independent Q-Learning)
  • 57. I-DQN (Independent Deep Q-Learning)
  • 58. I-AC (Independent Actor-Critic)
  • 59. روش های مبتنی بر سیاست در MARL تعا
  • 60. Policy Gradient متمرکز
  • 61. Policy Gradient غیرمتمرکز
  • 62. روش های مبتنی بر ارتباطات
  • 63. ارتباطات صریح
  • 64. ارتباطات ضمنی
  • 65. یادگیری پروتکل های ارتباطی
  • 66. ارتباطات مبتنی بر پیام
  • 67. ارتباطات مبتنی بر سیگنال
  • 68. روش های مبتنی بر عامل های شبیه سازی شده
  • 69. یادگیری مدل عامل های دیگر
  • 70. پیش بینی رفتار عامل های دیگر
  • 71. استفاده از مدل عامل های دیگر در تصمیم گیری
  • 72. روش های مبتنی بر تفکیک پاداش
  • 73. طراحی توابع پاداش تفکیک شده
  • 74. یادگیری نحوه تفکیک پاداش
  • 75. روش های مبتنی بر ساختار عامل ها
  • 76. یادگیری سلسله مراتبی
  • 77. یادگیری مبتنی بر نقش
  • 78. یادگیری مبتنی بر وظیفه
  • 79. کاربردها و مطالعات موردی MARL تعا
  • 80. بازی ها
  • 81. رباتیک
  • 82. سیستم های خودران
  • 83. مدیریت منابع
  • 84. شبکه های هوشمند
  • 85. شبکه های حسگر
  • 86. سیستم های توزیع شده
  • 87. ملاحظات عملی در پیاده سازی MARL تعا
  • 88. انتخاب معماری مناسب
  • 89. تنظیم هایپرپارامترها
  • 90. تحلیل پایداری
  • 91. قابلیت تعمیم
  • 92. مقیاس پذیری
  • 93. ابزارها و کتابخانه ها
  • 94. TensorFlow Agents
  • 95. PyMARL
  • 96. OpenSpiel
  • 97. RLlib
  • 98. فریم ورک های شبیه سازی
  • 99. پیاده سازی یک مثال عملی
  • 100. آموزش عامل ها در یک محیط تعا

📚 محتوای این محصول آموزشی (پکیج کامل)

💡 این محصول یک نسخهٔ کامل و جامع است

تمامی محتوای آموزشی این کتاب در قالب یک بسته‌ی کامل و یکپارچه ارائه می‌شود و شامل تمام نسخه‌ها و فایل‌های موردنیاز برای یادگیری است.

🎁 محتویات کامل بسته دانلودی

🎯 این بسته یک دورهٔ آموزشی کامل و چندلایه است؛ شامل کتاب‌ها، تمرین‌ها و خودآزمایی .


ℹ️ نکات مهم هنگام خرید

  • این محصول به صورت فایل دانلودی کامل ارائه می‌شود و نسخهٔ چاپی ندارد.
  • توجه: لینک‌های اختصاصی دوره طی حداکثر 24 ساعت پس از ثبت سفارش ارسال می‌شوند.
  • دقت کنید لینک ها به شماره موبایل شما ارسال می شوند. پس در ارائه شماره موبایل صحیح دقت کنید.
  • برای راهنمایی در مورد نحوه دانلود به شماره 09395106248 پیامک دهید یا تماس بگیرید. (ایده آل ترین گزینه ارسال پیام در یکی از پیام رسان ها به همین شماره است تا سریعا لینک های کتاب همانجا برای شما ارسال گردد.)
  • اگر پرداخت انجام شده ولی بعد از 24 ساعت هنوز لینک‌ها را دریافت نکرده‌اید، نام و نام خانوادگی و نام محصول را پیامک کنید تا لینک‌ها دوباره ارسال شوند.

💬 راه‌های ارتباطی پشتیبانی:
واتس‌اپ یا هر پیام رسان داخلی یا پیامک: 09395106248
تلگرام: @ma_limbs

دیدگاهها

هیچ دیدگاهی برای این محصول نوشته نشده است.

اولین نفری باشید که دیدگاهی را ارسال می کنید برای “کتاب یادگیری تقویتی چندعامله با رویکرد تعاونی: از نظریه تا عمل”

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *

پیمایش به بالا