, ,

کتاب پرورش عامل‌های هوشمند با MADDPG: رویکردی قطعی و عمیق

تومان249,950

انتخاب پلن

torobpay
هر قسط با ترب‌پی: تومان62,488
۴ قسط ماهانه. بدون سود، چک و ضامن.

📚 محتوای این محصول آموزشی (پکیج کامل)

💡 این محصول یک نسخهٔ کامل و جامع است

تمامی محتوای آموزشی این کتاب در قالب یک بسته‌ی کامل و یکپارچه ارائه می‌شود و شامل تمام نسخه‌ها و فایل‌های موردنیاز برای یادگیری است.

🎁 محتویات کامل بسته دانلودی

🎯 این بسته یک دورهٔ آموزشی کامل و چندلایه است؛ شامل کتاب‌ها، تمرین‌ها و خودآزمایی .


ℹ️ نکات مهم هنگام خرید

  • این محصول به صورت فایل دانلودی کامل ارائه می‌شود و نسخهٔ چاپی ندارد.
  • توجه: لینک‌های اختصاصی دوره طی حداکثر 24 ساعت پس از ثبت سفارش ارسال می‌شوند.
  • دقت کنید لینک ها به شماره موبایل شما ارسال می شوند. پس در ارائه شماره موبایل صحیح دقت کنید.
  • برای راهنمایی در مورد نحوه دانلود به شماره 09395106248 پیامک دهید یا تماس بگیرید. (ایده آل ترین گزینه ارسال پیام در یکی از پیام رسان ها به همین شماره است تا سریعا لینک های کتاب همانجا برای شما ارسال گردد.)
  • اگر پرداخت انجام شده ولی بعد از 24 ساعت هنوز لینک‌ها را دریافت نکرده‌اید، نام و نام خانوادگی و نام محصول را پیامک کنید تا لینک‌ها دوباره ارسال شوند.

💬 راه‌های ارتباطی پشتیبانی:
واتس‌اپ یا هر پیام رسان داخلی یا پیامک: 09395106248
تلگرام: @ma_limbs

📚 کتاب آموزشی جامع

📚 اطلاعات کتاب

عنوان کتاب: کتاب پرورش عامل‌های هوشمند با MADDPG: رویکردی قطعی و عمیق

موضوع کلی: یادگیری تقویتی چندعامله (MARL)

موضوع میانی: MADDPG (Multi-Agent Deep Deterministic Policy Gradient)

📋 سرفصل‌های کتاب (100 موضوع)

  • 1. مقدمه به عامل‌های هوشمند
  • 2. مقدمه به یادگیری تقویتی
  • 3. یادگیری تقویتی تک عاملی
  • 4. یادگیری تقویتی چند عاملی (MARL)
  • 5. چالش‌های MARL
  • 6. مقدمه به MADDPG
  • 7. نکات کلیدی MADDPG
  • 8. معماری MADDPG
  • 9. جزء عامل
  • 10. شبکه بازیگر (Actor Network)
  • 11. شبکه منتقد (Critic Network)
  • 12. شبکه هدف بازیگر (Target Actor Network)
  • 13. شبکه هدف منتقد (Target Critic Network)
  • 14. فضای عمل (Action Space)
  • 15. فضای حالت (State Space)
  • 16. تابع پاداش (Reward Function)
  • 17. آموزش عامل‌ها
  • 18. پخش تجربه (Experience Replay)
  • 19. مینی بچ (Mini-batch)
  • 20. گرادیان سیاست (Policy Gradient)
  • 21. خطای زمانی (Temporal Difference Error)
  • 22. تابع هزینه منتقد (Critic Loss Function)
  • 23. تابع هزینه بازیگر (Actor Loss Function)
  • 24. به‌روزرسانی شبکه‌ها
  • 25. نرخ یادگیری (Learning Rate)
  • 26. نرخ تخفیف (Discount Rate)
  • 27. به‌روزرسانی نرم شبکه‌های هدف (Soft Target Updates)
  • 28. استراتژی‌های حریصانه (Greedy Strategies)
  • 29. کاوش (Exploration)
  • 30. نویز در سیاست (Noise in Policy)
  • 31. کاوش مبتنی بر نویز (Noise-based Exploration)
  • 32. کاوش مبتنی بر آنتروپی (Entropy-based Exploration)
  • 33. پیاده‌سازی MADDPG
  • 34. انتخاب چارچوب یادگیری عمیق (Deep Learning Framework)
  • 35. TensorFlow
  • 36. PyTorch
  • 37. Keras
  • 38. ساختار کد MADDPG
  • 39. مدل‌سازی محیط
  • 40. محیط‌های شبیه‌سازی شده
  • 41. محیط‌های واقعی
  • 42. استفاده از کتابخانه‌های محیطی
  • 43. Gymnasium
  • 44. PettingZoo
  • 45. آماده‌سازی داده‌ها
  • 46. نرمال‌سازی داده‌ها (Data Normalization)
  • 47. مقیاس‌بندی داده‌ها (Data Scaling)
  • 48. تنظیم ابرپارامترها (Hyperparameter Tuning)
  • 49. تنظیم نرخ یادگیری
  • 50. تنظیم نرخ تخفیف
  • 51. تنظیم اندازه مینی بچ
  • 52. تنظیم اندازه بافر تجربه
  • 53. تنظیم پارامتر به‌روزرسانی نرم
  • 54. تنظیم پارامتر نویز کاوش
  • 55. تنظیم اندازه شبکه (Network Size)
  • 56. تنظیم توابع فعال‌سازی (Activation Functions)
  • 57. تنظیم بهینه‌ساز (Optimizer)
  • 58. آموزش MADDPG در محیط‌های ساده
  • 59. محیط‌های بازی ساده
  • 60. بازی سنگ، کاغذ، قیچی (Rock-Paper-Scissors)
  • 61. بازی دزد و پلیس (Tag Game)
  • 62. بازی تعقیب و گریز (Chase Game)
  • 63. تحلیل نتایج در محیط‌های ساده
  • 64. تجسم رفتار عامل‌ها
  • 65. رسم نمودارهای پاداش
  • 66. رسم نمودارهای دقت
  • 67. تحلیل میزان کاوش
  • 68. آموزش MADDPG در محیط‌های پیچیده‌تر
  • 69. رباتیک
  • 70. وسیله نقلیه خودران
  • 71. سیستم‌های توزیع شده
  • 72. شبکه‌های مخابراتی
  • 73. آموزش MADDPG در بازی‌های چند نفره
  • 74. StarCraft II
  • 75. Dota 2
  • 76. Multi-Agent Particle Environments (MPE)
  • 77. کاربرد MADDPG در رباتیک
  • 78. کنترل بازوی رباتیک
  • 79. هماهنگی ربات‌ها
  • 80. ناوبری ربات‌ها
  • 81. کاربرد MADDPG در وسایل نقلیه خودران
  • 82. کنترل ترافیک
  • 83. سناریوهای برخورد
  • 84. بهینه‌سازی مسیر
  • 85. کاربرد MADDPG در سیستم‌های توزیع شده
  • 86. مدیریت منابع
  • 87. تعادل بار (Load Balancing)
  • 88. کاربرد MADDPG در شبکه‌های مخابراتی
  • 89. مدیریت ترافیک شبکه
  • 90. بهینه‌سازی تخصیص منابع
  • 91. مزایای MADDPG
  • 92. رویکرد قطعی (Deterministic Approach)
  • 93. قابلیت یادگیری سیاست‌های پیچیده
  • 94. عملکرد قوی در محیط‌های پویا
  • 95. قابلیت تعمیم (Generalization)
  • 96. معایب MADDPG
  • 97. نیاز به حجم بالای داده
  • 98. حساسیت به ابرپارامترها
  • 99. پیچیدگی پیاده‌سازی
  • 100. مشکل همگرایی (Convergence Issues)

📚 محتوای این محصول آموزشی (پکیج کامل)

💡 این محصول یک نسخهٔ کامل و جامع است

تمامی محتوای آموزشی این کتاب در قالب یک بسته‌ی کامل و یکپارچه ارائه می‌شود و شامل تمام نسخه‌ها و فایل‌های موردنیاز برای یادگیری است.

🎁 محتویات کامل بسته دانلودی

🎯 این بسته یک دورهٔ آموزشی کامل و چندلایه است؛ شامل کتاب‌ها، تمرین‌ها و خودآزمایی .


ℹ️ نکات مهم هنگام خرید

  • این محصول به صورت فایل دانلودی کامل ارائه می‌شود و نسخهٔ چاپی ندارد.
  • توجه: لینک‌های اختصاصی دوره طی حداکثر 24 ساعت پس از ثبت سفارش ارسال می‌شوند.
  • دقت کنید لینک ها به شماره موبایل شما ارسال می شوند. پس در ارائه شماره موبایل صحیح دقت کنید.
  • برای راهنمایی در مورد نحوه دانلود به شماره 09395106248 پیامک دهید یا تماس بگیرید. (ایده آل ترین گزینه ارسال پیام در یکی از پیام رسان ها به همین شماره است تا سریعا لینک های کتاب همانجا برای شما ارسال گردد.)
  • اگر پرداخت انجام شده ولی بعد از 24 ساعت هنوز لینک‌ها را دریافت نکرده‌اید، نام و نام خانوادگی و نام محصول را پیامک کنید تا لینک‌ها دوباره ارسال شوند.

💬 راه‌های ارتباطی پشتیبانی:
واتس‌اپ یا هر پیام رسان داخلی یا پیامک: 09395106248
تلگرام: @ma_limbs

دیدگاهها

هیچ دیدگاهی برای این محصول نوشته نشده است.

اولین نفری باشید که دیدگاهی را ارسال می کنید برای “کتاب پرورش عامل‌های هوشمند با MADDPG: رویکردی قطعی و عمیق”

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *

پیمایش به بالا