,

مقاله شبکه‌های عمیق کیو تصحیح‌شده رمزگذاری‌شده دوتایی برای سیستم‌های کنترل چندعامله

تومان249,950

این مقاله به بررسی سنتز سیاست‌های کنترلی برای سیستم‌های چند عاملی ناهمگن و به‌هم‌پیوسته می‌پردازد که از طریق تبادل داده بر روی یک شبکه ارتباطی برای حداقل‌سازی یک هزینه جمعی همکاری می‌کنند. ما یک چارچو…

انتخاب پلن

torobpay
هر قسط با ترب‌پی: تومان62,488
۴ قسط ماهانه. بدون سود، چک و ضامن.
شناسه محصول: SuperPaper-0000000263 دسته: ,

📚 محتوای این محصول آموزشی (پکیج کامل)

💡 این محصول یک نسخهٔ کامل و جامع است

تمامی محتوای آموزشی این کتاب در قالب یک بسته‌ی کامل و یکپارچه ارائه می‌شود و شامل تمام نسخه‌ها و فایل‌های موردنیاز برای یادگیری است.

🎁 محتویات کامل بسته دانلودی

🎯 این بسته یک دورهٔ آموزشی کامل و چندلایه است؛ شامل کتاب‌ها، تمرین‌ها و خودآزمایی .


ℹ️ نکات مهم هنگام خرید

  • این محصول به صورت فایل دانلودی کامل ارائه می‌شود و نسخهٔ چاپی ندارد.
  • توجه: لینک‌های اختصاصی دوره طی حداکثر 24 ساعت پس از ثبت سفارش ارسال می‌شوند.
  • دقت کنید لینک ها به شماره موبایل شما ارسال می شوند. پس در ارائه شماره موبایل صحیح دقت کنید.
  • برای راهنمایی در مورد نحوه دانلود به شماره 09395106248 پیامک دهید یا تماس بگیرید. (ایده آل ترین گزینه ارسال پیام در یکی از پیام رسان ها به همین شماره است تا سریعا لینک های کتاب همانجا برای شما ارسال گردد.)
  • اگر پرداخت انجام شده ولی بعد از 24 ساعت هنوز لینک‌ها را دریافت نکرده‌اید، نام و نام خانوادگی و نام محصول را پیامک کنید تا لینک‌ها دوباره ارسال شوند.

💬 راه‌های ارتباطی پشتیبانی:
واتس‌اپ یا هر پیام رسان داخلی یا پیامک: 09395106248
تلگرام: @ma_limbs

شبکه‌های عمیق کیو تصحیح‌شده رمزگذاری‌شده دوتایی برای سیستم‌های کنترل چندعامله

An Encoded Corrective Double Deep Q-Networks for Multi-Agent Control Systems

نویسندگان: Mohammadreza Barzegaran, Kemeng Han, Hamid Jafarkhani

شناسه منبع: arxiv / 2605.14121v1

دسته: eess.SP,eess.SY

چکیده (فارسی)

این مقاله به بررسی سنتز سیاست‌های کنترلی برای سیستم‌های چند عاملی ناهمگن و به‌هم‌پیوسته می‌پردازد که از طریق تبادل داده بر روی یک شبکه ارتباطی برای حداقل‌سازی یک هزینه جمعی همکاری می‌کنند. ما یک چارچوب توزیع‌شده رمزگذاری شده اصلاحی دوگانه بازیگر-منتقد را پیشنهاد می‌کنیم که مکانیزم جدیدی برای عبور پیام را ادغام می‌کند. روش‌های موجود فرض می‌کنند دسترسی بدون نویز و بدون تأخیر به حالت‌های سراسری یا جزئی دارند و این واقعیت را نادیده می‌گیرند که حالت‌های سراسری، اگرچه نویزی و با تأخیر هستند، می‌توانند به تدریج در طول زمان بازسازی و اصلاح شوند. در مقابل، این کار به‌طور صریح ناهمگونی نمونه‌برداری ارتباطی، تأخیر و نویز لینک را بر اساس پیکربندی شبکه مدل‌سازی می‌کند. مکانیزم عبور پیام پیشنهادی، جریان زمان‌بندی و اطلاعات را برای اصلاح و تغییر زمان اطلاعات حالت سراسری مشخص می‌کند، که سپس برای اصلاح تدریجی شبکه‌های Q استفاده می‌شود. طراحی شبکه دوگانه Q، سوگیری بیش‌تخمین را کاهش می‌دهد، در حالی که رمزگذار مشترک که شبکه‌های بازیگر-منتقد را به هم متصل می‌کند، وابستگی‌های بین عامل‌ها را ثبت می‌کند. ما رویکرد خود را در چندین مورد آزمایشی ارزیابی می‌کنیم، اثربخشی آن را در مقایسه با خطوط پایه مختلف نشان می‌دهیم و تحلیل پشیمانی عددی را ارائه می‌دهیم.

Abstract (English)

This paper studies the synthesis of control policies for heterogeneous and interconnected multi-agent systems that collaborate through data exchange over a communication network to minimize a collective cost. We propose a distributed encoded corrective double actor-critic framework that integrates a novel message-passing mechanism. Existing methods assume noise-free and delay-free access to the global or partial states and overlook the fact that the global states, though noisy and delayed, can be progressively reconstructed and refined over time. In contrast, this work explicitly models communication sampling asynchrony, delay, and link noise based on the network configuration. The proposed message-passing mechanism characterizes timing and information flow to refine and time shift global state information, which is then used to incrementally correct the Q-networks. The double Q-network design mitigates overestimation bias, while the shared encoder coupling the actor-critic networks captures inter-agent dependencies. We evaluate our approach in multiple test cases, demonstrate its effectiveness over various baselines, and provide a numerical regret analysis.

دیدگاهها

هیچ دیدگاهی برای این محصول نوشته نشده است.

اولین نفری باشید که دیدگاهی را ارسال می کنید برای “مقاله شبکه‌های عمیق کیو تصحیح‌شده رمزگذاری‌شده دوتایی برای سیستم‌های کنترل چندعامله”

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *

پیمایش به بالا