,

مقاله FEFormer: ترنسفورمر بینایی تقویت‌شده با فرکانس برای استخراج دانش عمومی و ادغام ویژگی انطباقی در بخش‌بندی تصاویر پزشکی حجمی.

تومان249,950

ترجمه چکیده:

تقطیع دقیق اندام‌ها و ضایعات در تصاویر پزشکی برای کاربردهای بالینی از جمله تشخیص، پیش‌آگهی و برنامه‌ریزی درمان ضروری است. در حالی که ترنسفورمرهای بینایی (ViTs) عملکرد تقطیع چشمگیری از خو…

انتخاب پلن

torobpay
هر قسط با ترب‌پی: تومان62,488
۴ قسط ماهانه. بدون سود، چک و ضامن.
شناسه محصول: SuperPaper-0000000189 دسته: ,

📚 محتوای این محصول آموزشی (پکیج کامل)

💡 این محصول یک نسخهٔ کامل و جامع است

تمامی محتوای آموزشی این کتاب در قالب یک بسته‌ی کامل و یکپارچه ارائه می‌شود و شامل تمام نسخه‌ها و فایل‌های موردنیاز برای یادگیری است.

🎁 محتویات کامل بسته دانلودی

🎯 این بسته یک دورهٔ آموزشی کامل و چندلایه است؛ شامل کتاب‌ها، تمرین‌ها و خودآزمایی .


ℹ️ نکات مهم هنگام خرید

  • این محصول به صورت فایل دانلودی کامل ارائه می‌شود و نسخهٔ چاپی ندارد.
  • توجه: لینک‌های اختصاصی دوره طی حداکثر 24 ساعت پس از ثبت سفارش ارسال می‌شوند.
  • دقت کنید لینک ها به شماره موبایل شما ارسال می شوند. پس در ارائه شماره موبایل صحیح دقت کنید.
  • برای راهنمایی در مورد نحوه دانلود به شماره 09395106248 پیامک دهید یا تماس بگیرید. (ایده آل ترین گزینه ارسال پیام در یکی از پیام رسان ها به همین شماره است تا سریعا لینک های کتاب همانجا برای شما ارسال گردد.)
  • اگر پرداخت انجام شده ولی بعد از 24 ساعت هنوز لینک‌ها را دریافت نکرده‌اید، نام و نام خانوادگی و نام محصول را پیامک کنید تا لینک‌ها دوباره ارسال شوند.

💬 راه‌های ارتباطی پشتیبانی:
واتس‌اپ یا هر پیام رسان داخلی یا پیامک: 09395106248
تلگرام: @ma_limbs

FEFormer: ترنسفورمر بینایی تقویت‌شده با فرکانس برای استخراج دانش عمومی و ادغام ویژگی انطباقی در بخش‌بندی تصاویر پزشکی حجمی.

FEFormer: Frequency-enhanced Vision Transformer for Generic Knowledge Extraction and Adaptive Feature Fusion in Volumetric Medical Image Segmentation

نویسندگان: Jin Yang, Xiaobing Yu, Peijie Qiu

شناسه منبع: arxiv / 2605.11434

دسته: Image and Video Processing

چکیده (فارسی)

ترجمه چکیده:

تقطیع دقیق اندام‌ها و ضایعات در تصاویر پزشکی برای کاربردهای بالینی از جمله تشخیص، پیش‌آگهی و برنامه‌ریزی درمان ضروری است. در حالی که ترنسفورمرهای بینایی (ViTs) عملکرد تقطیع چشمگیری از خود نشان داده‌اند، اما با چالش‌های کلیدی در طراحی ماژول و معماری مواجه هستند. به طور خاص، خود-توجهی (self-attention) در ثبت ویژگی‌های محلی ریز که برای درک ساختارهای دقیق آناتومیکی حیاتی هستند، دچار مشکل است. ماژول‌های استاندارد MLP فاقد مکانیزم‌های صریحی برای حفظ اطلاعات مکانی هستند. معماری‌های متداول رمزگذار-رمزگشا (encoder-decoder) به استراتژی‌های ادغام ویژگی‌های ساده متکی هستند که نمی‌توانند ناهماهنگی‌های معنایی بزرگ را مدیریت کنند. همچنین، طرح‌های موجود فاقد مکانیزم‌های صریحی برای انتشار اطلاعات سطح پایین از رمزگذار به رمزگشا هستند. برای رفع این محدودیت‌ها، ما یک ترنسفورمر بینایی تقویت‌شده با فرکانس (FEFormer) را برای تقطیع حجمی تصاویر پزشکی قوی و کارآمد پیشنهاد می‌کنیم که به طور صریح اطلاعات فرکانسی را مدل‌سازی می‌کند تا زمینه جهانی و جزئیات ساختاری ریز را به طور مشترک ثبت کند. FEFormer شامل چهار جزء نوآورانه است: یک ماژول خود-توجهی پویا تقویت‌شده با فرکانس (FDSA) که جزئیات محلی ریز و وابستگی‌های دوربرد جهانی را از طریق کانولوشن حفظ‌کننده مکان با توجه در حوزه فرکانس به طور مشترک ثبت می‌کند؛ یک MLP گیتینگ تجزیه‌شده با فرکانس (FGMLP) که مولفه‌های فرکانس پایین و بالا را به طور تطبیقی برای نمایش معنایی و ساختاری بهبودیافته مدل‌سازی می‌کند؛ یک ماژول ادغام ویژگی تطبیقی هدایت‌شده با موجک (WAFF) که ادغام ویژگی‌های رمزگذار-رمزگشا را با سازگاری معنایی در حوزه فرکانس امکان‌پذیر می‌سازد؛ و یک پل ساقه چند مقیاسی فعال‌شده با فرکانس (FCSB) که انتشار ویژگی‌های سطح پایین را در مقیاس‌های مختلف بهبود می‌بخشد. FEFormer که بر روی چهار وظیفه متنوع تقطیع تصاویر پزشکی حجمی ارزیابی شد، عملکرد تقطیع برتری را با کارایی محاسباتی بالا در مقایسه با روش‌های پیشرفته به دست آورد.

Abstract (English)

Accurate segmentation of organs and lesions in medical images is essential for clinical applications including diagnosis, prognosis, and treatment planning. While Vision Transformers (ViTs) have shown impressive segmentation performance, they face key challenges in module and architecture design. Specifically, self-attention struggles to capture fine-grained local features critical for understanding detailed anatomical structures, standard MLP modules lack explicit mechanisms to preserve spatial information, conventional encoder-decoder architectures rely on naive feature fusion strategies that cannot handle large semantic discrepancies, and existing designs lack explicit mechanisms to propagate low-level information from encoder to decoder. To address these limitations, we propose a Frequency-enhanced Vision Transformer (FEFormer) for robust and efficient volumetric medical image segmentation that explicitly models frequency information to jointly capture global context and fine structural details. FEFormer comprises four novel components: a Frequency-enhanced Dynamic Self-Attention (FDSA) module that jointly captures fine-grained local details and global long-range dependencies through locality-preserving convolution with frequency-domain attention; a Frequency-decomposed Gating MLP (FGMLP) that adaptively models low- and high-frequency components for enhanced semantic and structural representation; a Wavelet-guided Adaptive Feature Fusion (WAFF) module that enables semantically consistent encoder-decoder feature integration in the frequency domain; and a Frequency-enabled Cross-scale Stem Bridge (FCSB) that enhances low-level feature propagation across scales. Evaluated on four diverse volumetric medical image segmentation tasks, FEFormer achieved superior segmentation performance with high computational efficiency compared to state-of-the-art methods.

دیدگاهها

هیچ دیدگاهی برای این محصول نوشته نشده است.

اولین نفری باشید که دیدگاهی را ارسال می کنید برای “مقاله FEFormer: ترنسفورمر بینایی تقویت‌شده با فرکانس برای استخراج دانش عمومی و ادغام ویژگی انطباقی در بخش‌بندی تصاویر پزشکی حجمی.”

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *

پیمایش به بالا