,

مقاله تخمین سه‌بعدی حالت دست و تشخیص ژست با دوربین‌های رویداد استریو در دیدگاه اول شخص (EgoEV-HandPose)

تومان249,950

تخمین سه‌بعدی ژست دست و تشخیص ژست از دیدگاه خودمحور، برای واقعیت افزوده/مجازی فراگیر، تعامل انسان و کامپیوتر، و رباتیک ضروری است. با این حال، دوربین‌های متعارف مبتنی بر فریم از تاری حرکتی و دامنه دینا…

انتخاب پلن

torobpay
هر قسط با ترب‌پی: تومان62,488
۴ قسط ماهانه. بدون سود، چک و ضامن.
شناسه محصول: SuperPaper-0000000145 دسته: ,

📚 محتوای این محصول آموزشی (پکیج کامل)

💡 این محصول یک نسخهٔ کامل و جامع است

تمامی محتوای آموزشی این کتاب در قالب یک بسته‌ی کامل و یکپارچه ارائه می‌شود و شامل تمام نسخه‌ها و فایل‌های موردنیاز برای یادگیری است.

🎁 محتویات کامل بسته دانلودی

🎯 این بسته یک دورهٔ آموزشی کامل و چندلایه است؛ شامل کتاب‌ها، تمرین‌ها و خودآزمایی .


ℹ️ نکات مهم هنگام خرید

  • این محصول به صورت فایل دانلودی کامل ارائه می‌شود و نسخهٔ چاپی ندارد.
  • توجه: لینک‌های اختصاصی دوره طی حداکثر 24 ساعت پس از ثبت سفارش ارسال می‌شوند.
  • دقت کنید لینک ها به شماره موبایل شما ارسال می شوند. پس در ارائه شماره موبایل صحیح دقت کنید.
  • برای راهنمایی در مورد نحوه دانلود به شماره 09395106248 پیامک دهید یا تماس بگیرید. (ایده آل ترین گزینه ارسال پیام در یکی از پیام رسان ها به همین شماره است تا سریعا لینک های کتاب همانجا برای شما ارسال گردد.)
  • اگر پرداخت انجام شده ولی بعد از 24 ساعت هنوز لینک‌ها را دریافت نکرده‌اید، نام و نام خانوادگی و نام محصول را پیامک کنید تا لینک‌ها دوباره ارسال شوند.

💬 راه‌های ارتباطی پشتیبانی:
واتس‌اپ یا هر پیام رسان داخلی یا پیامک: 09395106248
تلگرام: @ma_limbs

تخمین سه‌بعدی حالت دست و تشخیص ژست با دوربین‌های رویداد استریو در دیدگاه اول شخص (EgoEV-HandPose)

EgoEV-HandPose: Egocentric 3D Hand Pose Estimation and Gesture Recognition with Stereo Event Cameras

نویسندگان: Luming Wang, Hao Shi, Jiajun Zhai, Kailun Yang, Kaiwei Wang

شناسه منبع: arxiv / 2605.12297

دسته: Computer Vision and Pattern Recognition,Robotics,Image and Video Processing

چکیده (فارسی)

تخمین سه‌بعدی ژست دست و تشخیص ژست از دیدگاه خودمحور، برای واقعیت افزوده/مجازی فراگیر، تعامل انسان و کامپیوتر، و رباتیک ضروری است. با این حال، دوربین‌های متعارف مبتنی بر فریم از تاری حرکتی و دامنه دینامیکی محدود رنج می‌برند، در حالی که روش‌های موجود مبتنی بر رویداد با تداخل حرکت خود، ابهام عمق تک‌چشمی، و فقدان مجموعه داده‌های استریو در مقیاس بزرگ در دنیای واقعی مواجه هستند. برای غلبه بر این محدودیت‌ها، ما چارچوب End-to-End به نام EgoEV-HandPose را برای تخمین مشترک ژست دو دستی سه‌بعدی و تشخیص ژست از جریان‌های رویداد استریو پیشنهاد می‌کنیم. هسته اصلی رویکرد ما KeypointBEV است، یک ماژول انعطاف‌پذیر ادغام استریو که ویژگی‌ها را به فضای متعارف دید پرنده (Bird's-Eye-View) ارتقا می‌دهد و از یک حلقه پالایش تکراری هدایت‌شده با بازتاب مجدد برای رفع تدریجی عدم قطعیت عمق و اعمال سازگاری سینماتیکی استفاده می‌کند. علاوه بر این، ما EgoEVHands را معرفی می‌کنیم، اولین مجموعه داده استریو رویداد-دوربین در مقیاس بزرگ در دنیای واقعی برای ادراک خودمحور دست، که شامل ۵,۴۱۹ دنباله حاشیه‌نویسی شده با نقاط کلیدی متراکم سه‌بعدی/دوبعدی در ۳۸ کلاس ژست تحت نورپردازی‌های مختلف است. آزمایش‌های گسترده نشان می‌دهد که EgoEV-HandPose با عملکرد پیشرفته (MPJPE برابر با ۳۰.۵۴ میلی‌متر و دقت تشخیص ژست Top-1 برابر با ۸۶.۸۷٪) به نتایج پیشرو دست می‌یابد و به طور قابل توجهی از روش‌های استریو مبتنی بر RGB و روش‌های قبلی دوربین رویداد، به ویژه در سناریوهای کم‌نور و انسداد دو دستی، بهتر عمل می‌کند و در نتیجه معیار جدیدی برای ادراک خودمحور مبتنی بر رویداد تعیین می‌کند. مجموعه داده و کد منبع ایجاد شده به صورت عمومی در آدرس https://github.com/ZJUWang01/EgoEV-HandPose منتشر خواهد شد.

Abstract (English)

Egocentric 3D hand pose estimation and gesture recognition are essential for immersive augmented/virtual reality, human-computer interaction, and robotics. However, conventional frame-based cameras suffer from motion blur and limited dynamic range, while existing event-based methods are hindered by ego-motion interference, monocular depth ambiguity, and the lack of large-scale real-world stereo datasets. To overcome these limitations, we propose EgoEV-HandPose, an end-to-end framework for joint 3D bimanual pose estimation and gesture recognition from stereo event streams. Central to our approach is KeypointBEV, a flexible stereo fusion module that lifts features into a canonical bird's-eye-view space and employs an iterative reprojection-guided refinement loop to progressively resolve depth uncertainty and enforce kinematic consistency. In addition, we introduce EgoEVHands, the first large-scale real-world stereo event-camera dataset for egocentric hand perception, containing 5,419 annotated sequences with dense 3D/2D keypoints across 38 gesture classes under varying illumination. Extensive experiments demonstrate that EgoEV-HandPose achieves state-of-the-art performance with an MPJPE of 30.54mm and 86.87% Top-1 gesture recognition accuracy, significantly outperforming RGB-based stereo and prior event-camera methods, particularly in low-light and bimanual occlusion scenarios, thereby setting a new benchmark for event-based egocentric perception. The established dataset and source code will be publicly released at https://github.com/ZJUWang01/EgoEV-HandPose.

دیدگاهها

هیچ دیدگاهی برای این محصول نوشته نشده است.

اولین نفری باشید که دیدگاهی را ارسال می کنید برای “مقاله تخمین سه‌بعدی حالت دست و تشخیص ژست با دوربین‌های رویداد استریو در دیدگاه اول شخص (EgoEV-HandPose)”

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *

پیمایش به بالا