مقاله پیش‌تنظیم فقط پیش‌پر کردن برای استنتاج کارآمد

Name: مقاله پیشتنظیم فقط پیشپر کردن برای استنتاج کارآمد
SKU: SuperPaper-0000000257
Availability: InStock

تومان249,950

انتخاب پلن

ساده

مقاله PDF انگلیسی + PDF های فارسی مشابه نمونه درج شده در توضیحات محصول

تومان249,950

حرفه ای (پیشنهادی)

مقاله PDF انگلیسی + PDF های فارسی مشابه نمونه درج شده در توضیحات محصول + فایل ورد مقاله + فایل پاورپوینت مقاله

تومان499,950

کامل و گواهی‌دار

مقاله PDF انگلیسی + PDF های فارسی مشابه نمونه درج شده در توضیحات محصول + فایل ورد مقاله + فایل پاورپوینت مقاله + عضویت در سامانه مرور هوشمند مخصوص این محصول + دریافت گواهی نامه

برای توضیحات بیشتر در مورد گواهی نامه و سامانه مرور هوشمند اینجا را کلیک کنید

تومان799,950

VIP

مقاله PDF انگلیسی + PDF های فارسی مشابه نمونه درج شده در توضیحات محصول + فایل ورد مقاله + فایل پاورپوینت مقاله + عضویت در سامانه مرور هوشمند مخصوص این محصول + دریافت گواهی نامه + دریافت پادکست‌های صوتی و ویدیوهای فارسی همراه این مجموعه

تومان1,199,950

شناسه محصول: SuperPaper-0000000257 دسته: arxiv, مقالات علمی

توضیحات
نظرات (0)

📚 محتوای این محصول آموزشی (پکیج کامل)

💡 این محصول یک نسخهٔ کامل و جامع است

تمامی محتوای آموزشی این کتاب در قالب یک بسته‌ی کامل و یکپارچه ارائه می‌شود و شامل تمام نسخه‌ها و فایل‌های موردنیاز برای یادگیری است.

🎁 محتویات کامل بسته دانلودی

اصل مقاله انگلیسی
کتاب صدها نکته فارسی (خودمونی) – نسخه PDF — زبان ساده و کاربردی
برای مشاهده نمونه ای از فرمت نسخه نکات ساده کتاب های ما اینجا را کلیک کنید. کتاب دریافتی شما نیز در موضوع خود به همین سبک خواهد بود. دقت کنید تعداد صفحات کتاب در اینجا فقط 10 صفحه برای نمونه بوده است و کتاب اصلی شما طبق سرفصل های گفته شده کتابی جامع خواهد بود.
کتاب صدها نکته رسمی فارسی – نسخه PDF — نگارش استاندارد، علمی و مناسب چاپ
برای مشاهده نمونه ای از فرمت نسخه نکته رسمی کتاب های ما اینجا را کلیک کنید. کتاب دریافتی شما نیز در موضوع خود به همین سبک خواهد بود. دقت کنید تعداد صفحات کتاب در اینجا فقط 10 صفحه برای نمونه بوده است و کتاب اصلی شما طبق سرفصل های گفته شده کتابی جامع خواهد بود.
کتاب صدها پرسش و پاسخ تشریحی – نسخه PDF
— هر سؤال بلافاصله همراه با پاسخ کامل و شفاف ارائه شده است؛ مناسب درک عمیق مفاهیم و رفع ابهام.
برای مشاهده نمونه ای از فرمت نسخه پرسش و پاسخ کتاب های ما اینجا را کلیک کنید. کتاب دریافتی شما نیز در موضوع خود به همین سبک خواهد بود. دقت کنید تعداد صفحات کتاب در اینجا فقط 10 صفحه برای نمونه بوده است و کتاب اصلی شما طبق سرفصل های گفته شده کتابی جامع خواهد بود.
کتاب صدها پرسش و پاسخ چهارگزینه‌ای – نسخه PDF (نسخه یادگیری سریع)
— پاسخ‌ها بلافاصله پس از سؤال قرار دارند؛ مناسب یادگیری سریع و تثبیت مطالب.
برای مشاهده نمونه ای از فرمت نسخه کوییز چهارگزینه ای با پاسخ کتاب های ما اینجا را کلیک کنید. کتاب دریافتی شما نیز در موضوع خود به همین سبک خواهد بود. دقت کنید تعداد صفحات کتاب در اینجا فقط 10 صفحه برای نمونه بوده است و کتاب اصلی شما طبق سرفصل های گفته شده کتابی جامع خواهد بود.
کتاب صدها پرسش و پاسخ چهارگزینه‌ای – نسخه PDF (نسخه خودآزمایی پایان‌بخش)
— پاسخ‌ها در انتهای هر بخش آمده‌اند؛ مناسب آزمون واقعی و سنجش میزان یادگیری.
برای مشاهده نمونه ای از فرمت نسخه کوییز چهارگزینه ای با پاسخ های انتهای فصل کتاب های ما اینجا را کلیک کنید. کتاب دریافتی شما نیز در موضوع خود به همین سبک خواهد بود. دقت کنید تعداد صفحات کتاب در اینجا فقط 10 صفحه برای نمونه بوده است و کتاب اصلی شما طبق سرفصل های گفته شده کتابی جامع خواهد بود.

🎯 این بسته یک دورهٔ آموزشی کامل و چندلایه است؛ شامل کتاب‌ها، تمرین‌ها و خودآزمایی .

ℹ️ نکات مهم هنگام خرید

این محصول به صورت فایل دانلودی کامل ارائه می‌شود و نسخهٔ چاپی ندارد.
توجه: لینک‌های اختصاصی دوره طی حداکثر 24 ساعت پس از ثبت سفارش ارسال می‌شوند.
دقت کنید لینک ها به شماره موبایل شما ارسال می شوند. پس در ارائه شماره موبایل صحیح دقت کنید.
برای راهنمایی در مورد نحوه دانلود به شماره 09395106248 پیامک دهید یا تماس بگیرید. (ایده آل ترین گزینه ارسال پیام در یکی از پیام رسان ها به همین شماره است تا سریعا لینک های کتاب همانجا برای شما ارسال گردد.)
اگر پرداخت انجام شده ولی بعد از 24 ساعت هنوز لینک‌ها را دریافت نکرده‌اید، نام و نام خانوادگی و نام محصول را پیامک کنید تا لینک‌ها دوباره ارسال شوند.

💬 راه‌های ارتباطی پشتیبانی:
واتس‌اپ یا هر پیام رسان داخلی یا پیامک: 09395106248
تلگرام: @ma_limbs

پیش‌تنظیم فقط پیش‌پر کردن برای استنتاج کارآمد

PreFT: Prefill-only finetuning for efficient inference

نویسندگان: Andrew Lanpouthakoun, Aryaman Arora, Zhengxuan Wu, Dhruv Pai, Ben Keigwin, Dan Jurafsky, Christopher Potts

شناسه منبع: arxiv / 2605.14217v1

دسته: cs.LG,cs.AI,cs.CL,eess.SY

چکیده (فارسی)

مدل‌های زبان بزرگ امروزه می‌توانند به طور کارآمد و در مقیاس بزرگ با استفاده از روش‌های تنظیم دقیق پارامتر-کارآمد (PEFTs) شخصی‌سازی شوند، اما سرویس‌دهی به PEFTهای مخصوص کاربر، توان عملیاتی را کاهش می‌دهد، حتی با وجود هسته‌های تخصصی و تکنیک‌های مدیریت حافظه. دلیل این امر، وجود ناهماهنگی نظری و تجربی بین مرحله پیش‌پر کردن (پردازش تعداد زیادی توکن به طور همزمان) و مرحله رمزگشایی (تولید یک توکن به صورت خودبازگشتی) است: مرحله دوم توان عملیاتی بسیار پایین‌تری هنگام سرویس‌دهی به چندین آداپتور دارد. به جای بهینه‌سازی عملکرد نسبت به تعداد پارامترها، برای سرویس‌دهی کارآمد چند آداپتور، باید عملکرد را نسبت به توان عملیاتی سرویس‌دهی بهینه کنیم. بنابراین، ما PreFT (تنظیم دقیق فقط پیش‌پر کردن) را پیشنهاد می‌کنیم، که در آن آداپتور را فقط برای توکن‌های پیش‌پر کردن اعمال کرده و پس از آن آن را حذف می‌کنیم. PreFT توان عملیاتی را به طور قابل توجهی افزایش می‌دهد و تأثیر ناچیزی بر عملکرد دارد. ما پیاده‌سازی کارآمدی از دو PEFT فقط پیش‌پر کردن، LoRA و ReFT، را بر روی موتور استنتاج vLLM توسعه داده و منتشر می‌کنیم. ابتدا نشان می‌دهیم که سرویس‌دهی به PreFTهای چند کاربر نسبت به PEFTهای سنتی کارآمدتر است (توان عملیاتی 1.9 برابر هنگام سرویس‌دهی به 512 آداپتور بر روی Llama 3.1 70B). سپس، عملکرد آداپتورهای فقط پیش‌پر کردن در مقابل آداپتورهای تمام توکن را در طیف وسیعی از وظایف تنظیم دقیق نظارت شده و یادگیری تقویتی با مدل‌های زبان در مقیاس‌های مختلف مقایسه می‌کنیم. در SFT، مشاهده می‌کنیم که خطای ارزیابی PreFTها بالاتر از PEFTها است، اما می‌توان با افزایش رتبه، بدون کاهش تقریباً هیچ توان عملیاتی، آن را جبران کرد. در RL، به طور مداوم دریافتیم که PreFTها به برابری با PEFTهای استاندارد نزدیک می‌شوند. در مجموع، این کار، تطبیق فقط پیش‌پر کردن مدل‌های زبان بزرگ را به عنوان یک مبادله دقت-توان عملیاتی مطلوب‌تر نسبت به PEFTهای موجود برای سرویس‌دهی شخصی‌سازی شده، تأیید می‌کند.

Abstract (English)

Large language models can now be personalised efficiently at scale using parameter efficient finetuning methods (PEFTs), but serving user-specific PEFTs harms throughput, even with specialised kernels and memory management techniques. This is because, theoretically and empirically, a mismatch exists between prefill (processing a large number of tokens at once) and decode (generating a single token autoregressively): the latter has far lower throughput when serving multiple adapters. Rather than optimising performance relative to parameter count, for efficient multi-adapter serving, we instead ought to optimise performance relative to serving throughput. We therefore propose PreFT (Prefill-only Finetuning), wherein we only apply the adapter to prefill tokens and discard it afterwards. PreFT significantly increases throughput with minimal effect on performance. We develop and release an efficient implementation of two prefill-only PEFTs, LoRA and ReFT, on the vLLM inference engine. We first show that serving multi-user PreFTs is more efficient than traditional PEFTs ($1.9times$ the throughput when serving $512$ adapters on Llama 3.1 70B). Then, we compare the performance of prefill-only vs. all-token adapters on a variety of supervised finetuning and reinforcement learning tasks with LMs at varying scales. On SFT, we observe that the evaluation loss of PreFTs is higher than PEFTs, but can be compensated by increasing rank with nearly no reduction in throughput. On RL, we consistently find that PreFTs approach parity with standard PEFTs. Together, this work validates prefill-only adaptation of LLMs as a more favourable accuracy-throughput tradeoff than existing PEFTs for personalised serving.

دیدگاهها

هیچ دیدگاهی برای این محصول نوشته نشده است.

اولین نفری باشید که دیدگاهی را ارسال می کنید برای “مقاله پیش‌تنظیم فقط پیش‌پر کردن برای استنتاج کارآمد”

مقاله پیش‌تنظیم فقط پیش‌پر کردن برای استنتاج کارآمد

انتخاب پلن

📚 محتوای این محصول آموزشی (پکیج کامل)

💡 این محصول یک نسخهٔ کامل و جامع است

🎁 محتویات کامل بسته دانلودی

ℹ️ نکات مهم هنگام خرید

پیش‌تنظیم فقط پیش‌پر کردن برای استنتاج کارآمد

PreFT: Prefill-only finetuning for efficient inference

چکیده (فارسی)

Abstract (English)

دیدگاهها

محصولات مشابه

مقاله کنترل حرکت پایدار کوادکوپتر با استفاده از بازخورد خروجی

مقاله طراحی خودکار برنامه آموزشی برای یادگیری حرکتی انسان با ابعاد بالا

مقاله جستجوی منبع رادیواکتیو با بهینه‌سازی بیزی و جریمه حرکت.

مقاله ارزیابی زمان پاسخ چشمی مبتنی بر رابط مغز و کامپیوتر با استفاده از پیچش زمانی پویا با بهره‌گیری از چارچوب عصبی عمیق مبتنی بر RDWT.