, ,

کتاب بهینه‌سازی مدل‌های مولد برای سرعت تولید

تومان249,950

انتخاب پلن

torobpay
هر قسط با ترب‌پی: تومان62,488
۴ قسط ماهانه. بدون سود، چک و ضامن.

📚 محتوای این محصول آموزشی (پکیج کامل)

💡 این محصول یک نسخهٔ کامل و جامع است

تمامی محتوای آموزشی این کتاب در قالب یک بسته‌ی کامل و یکپارچه ارائه می‌شود و شامل تمام نسخه‌ها و فایل‌های موردنیاز برای یادگیری است.

🎁 محتویات کامل بسته دانلودی

🎯 این بسته یک دورهٔ آموزشی کامل و چندلایه است؛ شامل کتاب‌ها، تمرین‌ها و خودآزمایی .


ℹ️ نکات مهم هنگام خرید

  • این محصول به صورت فایل دانلودی کامل ارائه می‌شود و نسخهٔ چاپی ندارد.
  • توجه: لینک‌های اختصاصی دوره طی حداکثر 24 ساعت پس از ثبت سفارش ارسال می‌شوند.
  • دقت کنید لینک ها به شماره موبایل شما ارسال می شوند. پس در ارائه شماره موبایل صحیح دقت کنید.
  • برای راهنمایی در مورد نحوه دانلود به شماره 09395106248 پیامک دهید یا تماس بگیرید. (ایده آل ترین گزینه ارسال پیام در یکی از پیام رسان ها به همین شماره است تا سریعا لینک های کتاب همانجا برای شما ارسال گردد.)
  • اگر پرداخت انجام شده ولی بعد از 24 ساعت هنوز لینک‌ها را دریافت نکرده‌اید، نام و نام خانوادگی و نام محصول را پیامک کنید تا لینک‌ها دوباره ارسال شوند.

💬 راه‌های ارتباطی پشتیبانی:
واتس‌اپ یا هر پیام رسان داخلی یا پیامک: 09395106248
تلگرام: @ma_limbs

📚 کتاب آموزشی جامع

📚 اطلاعات کتاب

عنوان کتاب: کتاب بهینه‌سازی مدل‌های مولد برای سرعت تولید

موضوع کلی: برنامه نویسی

موضوع میانی: محاسبات سطح بالا (High-Performance Computing)

📋 سرفصل‌های کتاب (100 موضوع)

  • 1. مقدمه‌ای بر مدل‌های مولد و چالش سرعت تولید
  • 2. مفاهیم کلیدی محاسبات سطح بالا (HPC)
  • 3. معیارهای ارزیابی سرعت: تأخیر (Latency) و توان عملیاتی (Throughput)
  • 4. آشنایی با ابزارهای پروفایلینگ کد
  • 5. تحلیل گلوگاه‌ها (Bottlenecks) در پایپ‌لاین تولید
  • 6. مروری بر معماری ترنسفورمرها (Transformers)
  • 7. معماری مدل‌های زبانی بزرگ (LLMs)
  • 8. مروری بر مدل‌های انتشاری (Diffusion Models)
  • 9. مروری بر شبکه‌های مولد تخاصمی (GANs)
  • 10. مبانی ریاضیاتی مورد نیاز: جبر خطی و آمار
  • 11. ساختار حافظه و سلسله‌مراتب آن (Memory Hierarchy)
  • 12. پردازش موازی: مفاهیم و اصول
  • 13. آشنایی با معماری CPU و بهینه‌سازی‌های آن
  • 14. آشنایی با معماری GPU و نقش آن در هوش مصنوعی
  • 15. تفاوت بین آموزش (Training) و تولید (Inference)
  • 16. چرخه حیات یک مدل مولد: از طراحی تا استقرار
  • 17. بنچمارکینگ استاندارد برای مدل‌های مولد
  • 18. معرفی مجموعه داده‌ها و وظایف رایج (Tasks)
  • 19. اصول محاسبات ممیز شناور (Floating-Point Arithmetic)
  • 20. اهمیت بهینه‌سازی: هزینه، انرژی و تجربه کاربری
  • 21. معماری داخلی GPU: هسته‌های CUDA و هسته‌های Tensor
  • 22. برنامه‌نویسی مقدماتی CUDA برای محاسبات سفارشی
  • 23. استفاده از حافظه مشترک (Shared Memory) در CUDA
  • 24. بهینه‌سازی دسترسی به حافظه جهانی (Global Memory Coalescing)
  • 25. معرفی هسته‌های Tensor و کاربرد آن‌ها در محاسبات ماتریسی
  • 26. بهینه‌سازی‌های سطح CPU: برداری‌سازی (Vectorization) با SIMD
  • 27. چندنخی (Multi-threading) برای پیش‌پردازش و پس‌پردازش
  • 28. تأثیر پهنای باند حافظه (Memory Bandwidth) بر سرعت
  • 29. مدیریت حافظه در GPU و جلوگیری از سربار انتقال داده
  • 30. معرفی شتاب‌دهنده‌های اختصاصی هوش مصنوعی (TPU, NPU)
  • 31. مقایسه عملکرد CPU، GPU و TPU برای وظایف تولید
  • 32. اصول برنامه‌نویسی برای معماری‌های ناهمگون (Heterogeneous)
  • 33. پروفایلینگ عملکرد GPU با ابزارهای تخصصی مانند NVIDIA Nsight
  • 34. درک و تحلیل گزارش‌های پروفایلر سخت‌افزار
  • 35. بهینه‌سازی برای انواع داده با دقت پایین (FP16, BFloat16)
  • 36. تأثیر اندازه کش (Cache Size) پردازنده بر عملکرد
  • 37. ارتباطات بین پردازشی (Inter-Process Communication) برای پایپ‌لاین‌های پیچیده
  • 38. بهینه‌سازی برای پلتفرم‌های لبه (Edge Devices)
  • 39. مفاهیم توان مصرفی و بهره‌وری انرژی (Power Efficiency)
  • 40. انتخاب سخت‌افزار مناسب برای استقرار مدل‌های مولد
  • 41. کوانتیزاسیون (Quantization): مبانی و مفاهیم
  • 42. کوانتیزاسیون پس از آموزش (Post-Training Quantization – PTQ)
  • 43. کوانتیزاسیون آگاه از آموزش (Quantization-Aware Training – QAT)
  • 44. کوانتیزاسیون به فرمت‌های INT8 و INT4
  • 45. فرمت‌های نوین: FP8 و محاسبات با دقت ترکیبی (Mixed-Precision)
  • 46. هرس (Pruning): کاهش اندازه و پیچیدگی مدل
  • 47. هرس ساختاریافته (Structured Pruning) در مقابل هرس بدون ساختار
  • 48. تأثیر هرس بر دقت و سرعت مدل
  • 49. تقطیر دانش (Knowledge Distillation): آموزش مدل‌های کوچک‌تر و سریع‌تر
  • 50. انتخاب مدل معلم (Teacher) و دانش‌آموز (Student)
  • 51. انواع توابع زیان در تقطیر دانش
  • 52. اصلاح معماری مدل برای سرعت بیشتر
  • 53. مکانیزم‌های توجه (Attention) بهینه شده
  • 54. جایگزینی لایه‌های سنگین با معادل‌های سبک و کارآمد
  • 55. فشرده‌سازی وزن‌ها (Weight Compression)
  • 56. فاکتورسازی ماتریس (Matrix Factorization) در لایه‌های مدل
  • 57. معرفی Low-Rank Adaptation (LoRA) و کاربردهای آن
  • 58. استفاده از LoRA و مشتقات آن برای بهینه‌سازی تولید
  • 59. مدل‌های ترکیبی از متخصصین (Mixture of Experts – MoE) برای تولید سریع
  • 60. بهینه‌سازی توکن‌های ورودی (Prompt Engineering for Speed)
  • 61. کش کردن زوج‌های کلید-مقدار (KV Cache) در ترنسفورمرها
  • 62. مدیریت و بهینه‌سازی حافظه KV Cache
  • 63. طراحی مدل‌های مولد کوچک از ابتدا (Small Generative Models)
  • 64. تحلیل توازن بین دقت، سرعت و اندازه مدل (Trade-offs)
  • 65. ارزیابی مدل‌های بهینه‌سازی شده: فراتر از معیارهای استاندارد
  • 66. کامپایل درجا (Just-In-Time – JIT Compilation)
  • 67. معرفی کامپایلرهای یادگیری عمیق: TensorRT, OpenVINO, TVM
  • 68. گراف محاسباتی و بهینه‌سازی‌های آن
  • 69. تکنیک فیوژن لایه‌ها (Layer Fusion)
  • 70. حذف گره‌های غیرضروری در گراف محاسباتی (Dead Code Elimination)
  • 71. بهینه‌سازی عملیات از طریق کتابخانه‌های سطح پایین (cuBLAS, cuDNN)
  • 72. آشنایی با FlashAttention و پیاده‌سازی‌های مشابه
  • 73. فریم‌ورک‌های خدمت‌رسانی (Serving) مدل: NVIDIA Triton
  • 74. فریم‌ورک‌های خدمت‌رسانی مدل: TorchServe و TensorFlow Serving
  • 75. فریم‌ورک‌های تخصصی برای LLMها: vLLM
  • 76. استراتژی‌های دسته‌بندی (Batching): استاتیک و دینامیک
  • 77. پیاده‌سازی دسته‌بندی دینامیک برای حداکثر توان عملیاتی
  • 78. دسته‌بندی پیوسته (Continuous Batching)
  • 79. تکنیک PagedAttention و مدیریت حافظه پویا
  • 80. سریال‌سازی و بارگذاری سریع مدل (ONNX, SafeTensors)
  • 81. بهینه‌سازی پایپ‌لاین‌های پیش‌پردازش و پس‌پردازش داده
  • 82. استفاده از حافظه پین شده (Pinned Memory) برای انتقال سریع‌تر داده
  • 83. جریان‌های CUDA (CUDA Streams) برای هم‌پوشانی محاسبات و ارتباطات
  • 84. پروفایلینگ در سطح فریم‌ورک و کامپایلر
  • 85. مقایسه عملکرد فریم‌ورک‌های مختلف خدمت‌رسانی
  • 86. تولید توزیع‌شده: موازی‌سازی داده‌ها (Data Parallelism)
  • 87. موازی‌سازی تانسور (Tensor Parallelism) برای تولید
  • 88. موازی‌سازی پایپ‌لاین (Pipeline Parallelism) برای مدل‌های بسیار بزرگ
  • 89. ترکیب استراتژی‌های موازی‌سازی (3D Parallelism)
  • 90. روش‌های نمونه‌گیری (Sampling) بهینه: Top-k, Nucleus
  • 91. رمزگشایی سوداگرانه (Speculative Decoding)
  • 92. رمزگشایی به کمک مدل‌های کوچک‌تر (Assisted Generation)
  • 93. بهینه‌سازی تولید برای مدل‌های چندوجهی (Multi-modal)
  • 94. مدیریت صف درخواست‌ها و زمان‌بندی (Request Scheduling)
  • 95. مطالعه موردی: بهینه‌سازی یک مدل زبانی بزرگ (مانند Llama 2)
  • 96. مطالعه موردی: بهینه‌سازی یک مدل انتشاری (مانند Stable Diffusion)
  • 97. مطالعه موردی: استقرار مدل روی دستگاه‌های لبه با منابع محدود
  • 98. مانیتورینگ عملکرد مدل در محیط عملیاتی (Production)
  • 99. روندهای آینده در بهینه‌سازی مدل‌های مولد
  • 100. پروژه نهایی: بهینه‌سازی یک مدل مولد از ابتدا تا انتها

📚 محتوای این محصول آموزشی (پکیج کامل)

💡 این محصول یک نسخهٔ کامل و جامع است

تمامی محتوای آموزشی این کتاب در قالب یک بسته‌ی کامل و یکپارچه ارائه می‌شود و شامل تمام نسخه‌ها و فایل‌های موردنیاز برای یادگیری است.

🎁 محتویات کامل بسته دانلودی

🎯 این بسته یک دورهٔ آموزشی کامل و چندلایه است؛ شامل کتاب‌ها، تمرین‌ها و خودآزمایی .


ℹ️ نکات مهم هنگام خرید

  • این محصول به صورت فایل دانلودی کامل ارائه می‌شود و نسخهٔ چاپی ندارد.
  • توجه: لینک‌های اختصاصی دوره طی حداکثر 24 ساعت پس از ثبت سفارش ارسال می‌شوند.
  • دقت کنید لینک ها به شماره موبایل شما ارسال می شوند. پس در ارائه شماره موبایل صحیح دقت کنید.
  • برای راهنمایی در مورد نحوه دانلود به شماره 09395106248 پیامک دهید یا تماس بگیرید. (ایده آل ترین گزینه ارسال پیام در یکی از پیام رسان ها به همین شماره است تا سریعا لینک های کتاب همانجا برای شما ارسال گردد.)
  • اگر پرداخت انجام شده ولی بعد از 24 ساعت هنوز لینک‌ها را دریافت نکرده‌اید، نام و نام خانوادگی و نام محصول را پیامک کنید تا لینک‌ها دوباره ارسال شوند.

💬 راه‌های ارتباطی پشتیبانی:
واتس‌اپ یا هر پیام رسان داخلی یا پیامک: 09395106248
تلگرام: @ma_limbs

دیدگاهها

هیچ دیدگاهی برای این محصول نوشته نشده است.

اولین نفری باشید که دیدگاهی را ارسال می کنید برای “کتاب بهینه‌سازی مدل‌های مولد برای سرعت تولید”

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *

پیمایش به بالا