قدرتنمایی تراشه M5 اپل در اجرای مدلهای هوش مصنوعی؛ 4 برابر سریعتر از M4

اپل با انتشار گزارشی قدرت تراشههای M5 را به رخ رقبا کشیده و توانایی پردازندهاش را در اجرای مدلهای زبانی بزرگ به نمایش گذاشته است. ظاهراً عملکرد پردازنده M5 متحول شده و حدود 4 برابر سریعتر از تراشه M4 است. جزئیات بیشتر را در . بخوانید.
اپل در تازهترین گزارش تحقیقاتی خود، قدرت واقعی تراشه M5 را در اجرای مدلهای زبانی بزرگ به نمایش گذاشته است. این گزارش براساس فریمورک متنباز MLX تهیه شده و نشان میدهد مکبوکهای مجهز به M5 در پردازشهای سنگین هوش مصنوعی، جهشی چشمگیر نسبت به نسل قبل تجربه میکنند.
اپل مدعی شده که تراشه M5 در بنچمارک زمان موردنیاز تا تولید اولین توکن یا همان TTFT کاملاً متحول شده و بین 3.3 تا 4.1 برابر سریعتر از M4 عمل میکند. TTFT همان لحظهای است که کاربر دکمه اینتر را فشار میدهد و مدل هوش مصنوعی شروع به تولید متن میکند؛ فرایندی بسیار سنگین که به محاسبات ماتریسی وابسته است.
برای سرعتبخشیدن به این مرحله، اپل شتابدهندههای عصبی جدیدی را در GPU تراشه M5 قرار داده که وظیفه پردازش اختصاصی ضرب ماتریسها را برعهده دارند. دادههای منتشرشده اپل نشان میدهد مدل Qwen 14B زمان پردازش را از 35.15 ثانیه در M4 به 8.66 ثانیه در M5 رسانده که معادل سرعتی حدود 4.1 برابر بیشتر است.
مدل Qwen 8B نیز از 18.6 ثانیه به 4.69 ثانیه رسیده و حدود 4 برابر سریعتر عمل میکند. در نهایت مدل حجیم Qwen 30B که بار محاسباتی بسیار سنگینی دارد، از 9.37 ثانیه به 2.66 ثانیه کاهش یافته و حدود 3.5 برابر سریعتر شده است.
مجموعه این دادهها نشان میدهد تأخیر آزاردهنده هنگام اجرای مدلهای لوکال روی لپتاپ تا حد زیادی حذف شده است. در مرحله بعد، یعنی تولید کامل پاسخ، محدودیت اصلی به سرعت حافظه برمیگردد.
بر اساس گزارش 9to5mac تراشه M5 با پهنای باند 153 گیگابایت بر ثانیه فرآیند انتقال دادهها را حدود 28 درصد سریعتر از M4 انجام میدهد. نتیجه این افزایش بهبود 19 تا 27 درصدی سرعت تولید متن در آزمونها بوده است.
جدول زیر نتایج دقیق اندازهگیریها روی مکبوک پرو مجهز به 24 گیگابایت رم را نسبت به تراشه M4 نشان میدهد:
| مدل هوش مصنوعی | بنچمارک TTFT | سرعت تولید متن | مصرف حافظه (GB) |
|---|---|---|---|
| Qwen3-1.7B | 3.57 برابر | 1.27 برابر | 4.40 |
| Qwen3-8B | 3.62 برابر | 1.24 برابر | 17.46 |
| Qwen3-8B | 3.97 برابر | 1.24 برابر | 5.61 |
| Qwen3-14B | 4.06 برابر | 1.19 برابر | 9.16 |
| GPT-OSS 20B | 3.33 برابر | 1.24 برابر | 12.08 |
| Qwen3-30B (MoE) | 3.52 برابر | 1.25 برابر | 17.31 |
نکته قابلتوجه این است که مکبوک پرو مجهز به M5 و 24 گیگابایت رم توانسته مدل سنگین 30 میلیارد پارامتری را تنها با 17.31 گیگابایت حافظه اجرا کند و همچنان فضای کافی برای سیستمعامل باقی نگه دارد.
منبع: https://www.shahrsakhtafzar.com/fa/news/cpus/58628-m5-runs-local-llms-compared-to-the-m4