ابر تراشه WSE 3 با ۴ تریلیون ترانزیستور معرفی شد؛ 20 برابر قویتر از انویدیا H100
یک استارتاپ هوش مصنوعی به نام Cerebras Systems به تازگی از تراشه غول پیکر Wafer Scale Engine 3 رونمایی کرده است که با ۴۴ گیگابایت حافظه کش SRAM دیگر نیازی به استفاده از حافظه رم ندارد. در ادامه بررسی این ابر تراشه با شهر سختافزار همراه باشید.
بازار هوش مصنوعی این روزها به شدت داغ شده و در حالی که تراشههای هوش مصنوعی انویدیا در زمینه آموزش (Training) مدلهای هوش مصنوعی تقریباً بدون رقیب هستند، تلاشها برای ساخت چیپهای بهینهتر در زمینه استنتاج (Inference) یا اجرای مدلها برای کاربردهای عملیاتی ادامه دارد.
در همین راستا استارتاپ Cerebras Systems واقع در ایالت کالیفرنیای آمریکا به تازگی از نسل سوم ابر تراشه Wafer Scale Engine خود که با هدف اجرای هر چه بهتر مدلهای هوش مصنوعی بهینه شده است، رونمایی کرد.
مشخصات تراشه WSE-3
محصول جدید Cerebras Systems یک تراشه معمولی نیست. WSE نسل سوم ۵۷ برابر از بزرگترین تراشه GPU ساخته شده تا کنون مساحت بیشتری دارد. تعداد هستههای محاسباتی این چیپ هم 52 بار از بزرگترین پردازندههای گرافیکی ساخته شده بیشتر است.
یکی از مشکلات مهم در اجرای برنامههای هوش مصنوعی، پهنای باند حافظه است. مشکلی که Cerebras تلاش کرده با گنجاندن ۴۴ گیگابایت حافظه فوق سریع SRAM روی تراشه WSE 3 آن را حل کند.
جالب آنکه هر یک از ۹۰۰،۰۰۰ هسته پردازشی WSE 3 به طور جداگانه قابل برنامهریزی هستند و برای اجرای عملیات تنسوری که اساس کار شبکههای عصبی عمیق را تشکیل میدهند بهینهسازی شده اند.
با برطرف شدن مشکل پهنای باند حافظه در کنار تعداد سرسامآور هستههای این پردازنده، جدیدترین محصول Cerebras توانسته به رکورد پردازش 1800 توکن بر ثانیه در اجرای مدل هوش مصنوعی LIama 3.1 8B و 450 توکن بر ثانیه در مدل LIama 3.1 70B برسد.
مقایسه با تراشههای انویدیا
همانطور که پیش از این گفتیم، تراشههای هوش مصنوعی انویدیا به گونهای ساخته شدهاند که بتوانند انعطاف لازم برای اجرای انواع مدلهای هوش مصنوعی از جمله آموزش مدلها و اجرای آنها بعد از آموزش را داشته باشند.
|
WSE-3
|
Nvidia H100
|
میزان برتری Cerebras
|
---|---|---|---|
مساحت تراشه (میلیمتر مربع)
|
46،225
|
826
|
57 برابر
|
تعداد هستهها
|
900،000
|
16،896 هسته FP32 + 528 هسته تنسور
|
52 برابر
|
حافظه روی تراشه
|
44 گیگابایت
|
0.05 گیگابایت
|
880 برابر
|
پهنای باند حافظه
|
21 پتابایت برثانیه
|
0.003 پتابایت برثانیه
|
7،000 برابر
|
پهنای باند شبکه ارتباطی روی تراشه (Fabric)
|
214 پتابایت برثانیه
|
0.0576 پتابایت برثانیه
|
۳،715 برابر
|
از سوی دیگر، محصول جدید Cerebras تنها با هدف انجام عملیات استنتاج و کاهش هزینههای خدمات ابری هوش مصنوعی توسعه یافته است. بنابر ادعای Cerebras Systems، به ازای هر کاربر ۲۲ برابر عملکرد سریعتری داشته و هزینهی خدمات هوش مصنوعی را ۸۰ درصد کاهش میدهد.
با توجه به این اطلاعات به نظر میرسد که هرچند WSE 3 میتواند در زمینه اجرای مدلهای از پیش آموزش دیده هوش مصنوعی، رقیب در خوری برای انویدیا H100 باشد. اما از نظر انعطاف و قابلیت اجرای طیف گستردهتری از برنامههای هوش مصنوعی، انویدیا هنوز حاکم بلامنازع بازار به شمار میرود.
در همین رابطه بخوانید:
– ابررایانهای در ابعاد یک کارت گرافیک؛ شتابدهنده Thunderbird با 6144 هسته RISC-V
– تولید نخستین تراشه هوش مصنوعی OpenAI با فناوری 1.6 نانومتری TSMC
نظر شما دربارهی رقبای جدید تراشههای هوش مصنوعی انویدیا چیست؟
منبع: https://www.shahrsakhtafzar.com/fa/news/graphic-card/52494-ceberus-ai-4-trillion-transistor-chip