تسلا ابررایانه هوش مصنوعی خود را ارتقا داده و به هزاران پردازنده گرافیکی Nvidia A100 مجهز کرده است. ابررایانه این شرکت اکنون به یکی از 7 سوپرکامپیوترهای جهان از نظر تعداد GPUهای بهکار رفته در آن با 7360 پردازنده گرافیکی A100 محسوب میشود.
پردازنده گرافیکی A100 انویدیا یک راه حل قدرتمند مبتنی بر معماری Ampere برای مراکز داده محسوب میشود. پردازنده گرافیکی A100 با 80 گیگابایت حافظه HBM2e، پهنای باندی معادل 2 ترابایت بر ثانیه ارائه داده و توان مصرفی آن به 400 وات میرسد.
DGX A100 اولین غول گرافیکی انویدیا محسوب میشود که از هشت پردازنده گرافیکی A100 بهره برده و پهنای باند 4.8 ترابایت بر ثانیه را ارائه میدهد و ابررایانه هوش مصنوعی تسلا اکنون دارای 7360 عدد از این پردازنده ها است.
تسلا قدرت ابررایانه هوش مصنوعی خود را به طور عمومی محک نزده است. اما HPC Wire با استفاده از دادههای سایر ابررایانههای مجهز به جی پی یو A100 تخمین زده که ابررایانه هوش مصنوعی Tesla به توان پردازشی حدود 100 پتافلاپ دست خواهد یافت.
البته تسلا قصد ندارد به استفاده از پردازندههای انویدیا برای ابررایانه های هوش مصنوعی خود ادامه دهد. این شرکت در حال توسعه قوی ترین پردازنده هوش مصنوعی خود با نام Tesla D1 Dojo است که یک سال پیش معرفی شده بود.
این پردازنده توسط شرکت TSMC و با لیتوگرافی ۷ نانومتری ساخته شده و چیزی بیش از ۵۰ میلیارد ترانزیستور را درون خود جای داده و ابعاد آن برابر ۶۴۵ میلیمتر مربع است.
تراشه D1 حرفهای زیادی برای گفتن دارد و میتواند تا ۳۶۲ ترافلاپس وظیفه را با دقت FP16/CFP8 یا حدود ۲۲٫۵ ترافلاپس وظیفه با دقت FP32 به انجام برساند. در صورتیکه این ادعا درست باشد، تراشه جدید تسلا، قدرتمندترین تراشه انویدیا را پشت سر خواهد گذاشت. در حال حاضر پردازنده گرافیکی A100 Ampere انویدیا میتواند ۳۱۲ ترافلاپس وظیفه با دقت FP16 را به انجام برساند.
با نگاهی به سطح سیلیکونی میتوان دریافت که تسلا یک شبکه متشکل از واحدهای عملکرد یا همان FU طراحی کرده که به هم متصل شدهاند تا این پردازنده بزرگ را تشکیل بدهند.
البته هر کدام از این واحدهای عملکرد دارای یک پردازنده ۶۴ بیتی با ۱.۲۵ مگابایت حافظه محلی SRAM بوده که برای انتقال، جمعآوری و پخش و ارتباط پیمایشها طراحی شده است.
هر FU میتواند در محاسبات BF16 یا CFP8 قدرتی برابر ۱ ترافلاپس و برای محاسبات FP32 قدرتی برابر ۶۴ گیگافلاپس داشته باشد. پهنای باند آن هم در هر جهت به ۵۱۲ گیگابایت بر ثانیه میرسد. در حالت کلی طراحی آن به گونهای است که تاخیر را کاهش و عملکرد را افزایش میدهد.