انویدیا در حال برنامه ریزی برای عرضه کارتهای گرافیک نسل بعدی سری RTX 40 خود در نیمه دوم سال است. در همین رابطه به تازگی شایعاتی حاوی تاریخ دقیقتر و مشخصات جزئیتر این سری منتشر شده است که در ادامه به مرور آنها میپردازیم.
این پردازندههای گرافیکی که بر اساس ریزمعماری Ada Lovelace و فناوری ساخت N5 نانومتری TSMCتولید میشوند، تقریباً عملکردی 2 برابر بهتر از کارتهای گرافیک سری RTX 30 فعلی با ریزمعماری Ampere در بخش رهگیری پرتو یا همان ریتریسینگ ارائه میدهند.
به گفتهی لیکر مشهور، Greymon55، انویدیا نسل بعدی کارتهای GeForce خود را با مدلهای RTX 4080 و 4090 در ماه سپتامبر 2022 (شهریور 1401) عرضه خواهد کرد.
با تکیه بر گزارشهای فعلی، کارت گرافیکRTX 4080 باید دارای 16 گیگابایت حافظه GDDR6X با سرعت 21 گیگابیت بر ثانیه باشد، در حالی که RTX 4090 نیز احتمالاً بین 20 تا 30 گیگابایت حافظه GDDR6X را به همراه دارد. از نظر مشخصات فنی، انتظار میرود شاهد 18432 هسته FP32 در این سری باشیم.
از طرفی، شایعه شده است که پرچمدار این سری یعنی AD102 دارای 144 واحدSM است که در 12 GPC توزیع شدهاند؛ این موضوع منجر به افزایش بار محاسباتی خام بیش از 2.5 برابر (90 ترافلاپ) نسبت به مدل GA102 میشود که موجب خواهد شد هسته آن در فرکانسی نزدیک به 2 گیگاهرتز کار کند.
گذرگاه RTX 4080 و 4090 نیز باید مانند نسخههای قبلی این مجموعه (384 بیتی و 320 بیتی) باشد و با تراشههای GDDR6X سریعتری از قبل جفت شود که نتیجه آن پهنای باند حافظه بالاتر خواهد بود.
طبق گفته Greymon55، کارتهای گرافیک RTX 4070، RTX 4080، RTX 4090 مبتنی بر ریزمعماری Lovelace، به همراه هم خانوادههایشان، اساساً مدل کوچکسازی شده نسخههای قبلی سری RTX 30 با فناری ساخت 5 نانومتری N5 خواهند بود.
ظاهراً انویدیا قصد دارد اندازه آن را به نزدیک به 900 میلیمتر مربع افزایش داده و بیش از 18000 هسته FP32 ALU یا CUDA را در قالب مدل AD102 رده بالا ارائه دهد.
همچنین عملکرد فناوری رهگیری پرتو در این مدل،، توجه ویژهای را به خود جلب خواهد کرد زیرا بازیهای جدید بیشتری از این فناوری استفاده میکنند. بنا بر شایعات میتوان انتظار داشت که هستههای RT این دستگاه دو برابر شوند یا بهینهسازی درجه ماتریس پراکنده به طور قابل توجهی قابلیتهای ری تریسینگ را افزایش دهد.
علاوه بر اینها همانطور که قبلاً ذکر شد، واحدSM تقریباً به طور حتم از نظر تعداد ALU و پارتیشن بندی یک کاهش اندک را نسبت به قبل دریافت میکند. جدای از این، چیز زیادی در مورد دستگاه وجود ندارد که تغییر کند. هستههای Tensor باید کم و بیش بدون تغییر باقی بمانند، شاید حتی کمی کاهش یابند.
این تمرکز مطلق بر تراکم بخش محاسباتی و عملکرد رهگیری پرتو چیزی است که احتمالاً علیرغم استفاده از نود 5 نانومتری TSMC، مصرف برق RTX 4080/4090 را به بیش از 500 وات افزایش میدهد.