Флагманский графический процессор NVIDIA GA100 не годится для игр
Представляя ускоритель вычислений A100 в середине мая, NVIDIA подчёркивала, что поставки графических процессоров GA100 с архитектурой Ampere уже начались. Чуть позже была опубликована техническая документация, которая позволяет выяснить некоторые нюансы, учитывающие особенности применения новинки. В частности, для трассировки лучей GA100 не годится, а ведь это является важным атрибутом старших видеокарт NVIDIA.
В этой документации NVIDIA открытым текстом говорит, что в полной конфигурации GA100 содержит восемь вычислительных кластеров, 8192 ядра CUDA, 512 тензорных ядер, шесть стеков памяти HBM2 с 6144-разрядной шиной. В составе ускорителей вычислений NVIDIA A100 используется слегка усечённая версия графического процессора GA100, которая обладает только семью вычислительными кластерами, 6912 ядрами CUDA, 432 тензорными ядрами и пятью стеками HBM2 с 5120-разрядной шиной. Обнаруживается и другая особенность A100 — объём кеш-памяти второго уровня уменьшен с 48 до 40 Мбайт.
Физически все «избыточные» блоки присутствуют на кристалле, они просто отключены. Даже количество стеков памяти типа HBM2 производства Samsung осталось неизменным — на подложке разместились все шесть штук, но один из них не работает. Такая компоновка объясняет, почему при наличии шести стеков памяти её общий объём ограничен 40 Гбайт. Каждый стек содержит 8 Гбайт памяти, но только в полной конфигурации совокупный объём HBM2 может достигать 48 Гбайт. На рынок такая версия GA100 пока не поставляется.
В каждом стеке HBM2 микросхемы памяти расположены в восемь ярусов. Память работает на частоте 1215 МГц, что в совокупности с наличием 5120-разрядной шины обеспечивает пропускную способность 1555 Гбайт/с. Это более чем в 1,7 раза выше, чем у Tesla V100 (Volta).
В составе графического процессора GA100 нет так называемых RT-ядер, которые отвечают за ускорение отрисовки графики методом трассировки лучей. Это говорит о том, что на игровой рынок путь GA100 заказан. NVIDIA придётся разработать отдельные графические процессоры с архитектурой Ampere для применения в игровом сегменте. Частота графического процессора GA100 в его нынешнем виде ограничена 1410 МГц. Вычислительный модуль в исполнении SXM4 рассчитан на TDP до 400 Вт, в серверном шасси он способен охлаждаться воздушной системой, но по сравнению с предшественниками в радиаторе пришлось значительно увеличить количество тепловых трубок.
Источник
В этой документации NVIDIA открытым текстом говорит, что в полной конфигурации GA100 содержит восемь вычислительных кластеров, 8192 ядра CUDA, 512 тензорных ядер, шесть стеков памяти HBM2 с 6144-разрядной шиной. В составе ускорителей вычислений NVIDIA A100 используется слегка усечённая версия графического процессора GA100, которая обладает только семью вычислительными кластерами, 6912 ядрами CUDA, 432 тензорными ядрами и пятью стеками HBM2 с 5120-разрядной шиной. Обнаруживается и другая особенность A100 — объём кеш-памяти второго уровня уменьшен с 48 до 40 Мбайт.
Физически все «избыточные» блоки присутствуют на кристалле, они просто отключены. Даже количество стеков памяти типа HBM2 производства Samsung осталось неизменным — на подложке разместились все шесть штук, но один из них не работает. Такая компоновка объясняет, почему при наличии шести стеков памяти её общий объём ограничен 40 Гбайт. Каждый стек содержит 8 Гбайт памяти, но только в полной конфигурации совокупный объём HBM2 может достигать 48 Гбайт. На рынок такая версия GA100 пока не поставляется.
В каждом стеке HBM2 микросхемы памяти расположены в восемь ярусов. Память работает на частоте 1215 МГц, что в совокупности с наличием 5120-разрядной шины обеспечивает пропускную способность 1555 Гбайт/с. Это более чем в 1,7 раза выше, чем у Tesla V100 (Volta).
В составе графического процессора GA100 нет так называемых RT-ядер, которые отвечают за ускорение отрисовки графики методом трассировки лучей. Это говорит о том, что на игровой рынок путь GA100 заказан. NVIDIA придётся разработать отдельные графические процессоры с архитектурой Ampere для применения в игровом сегменте. Частота графического процессора GA100 в его нынешнем виде ограничена 1410 МГц. Вычислительный модуль в исполнении SXM4 рассчитан на TDP до 400 Вт, в серверном шасси он способен охлаждаться воздушной системой, но по сравнению с предшественниками в радиаторе пришлось значительно увеличить количество тепловых трубок.