AMD анонсира графичния ускорител AMD Instinct MI100, който според компанията е най-бързия по рода си в света. Той е предназначен високопроизводителни изчислителни среди (НРС) и е първият x86 сървърен GPU, който преминава бариерата от 10 терафлопа (FP64) производителност.
AMD Instinct MI100 е изграден по новата AMD CDNA архитектура. Той предлага до 11,5 TFLOPS върхова производителност в изчисленията с плаваща запетая с двойна точност (FP64) за HPC среди и до 46,1 TFLOPS върхова производителност при изчисления с плаваща запетая с единична точност (FP32) за платформи с изкуствен интелект (ИИ) и машинно самообучение. С новата AMD Matrix Core технология MI100 вдига почти 7-кратно теоретичната производителност при FP16 изчисления (изчисления с половин точност) за ИИ обучителни задачи, в сравнение с предишното поколение ускорители на компанията.
Софтуерът за разработчици ROCm (RadeonOpenCompute) пък AMD дава основата за "exascale" изчислителните среди. Като набор от инструменти с отворен код, съставен от компайлери, приложни интерфейси за програмиране (API) и библиотеки, ROCm се използва от разработчиците на софтуер за създаване на високопроизводителни приложения. ROCm 4.0 е оптимизиран да предложи мащабна производителност за MI100-базираните системи. В ROCm 4.0 е ъпгрейднат компайлера да бъде с отворен код и унифициран за поддръжка на OpenMP 5.0 и на HIP. PyTorch и Tensorflow платформите, които са оптимизирани с ROCm 4.0, сега могат да постигнат по-висока производителност с MI100. ROCm 4.0 е най-новото предложение за разработчиците на приложения за HPC, машинно обучение и изкуствен интелект, което им позволява да създават високопроизводителен, преносим софтуер.
"Ние получихме ранен достъп до ускорителя MI100 и първоначалните резултати са много окуражаващи. Виждаме значителни повишения на производителността, до 2-3 пъти в сравнение с други GPU, каза Бронсън Месер, научен изчислителната инсталация в Оук Ридж. Важно е да разберем какво е въздействието, което софтуерът има върху производителността. Отворената софтуерна платформа ROCm и инструментът за разработчици HIP са с отворен код и работят на голямо разнообразие от платформи, и ние сме големи привърженици на този вид средства откакто създадохме първата хибридна CPU/GPU система."
Ускорителите AMD Instinct MI100 се очакват към края на годината в системи от големите ОЕМ производители и ODM партньори в корпоративните пазари, сред които Dell, Gigabyte, Hewlett Packard Enterprise (HPE), Supermicro.
AMD анонсира графичния ускорител AMD Instinct MI100, който според компанията е най-бързия по рода си в света. Той е предназначен високопроизводителни изчислителни среди (НРС) и е първият x86 сървърен GPU, който преминава бариерата от 10 терафлопа (FP64) производителност.
AMD Instinct MI100 е изграден по новата AMD CDNA архитектура. Той предлага до 11,5 TFLOPS върхова производителност в изчисленията с плаваща запетая с двойна точност (FP64) за HPC среди и до 46,1 TFLOPS върхова производителност при изчисления с плаваща запетая с единична точност (FP32) за платформи с изкуствен интелект (ИИ) и машинно самообучение. С новата AMD Matrix Core технология MI100 вдига почти 7-кратно теоретичната производителност при FP16 изчисления (изчисления с половин точност) за ИИ обучителни задачи, в сравнение с предишното поколение ускорители на компанията.