AMD оголосила про випуск найшвидшого в світі прискорювача HPC для наукових досліджень

ꟷ Прискорювачі AMD Instinct™ MI100 революціонізують високопродуктивні обчислення (HPC) і штучний інтелект завдяки найкращій у галузі продуктивності обчислень ꟷ

ꟷ Перший GPU-прискорювач із новою архітектурою AMD CDNA, розробленою для епохи екзафлопсних обчислень ꟷ

AMD (NASDAQ: AMD) анонсувала новий прискорювач AMD Instinct™ MI100 — найшвидший у світі HPC GPU і перший серверний GPU x86, що подолав бар’єр продуктивності 10 терафлопсів (FP64).¹ Підтримувана новими обчислювальними платформами Dell, Gigabyte, HPE і Supermicro, MI100 в поєднанні з CPU AMD EPYC і відкритою програмною платформою ROCm™ 4.0 покликана прискорити нові відкриття, випереджаючи епоху екзафлопсних обчислень.

Побудований на новій архітектурі AMD CDNA, графічний процесор AMD Instinct MI100 забезпечує новий клас прискорених систем для HPC і AI в парі з процесорами AMD EPYC 2-го покоління. MI100 забезпечує пікову продуктивність до 11.5 терафлопса в FP64 для HPC і пікову продуктивність до 46.1 терафлопса в FP32 Matrix для ШІ та машинного навчання². Завдяки новій технології AMD Matrix Core MI100 також забезпечує майже 7-кратне збільшення теоретичної пікової продуктивності з рухомою комою в FP16 для навчальних навантажень з ШІ порівняно з попереднім поколінням прискорювачів AMD³.

«Сьогодні AMD робить великий крок уперед на шляху до екзафлопсних обчислень, представляючи AMD Instinct MI100 — найшвидший у світі HPC GPU, — сказав Бред МакКреді, корпоративний віцепрезидент із GPU для ЦОД і прискорених процесорів у AMD. — Наш новітній прискорювач у поєднанні з відкритою програмною платформою AMD ROCm призначений для того, щоб надати вченим і дослідникам чудову основу для їхньої роботи в області HPC».

Відкрита програмна платформа для екзафлопсної ери

Програмне забезпечення AMD ROCm для розробників забезпечує основу для екзафлопсних обчислень. Як набір інструментів із відкритим вихідним кодом, що складається з компіляторів, API і бібліотек програмування, ROCm використовується розробниками екзафлопсних програм для створення високопродуктивних додатків. ROCm 4.0 був оптимізований для забезпечення продуктивності для систем на базі MI100. ROCm 4.0 удосконалив компілятор до відкритого вихідного коду й уніфікував його для підтримки OpenMP® 5.0 і HIP. Фреймворки PyTorch і Tensorflow, оптимізовані для ROCm 4.0, тепер можуть досягати вищої продуктивності з MI100^7,8. ROCm 4.0 є останньою пропозицією для розробників додатків HPC, ML і AI, яка дозволяє створювати високопродуктивне портативне програмне забезпечення.

Це цікаво: AMD анонсує мобільні процесори серії Ryzen PRO 7040 для бізнесу

«Ми отримали ранній доступ до прискорювача MI100, і попередні результати дуже обнадійливі. Зазвичай ми спостерігаємо значний приріст продуктивності, до 2-3 разів порівняно з іншими GPU, — сказав Бронсон Мессер (Bronson Messer), директор з науки Oak Ridge Leadership Computing Facility. — Також важливо розуміти, який вплив чинить програмне забезпечення на продуктивність. Той факт, що відкрита програмна платформа ROCm та інструмент розробника HIP мають відкритий вихідний код і працюють на різних платформах, це те, чим ми були абсолютно одержимі відтоді, як ми випустили найпершу гібридну систему на базі CPU/GPU».

Ключові можливості й особливості прискорювача AMD Instinct MI100 включають у себе:

Абсолютно нову архітектуру AMD CDNA — створена для основи графічних процесорів AMD в епоху екзафлопсності, архітектура AMD CDNA є серцем прискорювача MI100 та забезпечує виняткову продуктивність і енергоефективність.
Провідну продуктивність FP64 і FP32 для робочих навантажень у HPC — забезпечує провідну в галузі пікову продуктивність 11,5 TFLOPS для FP64 і 23,1 TFLOPS для FP32, дозволяючи вченим і дослідникам у всьому світі прискорити відкриття в таких галузях, як науки про життя, енергетика, фінанси, наукові дослідження, урядовий і оборонний комплекс тощо.¹
Абсолютно нову технологію матричного ядра для HPC і ШІ — надвисока продуктивність для всього спектра матричних операцій одинарної і змішаної точності, таких як FP32, FP16, bFloat16, Int8 і Int4, сконструйована для прискорення конвергенції HPC і ШІ.
Технологію AMD Infinity Fabric™ 2-го покоління — Instinct MI100 забезпечує ~2x пікову пропускну здатність однорангового (P2P) входу/виходу порівняно з PCIe® 4.0 із сукупною пропускною спроможністю до 340 ГБ/с на карту з трьома каналами AMD Infinity Fabric™.⁴ У сервері MI100 GPU можна налаштувати з двома повністю підключеними чотирма кластерами графічних процесорів, кожний з яких забезпечує пропускну здатність до 552 ГБ/с входу/виходу P2P для швидкого обміну даними.⁴
Надшвидку пам’ять HBM2 — має 32 ГБ високошвидкісної пам’яті HBM2 з тактовою частотою 1,2 ГГц і забезпечує ультрависоку пропускну здатність пам’яті 1,23 ТБ/с для підтримки великих наборів даних і усунення вузьких місць при переміщенні даних всередині та зовні пам’яті.⁵
Підтримку новітнього в галузі PCIe® Gen 4.0 — створено з використанням новітньої технології PCIe Gen 4.0, що забезпечує пікову теоретичну пропускну здатність до 64 ГБ/с при передачі даних з CPU на GPU⁶.

Це цікаво: AMD анонсує FSR 3.1 на GDC24 та випускає AMD Software Adrenalin Edition 24.3.1 із підтримкою Dragon’s Dogma 2

Доступні серверні рішення

До кінця року очікується випуск прискорювачів AMD Instinct MI100 у системах від основних OEM- та ODM-партнерів, у тому числі:

Dell

«Сервери Dell EMC PowerEdge підтримуватимуть новий AMD Instinct MI100, який дозволить швидше аналізувати дані. Це допоможе нашим клієнтам швидше досягати надійніших та ефективніших результатів в області HPC і ШІ, — сказав Раві Пендеканті, старший віцепрезидент PowerEdge Servers, Dell Technologies. — Компанія AMD є цінним партнером нашої підтримки розвитку інновацій у ЦОД. Високопродуктивні можливості прискорювачів AMD Instinct природним чином підходять для нашого портфеля серверів PowerEdge AI і HP».

Gigabyte

«Ми раді знову співпрацювати з AMD як стратегічним партнером, який пропонує своїм клієнтам серверне обладнання для високопродуктивних обчислень, — заявив Алан Чен, помічник віцепрезидента GIGABYTE з NCBU. — Прискорювачі AMD Instinct MI100 представляють новий рівень високопродуктивних обчислень у ЦОД, забезпечуючи ширші можливості підключення і пропускну здатність каналу передачі даних для проведення досліджень у галузі енергетики, молекулярної динаміки та поглибленого навчання. З новим прискорювачем у портфелі GIGABYTE наші клієнти можуть розраховувати на підвищення продуктивності в широкому спектрі наукових і промислових високопродуктивних обчислювальних комплексів».

Hewlett Packard Enterprise (HPE)

«Замовники використовують системи HPE Apollo для вирішення широкого спектра складних і ресурсномістких робочих навантажень в області високопродуктивних обчислень (HPC), глибокого навчання й аналітики, — сказав Білл Меннел, віцепрезидент і генеральний директор HPC у HPE. — Із представленням нової системи HPE Apollo 6500 Gen10 Plus ми продовжуємо вдосконалювати наше портфоліо для підвищення продуктивності робочих навантажень, підтримуючи новий прискорювач AMD Instinct MI100, який забезпечує ширші можливості підключення й обробки даних, поряд із процесором AMD EPYC™ 2-го покоління. Ми з нетерпінням чекаємо продовження співпраці з AMD, щоб розширити наші пропозиції за рахунок новітніх процесорів і прискорювачів».

Це цікаво: Останнє оновлення AMD Software: Adrenalin Edition підвищує продуктивність гри Starfield

Supermicro

«Ми раді, що AMD чинить великий вплив на високопродуктивні обчислення за допомогою GPU-прискорювачів AMD Instinct MI100, — сказав Вік Мальяла, старший віцепрезидент із розробки польових додатків і розвитку бізнесу в Supermicro. — Поєднання обчислювальної потужності, отриманої з новою архітектурою CDNA, високої пропускної здатності пам’яті та однорангової смуги пропускання GPU, яку забезпечує MI100, дозволить нашим клієнтам отримати доступ до відмінних рішень, які відповідають їхнім вимогам до прискорених обчислень і критично важливих корпоративних робочих навантажень. AMD Instinct MI100 стане відмінним доповненням для наших мульти-GPU серверів і нашого великого портфеля високопродуктивних систем і серверних блокових рішень».

Технічні характеристики MI100

Кіл-ть обчислювальних блоків	Кіл-ть потокових процесорів	FP64 TFLOPS (в піку)	FP32 TFLOPS (в піку k)	FP32 Matrix TFLOPS(в піку)	FP16/FP16 Matrix TFLOPS(в піку)	INT4 \| INT8 TOPS(в піку)	bFloat16 TFLOPs(в піку)	Обсяг пам’яті HBM2 ECC	Пропускна спроможність пам’яті
120	7680	До 11.5	До 23.1	До 46.1	До 184.6	До 184.6	До 92.3 TFLOPS	32GB	До 1.23 TB/s

Допоміжні ресурси

Дізнайтеся більше про прискорювачі AMD Instinct™
Детальніше про рішення AMD для високопродуктивних обчислень
AMD HPC Solutions Hub
Дізнайтеся більше про AMD CDNA
Дізнайтеся більше про процесор AMD EPYC™ 2-го покоління
Станьте прихильником AMD на Facebook
Слідкуйте за новинами AMD у Twitter

AMD оголосила про випуск найшвидшого в світі прискорювача HPC для наукових досліджень

Lenovo Advances Focus on Customer Security with new AI-powered Cyber Resiliency as a Service

Стабільний зв’язок та розвиток smart city: Київщина та Vodafone підписали меморандум про співпрацю

LG збільшує свою присутність в Європі завдяки виставці кухонних рішень на MDW 2024

Підтримка екології та зниження витрат на електроенергію: програмне забезпечення для бізнесу Intelligent Power Manager від Eaton

Штучний інтелект та промисловість: які переваги надає ШІ для галузі?