AMD оголосила про випуск найшвидшого в світі прискорювача HPC для наукових досліджень

AMD оголосила про випуск найшвидшого в світі прискорювача HPC для наукових досліджень

Прискорювачі AMD Instinct™ MI100 революціонізують високопродуктивні обчислення (HPC) і штучний інтелект завдяки найкращій у галузі продуктивності обчислень ꟷ

Перший GPU-прискорювач із новою архітектурою AMD CDNA, розробленою для епохи екзафлопсних обчислень ꟷ

AMD (NASDAQ: AMD) анонсувала новий прискорювач AMD Instinct™ MI100 найшвидший у світі HPC GPU і перший серверний GPU x86, що подолав бар’єр продуктивності 10 терафлопсів (FP64).1 Підтримувана новими обчислювальними платформами Dell, Gigabyte, HPE і Supermicro, MI100 в поєднанні з CPU AMD EPYC і відкритою програмною платформою ROCm™ 4.0 покликана прискорити нові відкриття, випереджаючи епоху екзафлопсних обчислень.

Побудований на новій архітектурі AMD CDNA, графічний процесор AMD Instinct MI100 забезпечує новий клас прискорених систем для HPC і AI в парі з процесорами AMD EPYC 2-го покоління. MI100 забезпечує пікову продуктивність до 11.5 терафлопса в FP64 для HPC і пікову продуктивність до 46.1 терафлопса в FP32 Matrix для ШІ та машинного навчання2. Завдяки новій технології AMD Matrix Core MI100 також забезпечує майже 7-кратне збільшення теоретичної пікової продуктивності з рухомою комою в FP16 для навчальних навантажень з ШІ порівняно з попереднім поколінням прискорювачів AMD3

«Сьогодні AMD робить великий крок уперед на шляху до екзафлопсних обчислень, представляючи AMD Instinct MI100 найшвидший у світі HPC GPU, — сказав Бред МакКреді, корпоративний віцепрезидент із GPU для ЦОД і прискорених процесорів у AMD. Наш новітній прискорювач у поєднанні з відкритою програмною платформою AMD ROCm призначений для того, щоб надати вченим і дослідникам чудову основу для їхньої роботи в області HPC». 

Відкрита програмна платформа для екзафлопсної ери

Програмне забезпечення AMD ROCm для розробників забезпечує основу для екзафлопсних обчислень. Як набір інструментів із відкритим вихідним кодом, що складається з компіляторів, API і бібліотек програмування, ROCm використовується розробниками екзафлопсних програм для створення високопродуктивних додатків. ROCm 4.0 був оптимізований для забезпечення продуктивності для систем на базі MI100. ROCm 4.0 удосконалив компілятор до відкритого вихідного коду й уніфікував його для підтримки OpenMP® 5.0 і HIP. Фреймворки PyTorch і Tensorflow, оптимізовані для ROCm 4.0, тепер можуть досягати вищої продуктивності з MI1007,8. ROCm 4.0 є останньою пропозицією для розробників додатків HPC, ML і AI, яка дозволяє створювати високопродуктивне портативне програмне забезпечення.

Це цікаво:   AMD анонсує мобільні процесори серії Ryzen PRO 7040 для бізнесу

«Ми отримали ранній доступ до прискорювача MI100, і попередні результати дуже обнадійливі. Зазвичай ми спостерігаємо значний приріст продуктивності, до 2-3 разів порівняно з іншими GPU, сказав Бронсон Мессер (Bronson Messer), директор з науки Oak Ridge Leadership Computing Facility. — Також важливо розуміти, який вплив чинить програмне забезпечення на продуктивність. Той факт, що відкрита програмна платформа ROCm та інструмент розробника HIP мають відкритий вихідний код і працюють на різних платформах, це те, чим ми були абсолютно одержимі відтоді, як ми випустили найпершу гібридну систему на базі CPU/GPU».

Ключові можливості й особливості прискорювача AMD Instinct MI100 включають у себе: 

  • Абсолютно нову архітектуру AMD CDNA створена для основи графічних процесорів AMD в епоху екзафлопсності, архітектура AMD CDNA є серцем прискорювача MI100 та забезпечує виняткову продуктивність і енергоефективність.
  • Провідну продуктивність FP64 і FP32 для робочих навантажень у HPC забезпечує провідну в галузі пікову продуктивність 11,5 TFLOPS для FP64 і 23,1 TFLOPS для FP32, дозволяючи вченим і дослідникам у всьому світі прискорити відкриття в таких галузях, як науки про життя, енергетика, фінанси, наукові дослідження, урядовий і оборонний комплекс тощо.1
  • Абсолютно нову технологію матричного ядра для HPC і ШІ надвисока продуктивність для всього спектра матричних операцій одинарної і змішаної точності, таких як FP32, FP16, bFloat16, Int8 і Int4, сконструйована для прискорення конвергенції HPC і ШІ.
  • Технологію AMD Infinity Fabric™ 2-го покоління Instinct MI100 забезпечує ~2x пікову пропускну здатність однорангового (P2P) входу/виходу порівняно з PCIe® 4.0 із сукупною пропускною спроможністю до 340 ГБ/с на карту з трьома каналами AMD Infinity Fabric™.4 У сервері MI100 GPU можна налаштувати з двома повністю підключеними чотирма кластерами графічних процесорів, кожний з яких забезпечує пропускну здатність до 552 ГБ/с входу/виходу P2P для швидкого обміну даними.4  
  • Надшвидку пам’ять HBM2 має 32 ГБ високошвидкісної пам’яті HBM2 з тактовою частотою 1,2 ГГц і забезпечує ультрависоку пропускну здатність пам’яті 1,23 ТБ/с для підтримки великих наборів даних і усунення вузьких місць при переміщенні даних всередині та зовні пам’яті.5
  • Підтримку новітнього в галузі PCIe® Gen 4.0 створено з використанням новітньої технології PCIe Gen 4.0, що забезпечує пікову теоретичну пропускну здатність до 64 ГБ/с при передачі даних з CPU на GPU6.
Це цікаво:   AMD анонсує FSR 3.1 на GDC24 та випускає AMD Software Adrenalin Edition 24.3.1 із підтримкою Dragon’s Dogma 2

Доступні серверні рішення

До кінця року очікується випуск прискорювачів AMD Instinct MI100 у системах від основних OEM- та ODM-партнерів, у тому числі:

Dell

«Сервери Dell EMC PowerEdge підтримуватимуть новий AMD Instinct MI100, який дозволить швидше аналізувати дані. Це допоможе нашим клієнтам швидше досягати надійніших та ефективніших результатів в області HPC і ШІ, — сказав Раві Пендеканті, старший віцепрезидент PowerEdge Servers, Dell Technologies. Компанія AMD є цінним партнером нашої підтримки розвитку інновацій у ЦОД. Високопродуктивні можливості прискорювачів AMD Instinct природним чином підходять для нашого портфеля серверів PowerEdge AI і HP».

Gigabyte

«Ми раді знову співпрацювати з AMD як стратегічним партнером, який пропонує своїм клієнтам серверне обладнання для високопродуктивних обчислень, — заявив Алан Чен, помічник віцепрезидента GIGABYTE з NCBU. — Прискорювачі AMD Instinct MI100 представляють новий рівень високопродуктивних обчислень у ЦОД, забезпечуючи ширші можливості підключення і пропускну здатність каналу передачі даних для проведення досліджень у галузі енергетики, молекулярної динаміки та поглибленого навчання. З новим прискорювачем у портфелі GIGABYTE наші клієнти можуть розраховувати на підвищення продуктивності в широкому спектрі наукових і промислових високопродуктивних обчислювальних комплексів».

Hewlett Packard Enterprise (HPE)

«Замовники використовують системи HPE Apollo для вирішення широкого спектра складних і ресурсномістких робочих навантажень в області високопродуктивних обчислень (HPC), глибокого навчання й аналітики, — сказав Білл Меннел, віцепрезидент і генеральний директор HPC у HPE. Із представленням нової системи HPE Apollo 6500 Gen10 Plus ми продовжуємо вдосконалювати наше портфоліо для підвищення продуктивності робочих навантажень, підтримуючи новий прискорювач AMD Instinct MI100, який забезпечує ширші можливості підключення й обробки даних, поряд із процесором AMD EPYC™ 2-го покоління. Ми з нетерпінням чекаємо продовження співпраці з AMD, щоб розширити наші пропозиції за рахунок новітніх процесорів і прискорювачів».

Це цікаво:   Останнє оновлення AMD Software: Adrenalin Edition підвищує продуктивність гри Starfield

Supermicro

«Ми раді, що AMD чинить великий вплив на високопродуктивні обчислення за допомогою GPU-прискорювачів AMD Instinct MI100, — сказав Вік Мальяла, старший віцепрезидент із розробки польових додатків і розвитку бізнесу в Supermicro. — Поєднання обчислювальної потужності, отриманої з новою архітектурою CDNA, високої пропускної здатності пам’яті та однорангової смуги пропускання GPU, яку забезпечує MI100, дозволить нашим клієнтам отримати доступ до відмінних рішень, які відповідають їхнім вимогам до прискорених обчислень і критично важливих корпоративних робочих навантажень. AMD Instinct MI100 стане відмінним доповненням для наших мульти-GPU серверів і нашого великого портфеля високопродуктивних систем і серверних блокових рішень».

Технічні характеристики MI100

Кіл-ть обчислювальних блоківКіл-ть потокових процесорівFP64 TFLOPS (в піку)FP32 TFLOPS (в піку k)FP32 Matrix TFLOPS(в піку)FP16/FP16 Matrix
TFLOPS(в піку)
INT4 | INT8 TOPS(в піку)bFloat16 TFLOPs(в піку)Обсяг пам’яті HBM2
ECC
Пропускна спроможність пам’яті
1207680До 11.5До 23.1До 46.1До 184.6До 184.6До 92.3 TFLOPS32GBДо 1.23 TB/s

Допоміжні ресурси


Новини IT » Hardware » AMD оголосила про випуск найшвидшого в світі прискорювача HPC для наукових досліджень

Опубліковано


Останні новини IT: