Akselerator AMD Instinct MI300X Dukung Beban Kerja Layanan Microsoft Azure OpenAI dan Azure ND MI300X V5 VM Terbaru

  • Instans Azure ND MI300X V5 terbaru kini tersedia bagi publik, dengan Hugging Face sebagai pelanggan pertama
  • Microsoft menggunakan VM bertenaga software AMD Instinct MI300X dan ROCm untuk harga/kinerja terdepan untuk beban kerja GPT

SANTA CLARA, California — 21 May 2024 — Hari ini pada gelaran Microsoft Build, AMD (NASDAQ: AMD) memamerkan kemampuan komputasi dan software end-to-end terbarunya untuk pelanggan dan pengembang Microsoft. Dengan menggunakan solusi AMD seperti akselerator AMD Instinct™ MI300X, open software ROCm™, prosesor dan software AI Ryzen™, dan akselerator media Alveo™ MA35D, Microsoft mampu menyediakan rangkaian alat canggih untuk penerapan berbasis AI di berbagai pasar. Mesin virtual (VM) Microsoft Azure ND MI300X yang baru kini tersedia secara umum, memberikan pelanggan seperti Hugging Face, akses ke kinerja dan efisiensi yang mengesankan untuk beban kerja AI yang paling menuntut.

“Software AMD Instinct MI300X dan ROCm mendukung layanan Azure OpenAI Chat GPT 3.5 dan 4, yang merupakan salah satu beban kerja AI yang paling menuntut di dunia,” ujar Victor Peng, president, AMD. “Dengan ketersediaan umum mesin virtual baru dari Azure, pelanggan AI memiliki akses yang lebih luas ke MI300X untuk memberikan solusi berkinerja tinggi dan efisien untuk aplikasi AI.”

“Microsoft dan AMD memiliki sejarah panjang dalam bermitra di berbagai platform komputasi: pertama PC, kemudian silikon khusus untuk Xbox, HPC, dan sekarang AI,” kata Kevin Scott, chief technology officer and executive vice president of AI, Microsoft. “Selama beberapa waktu terakhir, kami menyadari pentingnya menggabungkan hardware komputasi yang kuat dengan optimasi sistem dan software yang diperlukan untuk memberikan kinerja dan nilai AI yang luar biasa. Bersama AMD, kami telah mencapai hal ini melalui penggunaan ROCm dan MI300X, memberdayakan pelanggan dan pengembang AI Microsoft untuk mencapai hasil kinerja harga yang luar biasa untuk model frontier paling canggih dan intensif komputasi. Kami berkomitmen pada kolaborasi kami dengan AMD untuk terus mendorong kemajuan AI.”

Memajukan AI di Microsoft

Sebelumnya diumumkan dalam preview pada November 2023, seri VM Azure ND MI300x v5 kini tersedia di wilayah Kanada Tengah bagi pelanggan untuk menjalankan beban kerja AI mereka. Menawarkan kinerja terdepan di industri, VM ini memberikan kapasitas HBM dan bandwidth memori yang mengesankan, memungkinkan pelanggan untuk memasukkan model yang lebih besar ke dalam memori GPU dan/atau menggunakan lebih sedikit GPU, yang pada akhirnya membantu menghemat daya, biaya, dan waktu dalam penyelesaian solusi.

VM ini dan software ROCm™ yang mendukungnya, juga digunakan untuk beban kerja Azure AI Production, termasuk Azure OpenAI Service, yang memberi pelanggan akses ke model GPT-3.5 dan GPT-4. Dengan AMD Instinct MI300X dan tumpukan open software ROCm yang telah terbukti dan siap pakai, Microsoft mampu mencapai harga/kinerja terdepan pada beban kerja inferensi GPT.

Melampaui beban kerja produksi Azure AI, salah satu pelanggan pertama yang menggunakan VM ini adalah Hugging Face. Dengan mem-porting model mereka ke VM ND MI300X hanya dalam waktu satu bulan, Hugging Face mampu mencapai performa dan harga/kinerja yang mengesankan untuk model mereka. Sebagai bagian dari hal ini, pelanggan VM ND MI300X dapat menghadirkan model Hugging Face ke VM untuk membuat dan menyebarkan aplikasi NLP dengan mudah dan efisien.

“Kolaborasi yang mendalam antara Microsoft, AMD, dan Hugging Face pada ekosistem open software ROCm akan memungkinkan pengguna Hugging Face menjalankan ratusan ribu model AI yang tersedia di Hugging Face Hub di Azure dengan GPU AMD Instinct tanpa perubahan kode, sehingga memudahkan untuk Pelanggan Azure akan membangun AI dengan model terbuka dan open source,” ucap Julien Simon, chief evangelist officer, Hugging Face.

Selain itu, pengembang dapat menggunakan software AMD Ryzen AI untuk mengoptimalkan dan menerapkan inferensi AI pada PC yang didukung AMD Ryzen AI[i]. Software Ryzen AI memungkinkan aplikasi berjalan pada unit pemrosesan saraf (NPU) yang dibangun pada arsitektur AMD XDNA™, silikon pemrosesan AI khusus pertama pada prosesor Windows x86[ii]. Meskipun menjalankan model AI pada CPU atau GPU saja dapat menguras baterai dengan cepat, dengan laptop yang ditenagai oleh Ryzen AI, model AI beroperasi pada NPU yang tertanam, sehingga membebaskan sumber daya CPU dan GPU untuk tugas komputasi lainnya. Hal ini membantu meningkatkan masa pakai baterai secara signifikan dan memungkinkan pengembang menjalankan beban kerja AI LLM pada perangkat dan aplikasi bersamaan secara efisien dan lokal. 

Memajukan Layanan Video dan Komputasi Perusahaan

Microsoft telah memilih media akselerator AMD Alveo™ MA35D untuk mendukung beban kerja video streaming langsung yang besar, termasuk Microsoft Teams, video SharePoint, dan lainnya. Dibuat khusus untuk mendukung layanan streaming interaktif langsung dalam skala besar, Alveo MA35D akan membantu Microsoft memastikan pengalaman video berkualitas tinggi dengan menyederhanakan beban kerja pemrosesan video, termasuk transcoding, decoding, pengkodean, dan streaming bitrate adaptif (ABR) video. Dengan menggunakan akselerator Alveo MA35D di server yang didukung oleh prosesor AMD EPYC™ Generasi Keempat, Microsoft mendapatkan:

  • Kemampuan untuk mengkonsolidasikan server dan Infrastruktur cloud – memanfaatkan kepadatan saluran yang tinggi, hemat energi, dan kemampuan pemrosesan video latensi sangat rendah dari Alveo MA35D, Microsoft dapat secara signifikan mengurangi jumlah server yang diperlukan untuk mendukung aplikasi streaming interaktif langsung bervolume tinggi
  • Performa Mengesankan – Alveo MA35D dilengkapi unit pemrosesan video berbasis ASIC yang mendukung standar kompresi AV1 dan optimalisasi kualitas video berkemampuan AI yang membantu memastikan pengalaman video lancar dan lancar.
  • Teknologi AV1 Future-Ready – dengan jalur peningkatan untuk mendukung standar baru seperti AV1, Alveo MA35D memberi Microsoft solusi yang dapat beradaptasi dengan kebutuhan pemrosesan video yang terus berkembang. 

Prosesor AMD EPYC™ Generasi Keempat saat ini mendukung berbagai VM komputasi untuk keperluan umum, intensif memori, komputasi optimisasi, dan dipercepat di Azure. VM ini menunjukkan pertumbuhan dan permintaan untuk prosesor AMD EPYC di cloud dan dapat memberikan kinerja hingga 20% lebih baik untuk VM tujuan umum dan intensif memori dengan harga/kinerja yang lebih baik, dan kinerja CPU hingga 2x lebih baik untuk VM dengan komputasi optimal dibandingkan VM bertenaga prosesor AMD EPYC generasi sebelumnya di Azure. Kini dalam preview, seri VM Dalsv6, Dasv6, Easv6, Falsv6 dan Famsv6 akan tersedia secara umum dalam beberapa bulan mendatang.  

Sumber Pendukung

Tentang AMD

Selama lebih dari 50 tahun AMD telah mendorong inovasi dalam teknologi komputasi, grafis, dan visualisasi berkinerja tinggi. Miliaran orang, pelaku bisnis terkemuka di Fortune 500, dan lembaga penelitian ilmiah mutakhir di seluruh dunia mengandalkan teknologi AMD setiap hari untuk meningkatkan cara mereka hidup, bekerja, dan bermain. Karyawan AMD fokus pada membangun kepemimpinan produk berkinerja tinggi dan adaptif yang mendorong batas-batas dari apa yang mungkin. Untuk informasi lebih lanjut tentang bagaimana AMD memberdayakan hari ini dan memberi inspirasi di masa depan, kunjungi situs web, blog, LinkedIn, dan halaman X AMD (NASDAQ: AMD).

©2024 Advanced Micro Devices, Inc.  All rights reserved. AMD, Alveo, AMD Instinct, AMD XDNA, EPYC, ROCm, Ryzen, and combinations thereof are trademarks of Advanced Micro Devices, Inc. Other names used herein are for informational purposes only and may be trademarks of their respective owners.


[i] Ryzen™ AI is defined as the combination of a dedicated AI engine, AMD Radeon™ graphics engine, and Ryzen processor cores that enable AI capabilities. OEM and ISV enablement is required, and certain AI features may not yet be optimized for Ryzen AI processors. Ryzen AI is compatible with: (a) AMD Ryzen 7040 and 8040 Series processors except Ryzen 5 7540U, Ryzen 5 8540U, Ryzen 3 7440U, and Ryzen 3 8440U processors; and (b) All AMD Ryzen 8000G Series desktop processors except the Ryzen 5 8500 G/GE and Ryzen 3 8300 G/GE. Please check with your system manufacturer for feature availability prior to purchase. GD-220b

[ii] As of May 2023, AMD has the first and only available dedicated AI engine on an x86 Windows processor, where ‘dedicated AI engine’ is defined as an AI engine that has no function other than to process AI inference models and is part of the x86 processor die. For detailed information, please check: https://www.amd.com/en/products/ryzen-ai. PHX-3.

Foto: Microsoft