Maia 200 เป็นขุมพลังสำหรับการประมวลผล AI inference ที่สร้างขึ้นบนสถาปัตยกรรม 3 นาโนเมตรสุดล้ำของ TSMC ซึ่งมีทรานซิสเตอร์มากกว่า 1.4 แสนล้านตัว ชิปรุ่นนี้โดดเด่นด้วยคอร์ประมวลผลเทนเซอร์ FP8/FP4 ดั้งเดิม, หน่วยความจำ HBM3e ขนาด 216GB พร้อมแบนด์วิดธ์ 7 TB/s และ SRAM บนชิป 272MB โดยสามารถให้ประสิทธิภาพการทำงานกว่า 10 petaFLOPS สำหรับ FP4 และกว่า 5 petaFLOPS สำหรับ FP8 ภายใต้การใช้พลังงาน 750W SoC TDP
ไมโครซอฟท์ยืนยันว่า Maia 200 เป็นชิปที่ผลิตขึ้นเองที่มีประสิทธิภาพสูงสุดจากผู้ให้บริการคลาวด์ขนาดใหญ่รายใดก็ตาม โดยมีประสิทธิภาพ FP4 สูงกว่า Amazon Trainium รุ่นที่ 3 ถึงสามเท่า และประสิทธิภาพ FP8 เหนือกว่า Google TPU รุ่นที่ 7 นอกจากนี้ Maia 200 ยังเป็นระบบ inference ที่มีประสิทธิภาพต่อดอลลาร์ดีที่สุดเท่าที่ไมโครซอฟท์เคยนำมาใช้งาน โดยให้ประสิทธิภาพดีขึ้นถึง 30% เมื่อเทียบกับฮาร์ดแวร์รุ่นล่าสุดที่ใช้งานอยู่ในปัจจุบัน
Maia 200 จะถูกนำไปใช้ขับเคลื่อนโมเดล AI สำคัญหลายตัว รวมถึง GPT-5.2 ล่าสุดจาก OpenAI ในบริการ Microsoft Foundry และ Microsoft 365 Copilot ทีม Microsoft Superintelligence ก็จะใช้ชิปนี้สำหรับการสร้างข้อมูลสังเคราะห์ (synthetic data generation) และการเรียนรู้แบบเสริมกำลัง (reinforcement learning) เพื่อปรับปรุงโมเดลภายในองค์กรรุ่นถัดไป ปัจจุบัน Maia 200 ได้รับการติดตั้งใช้งานแล้วในศูนย์ข้อมูล US Central (เมือง Des Moines รัฐไอโอวา) และจะตามมาด้วย US West 3 (เมือง Phoenix รัฐแอริโซนา) และภูมิภาคอื่นๆ ในอนาคต
ชิปนี้ผนวกรวมเข้ากับ Azure ได้อย่างราบรื่น และไมโครซอฟท์ยังเปิดตัว Maia SDK สำหรับนักพัฒนา ซึ่งประกอบด้วยชุดเครื่องมือที่ครบครัน เช่น การผสานรวมกับ PyTorch, คอมไพเลอร์ Triton, ไลบรารีเคอร์เนลที่ปรับแต่งแล้ว และการเข้าถึงภาษาโปรแกรมระดับต่ำของ Maia สิ่งนี้ช่วยให้นักพัฒนามีการควบคุมที่ละเอียดอ่อนตามต้องการ พร้อมทั้งอำนวยความสะดวกในการโยกย้ายโมเดลข้ามฮาร์ดแวร์ AI ที่หลากหลาย Maia 200 เป็นส่วนหนึ่งของโครงการพัฒนาชิป AI หลายเจเนอเรชันของไมโครซอฟท์ ซึ่งจะยังคงกำหนดมาตรฐานใหม่สำหรับประสิทธิภาพและประสิทธิภาพต่อพลังงานสำหรับเวิร์กโหลด AI ที่สำคัญที่สุดต่อไป
🏷️ หมวดหมู่: Featured, The Official Microsoft Blog, AI, Azure, datacenters
🔗 อ่านบทความฉบับเต็ม: blogs.microsoft
