EuroWire , SAN FRANCISCO : Microsoft esitteli 26. tammikuuta Maia 200:n, toisen sukupolven oman tekoälykiihdyttimensä. Se on suunniteltu tekoälymallien suorittamiseen tuotannossa Azure-datakeskuksissa. Yhtiö kertoi, että Maia 200 on suunniteltu päättelyä varten, eli vaiheeseen, jossa koulutetut mallit luovat vastauksia reaaliaikaisiin pyyntöihin, ja sitä käytetään tukemaan useita Microsoftin tekoälypalveluita.

Microsoftin mukaan Maia 200 valmistetaan TSMC:n 3 nanometrin prosessilla ja siinä on yli 140 miljardia transistoria. Siruparit käyttävät uutta muistijärjestelmää, joka sisältää 216 gigatavua HBM3e-laajakaistanleveysmuistia ja noin 272 megatavua sirulla olevaa SRAM-muistia. Tämän tarkoituksena on ylläpitää laajamittaista tokenien generointia ja muita päättelyyn perustuvia raskaita työkuormia.
Microsoftin mukaan Maia 200 tarjoaa yli 10 petaflopsia suorituskykyä 4-bittisellä tarkkuudella ja noin 5 petaflopsia 8-bittisellä tarkkuudella. Näitä formaatteja käytetään yleisesti nykyaikaisen generatiivisen tekoälyn tehokkaaseen suorittamiseen. Yhtiö kertoi myös, että järjestelmä on suunniteltu 750 watin tehoalueelle ja että se on rakennettu skaalautuvalla verkolla, jotta sirut voidaan linkittää suurempia käyttöönottoja varten.
Yhtiö kertoi, että uusien laitteistojen käyttöönotto on alkanut Azure US Central -datakeskuksessa Iowassa, ja Arizonaan on suunnitteilla lisäsijainti. Microsoft kuvaili Maia 200:aa tähän mennessä tehokkaimmaksi päättelyjärjestelmäkseen ja raportoi 30 prosentin suorituskyvyn parannuksen dollaria kohden verrattuna nykyisiin päättelyjärjestelmiin.
Tekoälyn päättelyyn keskittyminen ja Azure-käyttöönotto
Microsoftin mukaan Maia 200 on tarkoitettu tukemaan tekoälytuotteita ja -palveluita, jotka perustuvat suuren volyymin ja pienen latenssin mallien suorittamiseen, mukaan lukien Azuressa ja Microsoftin omissa sovelluksissa suoritettavat työkuormat. Yhtiö kertoi suunnitelleensa sirun ja sitä ympäröivän järjestelmän osaksi kokonaisvaltaista infrastruktuurilähestymistapaa, joka sisältää piisirun, palvelimet, verkot ja ohjelmistot tekoälymallien laajamittaiseen käyttöönottoon.
Sirun ohella Microsoft ilmoitti saavansa ennakkoon käyttöön Maia-ohjelmistokehityspaketin kehittäjille ja tutkijoille, jotka työskentelevät mallien optimoinnin parissa. Yrityksen mukaan työkalut on tarkoitettu auttamaan tiimejä kääntämään ja virittämään malleja Maia-pohjaisille järjestelmille, ja ne on jäsennelty sopimaan yleisiin tekoälykehitystyönkulkuihin, joita käytetään päättelyn käyttöönottoon pilvessä.
Suorituskykyväitteet ja mallituki
Microsoftin mukaan Maia 200 on rakennettu ajamaan suuria kielimalleja ja edistyneitä päättelyjärjestelmiä, ja että sitä käytetään sekä sisäisiin että isännöityihin mallien käyttöönottoihin Azuressa. Yritys on asemoinut sirun tuotantopäättelyn kiihdyttäjäksi, mikä erottaa sen koulutuspainotteisista järjestelmistä, joita tyypillisesti käytetään mallien rakentamiseen ennen käyttöönottoa.
Microsoft on kiihdyttänyt räätälöityjen piisirujen kehittämistä, koska generatiivisia tekoälysovelluksia palvelevan laskennan kysyntä on kasvanut. Näissä sovelluksissa kiihdyttimien kustannukset ja saatavuus voivat vaikuttaa palveluiden skaalautumisnopeuteen. Maia 200 seuraa vuonna 2023 julkaistua Maia 100:aa ja edustaa yrityksen uusinta versiota datakeskusten päättelyyn tarkoitetusta tekoälykiihdytinlinjastaan.
Artikkeli Maia 200 tehostaa Microsoft Azurea uudella tekoälyn päättelypiirillä ilmestyi ensimmäisenä British Postissa .
