tapausbanneri

Alan uutiset: Jim Keller on julkaissut uuden RISC-V-sirun

Alan uutiset: Jim Keller on julkaissut uuden RISC-V-sirun

Jim Kellerin johtama siruyhtiö Tenstorrent on julkaissut seuraavan sukupolven matoreikäprosessorin tekoälytyökuormille, jonka se odottaa tarjoavan hyvää suorituskykyä edulliseen hintaan.Yhtiö tarjoaa tällä hetkellä kaksi lisä-PCIe-korttia, joihin mahtuu yksi tai kaksi Wormhole-prosessoria, sekä TT-LoudBox- ja TT-QuietBox-työasemia ohjelmistokehittäjille. Kaikki tämänpäiväiset tiedotteet on suunnattu kehittäjille, eivät niille, jotka käyttävät Wormhole-kortteja kaupallisiin työkuormiin.

”On aina palkitsevaa saada lisää tuotteitamme kehittäjien käsiin. Wormhole™-korttejamme käyttävät julkaisukehitysjärjestelmät voivat auttaa kehittäjiä skaalaamaan ja kehittämään monisiruista tekoälyohjelmistoa”, sanoi Tenstorrentin toimitusjohtaja Jim Keller.Tämän lanseerauksen lisäksi olemme innoissamme nähdessämme edistystä toisen sukupolven tuotteemme, Blackholen, kasettien ulostulossa ja käynnistyksessä.”

1

Jokainen Wormhole-prosessori sisältää 72 Tensix-ydintä (joista viisi tukee RISC-V-ytimiä eri datamuodoissa) ja 108 Mt SRAM-muistia, jotka tarjoavat 262 FP8 TFLOPSia 1 GHz:n taajuudella ja 160 W:n lämpösuunnitteluteholla. Yhden sirun Wormhole n150 -kortissa on 12 Gt:n GDDR6-videomuisti ja sen kaistanleveys on 288 Gt/s.

Wormhole-prosessorit tarjoavat joustavaa skaalautuvuutta erilaisten työkuormien tarpeisiin. Vakiotyöasemakokoonpanossa, jossa on neljä Wormhole n300 -korttia, prosessorit voidaan yhdistää yhdeksi yksiköksi, joka näkyy ohjelmistossa yhtenäisenä, laajana Tensix-ydinverkkona. Tämä kokoonpano mahdollistaa kiihdyttimen käsitellä saman työkuorman, jakaa sen neljän kehittäjän kesken tai ajaa jopa kahdeksaa eri tekoälymallia samanaikaisesti. Tämän skaalautuvuuden keskeinen ominaisuus on, että se voi toimia paikallisesti ilman virtualisoinnin tarvetta. Datakeskusympäristössä Wormhole-prosessorit käyttävät PCIe-liitäntää koneen sisäiseen laajennukseen tai Ethernet-liitäntää ulkoiseen laajennukseen.

Suorituskyvyn osalta Tenstorrentin yksisiruinen Wormhole n150 -kortti (72 Tensix-ydintä, 1 GHz:n taajuus, 108 Mt SRAM-muistia, 12 Gt GDDR6-muistia, 288 Gt/s kaistanleveys) saavutti 262 FP8 TFLOPSia 160 W:n teholla, kun taas kaksisiruinen Wormhole n300 -kortti (128 Tensix-ydintä, 1 GHz:n taajuus, 192 Mt SRAM-muistia, yhteensä 24 Gt GDDR6-muistia, 576 Gt/s kaistanleveys) tarjoaa jopa 466 FP8 TFLOPSia 300 W:n teholla.

Asettaaksemme 300 W:n ja 466 FP8 TFLOPSin suorituskyvyn kontekstiin, vertaamme sitä tekoälymarkkinoiden johtajan Nvidian tarjoamaan jäähdytyksen tehoon. Nvidian A100 ei tue FP8:aa, mutta se tukee INT8:aa, ja sen huippusuorituskyky on 624 TOPS (1 248 TOPS harvalla teholla). Vertailun vuoksi Nvidian H100 tukee FP8:aa ja saavuttaa huippusuorituskyvyn 1 670 TFLOPS:ia 300 W:n teholla (3 341 TFLOPS harvalla teholla), mikä eroaa merkittävästi Tenstorrentin Wormhole n300:sta.

Yksi merkittävä ongelma on kuitenkin olemassa. Tenstorrentin Wormhole n150:n vähittäismyyntihinta on 999 dollaria, kun taas n300:n hinta on 1 399 dollaria. Vertailun vuoksi yksi Nvidia H100 -näytönohjain maksaa 30 000 dollaria määrästä riippuen. Emme tietenkään tiedä, pystyykö neljä vai kahdeksan Wormhole-prosessoria todellisuudessa tarjoamaan yhden H300:n suorituskyvyn, mutta niiden TDP-arvot ovat vastaavasti 600 W ja 1 200 W.

Korttien lisäksi Tenstorrent tarjoaa kehittäjille valmiiksi rakennettuja työasemia, mukaan lukien neljä n300-korttia edullisemmassa Xeon-pohjaisessa TT-LoudBoxissa, jossa on aktiivinen jäähdytys, ja edistyneessä TT-QuietBoxissa, jossa on EPYC-pohjainen Xiaolong-nestejäähdytystoiminto.


Julkaisun aika: 29.7.2024