A Jim Keller vezette Chip Company, a Tenstorrent kiadta a következő generációs féreglyuk processzorát az AI munkaterheléshez, amely várhatóan jó teljesítményt kínál megfizethető áron.A cég jelenleg két további PCIe-kártyát kínál, amelyek képesek befogadni egy vagy két féreglyuk processzort, valamint a TT-LoudBox és a TT-Quietbox munkaállomásokat a szoftverfejlesztők számára. Az összes mai bejelentés a fejlesztőkre irányul, nem pedig azoknak, akik féreglyuk táblákat használnak a kereskedelmi munkaterheléshez.
"Mindig örömteli, hogy több termékünket a fejlesztők kezébe juttassuk. A Wormhole ™ kártyák segítségével történő felszabadító fejlesztési rendszerek elősegíthetik a fejlesztők méretezését és a multi-chip AI szoftver fejlesztését"-mondta Jim Keller, a Tenstorrent vezérigazgatója.A bevezetésen kívül izgatottan láthatjuk, hogy az előrelépés, amelyet a szalagunkkal és a második generációs termék, a Blackhole bekapcsolása és bekapcsolása mellett hajtunk végre. ”

Mindegyik féreglyuk-processzor 72 Tensix magot tartalmaz (ebből öt a RISC-V magot különféle adatformátumokban) és 108 MB SRAM-ot tartalmaz, 262 FP8 TFLOPS-t szállíthat 1 GHz-en, 160 W termikus tervezési teljesítménygel. Az egycsipeszi féreglyuk N150 kártya 12 GB GDDR6 video memóriával van felszerelve, és sávszélessége 288 GB/s.
A féreglyuk -processzorok rugalmas méretezhetőséget biztosítanak a munkaterhelések különféle igényeinek kielégítésére. Egy standard munkaállomás -beállításban, amelynek négy féreglyuk N300 kártyája van, a processzorok egyetlen egységgé kombinálhatók, amely a szoftverben egységes, széles Tensix maghálózatként jelenik meg. Ez a konfiguráció lehetővé teszi a gyorsító számára, hogy ugyanazt a munkaterhelést kezelje, felosztja négy fejlesztő között, vagy akár nyolc különböző AI modellt futtasson egyszerre. Ennek a méretezhetőségnek a legfontosabb jellemzője, hogy virtualizáció nélkül helyben futhat. Egy adatközpont környezetben a féreglyuk -processzorok a PCIe -t használják a gépen belüli terjeszkedéshez, vagy az Ethernet külső terjeszkedéshez.
In terms of performance, Tenstorrent's single-chip Wormhole n150 card (72 Tensix cores, 1 GHz frequency, 108 MB SRAM, 12 GB GDDR6, 288 GB/s bandwidth) achieved 262 FP8 TFLOPS at 160W, while the dual-chip Wormhole n300 board (128 Tensix cores, 1 GHz frequency, 192 MB SRAM, aggregated 24 GB GDDR6, 576 GB/s sávszélesség) akár 466 FP8 TFLOPS -t szállít 300 W -nál.
Annak érdekében, hogy a 300W 466 FP8 TFLOPS -t a kontextusba helyezzük, összehasonlítjuk azzal, amit az AI piacvezető, az NVIDIA kínál ezen a hőtervezési erőnél. Az NVIDIA A100 nem támogatja az FP8 -at, de támogatja az INT8 -at, a csúcsteljesítményt 624 felsőkkel (1248 felső, ha ritka). Összehasonlításképpen: az NVIDIA H100 támogatja az FP8 -at, és eléri az 1,670 TFLOPS csúcsteljesítményét 300W -nál (3341 TFLOPS SARSE -nál), ami szignifikánsan különbözik a Tenstorrent N300 féreglyuktól.
Van azonban egy fő probléma. A Tenstorrent féreglyuk N150 999 dollárért, míg az N300 1 399 dollárért árul. Összehasonlításképpen: egyetlen NVIDIA H100 grafikus kártya 30 000 dollárért kiskereskedelem, a mennyiségtől függően. Természetesen nem tudjuk, hogy négy vagy nyolc féreglyuk processzora valóban képes -e egyetlen H300 teljesítményét, de TDP -jük 600W, illetve 1200 W.
A kártyákon kívül a Tenstorrent előre gyártott munkaállomásokat kínál a fejlesztők számára, köztük 4 N300 kártyát a megfizethetőbb Xeon-alapú TT-Loudbox-ban, aktív hűtéssel, és az Advanced TT-QuietBox EPYC-alapú Xiaolong) folyékony hűtési funkcióval.
A postai idő: július-29-2024