Cerebras Systems, startup z siedzibą w USA, wprowadził na rynek największy układ scalony z ponad 1,2 biliona tranzystorów i wielkości 46225 milimetrów kwadratowych. Nowy układ Cerebras Wafer Scale Engine (WSE) jest zoptymalizowany pod kątem sztucznej inteligencji i jest 56,7 razy większy niż największy procesor graficzny, który mierzy 815 milimetrów kwadratowych i zawiera 21,1 miliarda tranzystorów. Nowy silnik Cerebras Wafer Scale Engine (WSE) zapewnia 3000 razy szybszą pamięć wbudowaną w chip i oferuje 10000 razy większą przepustowość. Większy rozmiar chipa zapewnia szybsze przetwarzanie informacji, a nawet może skrócić czas potrzebny na wgląd, czyli „czas szkolenia”, co umożliwia badaczom przetestowanie większej liczby pomysłów, wykorzystanie większej ilości danych i rozwiązanie nowych problemów.
Cerebras WSE jest przeznaczony dla sztucznej inteligencji i zawiera fundamentalne innowacje, które zwiększają stan wiedzy, rozwiązując trwające od dziesięcioleci wyzwania techniczne, takie jak ograniczona wielkość chipa - takie jak łączność krzyżowa, wydajność, dostarczanie mocy i opakowanie. GPW może przyspieszyć obliczenia i komunikację, co skraca czas szkolenia. GPW ma 56,7 razy większą powierzchnię krzemu niż największy procesor graficzny. Ponadto GPW może zapewnić więcej rdzeni do wykonywania większej liczby obliczeń i oferuje więcej pamięci bliżej rdzeni, dzięki czemu rdzenie mogą działać wydajniej. Cała komunikacja jest utrzymywana w samym krzemie, ponieważ szeroki wachlarz rdzeni i pamięci są osadzone w jednym chipie.
Czip Cerebras WSE zawiera 46,225 mm2 krzemu i mieści 400 000 zoptymalizowanych pod kątem sztucznej inteligencji, rdzeni obliczeniowych bez pamięci podręcznej i bez obciążenia oraz 18 gigabajtów lokalnej, rozproszonej, superszybkiej pamięci SRAM. Chip ma przepustowość pamięci 9 petabajtów na sekundę, gdzie rdzenie są połączone ze sobą za pomocą drobnoziarnistej, całkowicie sprzętowej sieci komunikacyjnej połączonej z siatką, która zapewnia łączną przepustowość 100 petabitów na sekundę. Oznacza to, że przepustowość komunikacyjna GPW o niskich opóźnieniach jest niezwykle duża, co sprawia, że grupy rdzeni współpracują z maksymalną wydajnością, a przepustowość pamięci nie jest już wąskim gardłem. Więcej pamięci lokalnej, więcej rdzeni i połączenie szkieletowe o niskiej latencji i wysokiej przepustowości tworzą optymalną architekturę przyspieszającą pracę AI.
Cechy chipa Cerebras WSE:
- Zwiększona liczba rdzeni: GPW integruje 400 000 zoptymalizowanych pod kątem sztucznej inteligencji rdzeni obliczeniowych zwanych SLAC (Sparse Linear Algebra Cores), które są programowalne, elastyczne i zoptymalizowane pod kątem rzadkiej algebry liniowej, która stanowi podstawę wszystkich obliczeń sieci neuronowych. Funkcja programowalności SLAC zapewnia, że rdzenie mogą z łatwością obsługiwać wszystkie algorytmy sieci neuronowych w ciągle zmieniającym się polu uczenia maszynowego. Rdzenie GPW wykorzystują opracowaną przez Cerebras technologię zbierania rzadkich danych, która przyspiesza wydajność obliczeniową przy rzadkich obciążeniach roboczych (obciążeniach zawierających zera), takich jak głębokie uczenie się.
- Ulepszona pamięć: Cerebras WSE integruje więcej pamięci lokalnej wraz z większą liczbą rdzeni, czyli więcej niż jakikolwiek układ, który umożliwia elastyczne i szybkie obliczenia przy mniejszych opóźnieniach i przy mniejszym zużyciu energii. GPW posiada 18 GB (gigabajtów) wbudowanej pamięci dostępnej dla jej rdzenia w jednym cyklu zegara. Ta kolekcja rdzeni-lokalnej pamięci sprawia, że GPW dostarcza łącznie 9 petabajtów na sekundę przepustowości pamięci, co daje 10 000 razy większą przepustowość i 3 000 razy