Cerebras Systems, en amerikansk opstart, lancerede den største chip, der integrerer mere end 1,2 billioner transistorer og har en størrelse på 46.225 kvadratmillimeter. Den nye Cerebras Wafer Scale Engine (WSE) chip er optimeret til AI og er 56,7 gange større end den største grafiske processorenhed, der måler 815 kvadratmillimeter og indeholder 21,1 milliarder transistorer. Den nye Cerebras Wafer Scale Engine (WSE) giver 3.000 gange mere høj hastighed, on-chip-hukommelse og leveres med 10.000 gange mere hukommelsesbåndbredde. Den større størrelse af chippen sikrer, at information kan behandles hurtigere og endda kan reducere tid til indsigt eller "træningstid", som gør det muligt for forskerne at teste flere ideer, bruge flere data og løse nye problemer.
Cerebras WSE er designet til AI og indeholder grundlæggende innovationer, der fremmer den nyeste teknologi ved at løse årtier gamle tekniske udfordringer, der er begrænset chipstørrelse - såsom kryds-reticle-forbindelse, kapacitet, strømforsyning og emballering. WSE kan fremskynde beregninger og kommunikation, hvilket reducerer træningstiden. WSE har 56,7 gange mere siliciumareal end den største grafiske behandlingsenhed. WSE kan også give flere kerner til at foretage flere beregninger og har mere hukommelse tættere på kernerne, så kernerne kan fungere effektivt. Al kommunikation opbevares på selve silicium på grund af dets enorme vifte af kerner, og hukommelsen er indlejret i en enkelt chip.
Cerebras WSE-chip indeholder 46.225 mm2 silicium og huser 400.000 AI-optimeret, ikke-cache, ikke-overhead, computerkerner og 18 gigabyte lokal, distribueret, superhurtig SRAM-hukommelse. Chippen leveres med 9 petabyte pr. Sekund hukommelsesbåndbredde, hvor kerner er forbundet sammen med et finkornet, alt hardware, on-chip mesh-forbundet kommunikationsnetværk, der leverer en samlet båndbredde på 100 petabits per sekund. Det betyder, at kommunikationsbåndbredden med lav latens for WSE er ekstremt stor, hvilket får grupperne til at samarbejde med maksimal effektivitet, og hukommelsesbåndbredde er ikke længere en flaskehals. Mere lokal hukommelse, flere kerner og et stof med lav latens med høj båndbredde kombineret sammen danner den optimale arkitektur til hurtigere AI-arbejde.
Funktionerne i Cerebras WSE-chip:
- Forøgede kerner: WSE integrerer 400.000 AI-optimerede beregningskerner kaldet SLAC (Sparse Linear Algebra Cores), som er programmerbare, fleksible og optimerede til den sparsomme lineære algebra, der understøtter al neurale netværksberegninger. SLACs programmerbarhedsfunktion sikrer, at kernerne let kan køre alle neurale netværksalgoritmer i stadigt skiftende maskinindlæringsfelt. WSE-kernerne indeholder Cerebras-opfundet sparsity-høstteknologi, der fremskynder beregningsydelse på sparsomme arbejdsbelastninger (arbejdsbelastninger, der indeholder nuller) som dyb læring.
- Forbedret hukommelse: Cerebras WSE integrerer mere lokal hukommelse sammen med flere kerner, hvilket er mere end nogen chip, der muliggør fleksibel, hurtig beregning ved lavere ventetid og med mindre energi. WSE leveres med 18 GB (gigabyte) on-chip-hukommelse, der er tilgængelig via sin kerne i en urcyklus. Denne samling af kerne-lokal hukommelse får WSE til at levere et samlet antal på 9 petabyte per sekund hukommelsesbåndbredde, hvilket er 10.000 X mere hukommelsesbåndbredde og 3.000 X