Smegenų sistemosspartėjančios generatyvinės AI pradininkas paskelbė rekordinį „Deepseeek-R1-Distill-Llama-70B“ išvadą, pasiekusi daugiau nei 1500 žetonų per sekundę-57 kartus greičiau nei GPU pagrįsti sprendimai. Šis greitis įgalina momentines samprotavimo galimybes vienam iš moderniausių pramonės atstovų modelių, visiškai veikiančių JAV (JAV) pagrįstoje AI infrastruktūroje su nuliniu duomenų išsaugojimu.
„„ Deepseeek R1 “yra nauja AI argumento galimybių sritis, ir šiandien mes padarome jį prieinamą greičiausiu pramonės greičiu“, – sakė Hagay Lupesko, „Cerebras“ AI debesies SVP. „Siekdami daugiau nei 1500 žetonų per sekundę mūsų„ Cerebras “išvadų platformoje, mes pertvarkome minučių trukmės samprotavimo procesus į beveik instaniškus atsakymus, iš esmės keičiant, kaip kūrėjai ir įmonės gali panaudoti pažangių AI modelius“.
Varomas „Cerebras Wafer Scale Engine“, platforma demonstruoja realaus pasaulio našumo patobulinimus. Standartinis kodavimo raginimas, kuris užtrunka 22 sekundes konkurencingose platformose, užbaigia vos per 1,5 sekundės smegenų – 15 kartų pagerinimas laiku. Šis proveržis leidžia praktiškai diegti sudėtingus samprotavimo modelius, kuriems tradiciškai reikia išsamaus skaičiavimo laiko.
„Deepseek-R1-Distill-llama-70b“ sujungia pažangias „Deepseek“ 671b parametrų mišinio (MOE) modelio su pagrindu galimybes su Metaplačiai palaikoma lamos architektūra. Nepaisant efektyvaus 70B parametrų dydžio, modelis rodo puikų sudėtingos matematikos ir kodavimo užduočių našumą, palyginti su didesniais modeliais.
„Saugumas ir privatumas yra nepaprastai svarbus įmonės AI diegimui“, – tęsė Lupesko. „Apdorodami visas JAV duomenų centrus, kurių duomenų centrai yra nuliniai, mes užtikriname, kad organizacijos galėtų panaudoti pažangiausias AI galimybes, išlaikant griežtus duomenų valdymo standartus. Duomenys lieka JAV 100% laiko ir priklauso tik klientui. “
„Deepseeek-R1-Distill-Llama-70B“ modelį galima iš karto įsigyti per „Cerebras“ išvadą, o API prieigą galima pasirinkti klientams per kūrėjų peržiūros programą. Norėdami gauti daugiau informacijos apie jūsų programų momentinių pagrindimo galimybes, apsilankykite www.cerebras.ai/contact-us.
Komentuokite šį straipsnį per X: @IONOW_ ir apsilankykite mūsų pagrindiniame puslapyje dabar