Kellemetlen eszmélésre késztette az amerikai techcégeket egy kínai mesterségesintelligencia-alkalmazás, a DeepSeek megjelenése a hét elején. A csúcstechnológiás chipeket gyártó Nvidia egyetlen nap alatt mintegy 300 milliárd dollárt vesztett becsült piaci értékéből, ami a valaha volt legnagyobb esés az amerikai tőzsdetörténelemben.
A bezuhanást az okozta, hogy a hivatalos dokumentáció szerint a kínai modellt az amerikaiakhoz képest fillérekből, egészen pontosan 5,6 millió dollárból tanították be, ráadásul mindössze két hónap alatt, ami elképesztő eredmény annak fényében, hogy teljesítmény terén felveszi a versenyt, sőt szoftverfejlesztésben és matematikai számításokban még le is hagyja az amerikai konkurenseket.
Nos, egy X-felhasználó most arról adott hírt, hogy bár az R1 érvelő, nagy nyelvi modell (LLM) az előzetes híreknek megfelelően valóban az Nvidia H100 segítségével lett betanítva, de a Huawei által fejlesztett Ascend 910C nevű chipet használja a következtetésekhez, ami a betanított modell használatával generál válaszokat. Mivel pedig az Ascend-chip nem foglalkozik a rendszer képzésével, így a GPU energiafelhasználása is alacsonyabb – írja a GSMArena.
A Huawei Central szerint a kínai cég még 2024-ben jelentette be az Ascend 910C-t, de eddig nem kapott különösebben nagy hírverést. Ugyanakkor azt is hozzátették, hogy az Ascend 910C konkurensekhez képest alacsonyabb teljesítménye miatt korlátot jelent a rendszer képzésében. A Huawei következő generációs, 920C lapkája azonban komoly előrelépést jelenthet, ugyanis ez már az Nvidia Blackwell B200 lapkájával kíván versenyezni – amelyet az iparágban sokan használnak a mesterséges intelligencia működtetéséhez.
Az alábbi cikkünkben összegyűjtöttünk mindent, amit a kínai mesterségesintelligencia-cégről tudni érdemes:
The post Kiderült, mi lehet az amerikai techcégeket sokkoló DeepSeek titka first appeared on 24.hu.