Az Alibaba kínai technológiai vállalat bemutatott egy új mesterséges intelligencia modellt, amely állításuk szerint felülmúlja riválisai, az OpenAI, a Meta és a DeepSeek fejlesztéseit is, írja a LiveScience.
A Qwen2.5-Max modell január 29-i bejelentése a második jelentős mesterséges intelligencia hír ezen a héten Kínából, miután a DeepSeek R1 elnevezésű érvelő modellje valóságos sokkot okozott az amerikai techcégeknél, mivel a dokumentáció szerint olcsóbban és gyorsabban tanították be a modellt. Ehhez azonban a hírek szerint a ChatGPT által előállított szintetikus adatokra is szükség volt.
Az Alibaba most azt állítja, hogy a részben nyílt forráskódú Qwen 2.5-Max még lenyűgözőbb eredményeket mutat, mint a másik kínai fejlesztés.
Az olyan benchmark tesztekben, mint az Arena-Hard, a LiveBench, a LiveCodeBench, a GPQA-Diamond és az MMLU-Pro, a Qwen2.5-Max egyenrangú az Anthropic Claude-3.5-Sonnetjével, és felülmúlja az OpenAI GPT-4o modelljét, a DeepSeek-V3-at és a Meta Llama-3.1-405B fejlesztését
– jelentették be az Alibaba képviselői a WeChat oldalukon.
A DeepSeek sikere jól láthatóan nemcsak az amerikai techpiacon, hanem Kínában is komoly felfordulást okozott: az Alibaba mellett ugyanis a TikTok-tulajdonos ByteDance is frissítette Doubao modelljét. Hogy ezeket mikor tekintheti meg a nyugati nyilvánosság, egyelőre kérdéses.
The post A DeepSeek után újabb kínai modell tarolhatja le a piacot first appeared on 24.hu.