На 6 март Alibaba пусна и отвори своя нов модел на разсъждения, QwQ-32B, включващ 32 милиарда параметъра. Въпреки че е значително по-малък от DeepSeek-R1, който има 6,710 милиарда параметъра (с 3,7 милиарда активни), QwQ-32B съответства на неговата производителност в различни бенчмаркове. QwQ-32B се представи отлично в тестовете по математика и кодиране, превъзхождайки o1-mini и дестилираните версии на DeepSeek-R1 на OpenAI. Той също така отбеляза по-висок резултат от DeepSeek-R1 в някои оценки като LiveBench и IFEval. Моделът използва обучението за подсилване и интегрира способностите на агента за критично мислене и адаптивно разсъждение. Трябва да се отбележи, че QwQ-32B изисква много по-малко изчислителна мощност, което го прави приложим на хардуер от потребителски клас. Тази версия е в съответствие със стратегията на Alibaba за AI, която включва значителни инвестиции в облачна и AI инфраструктура. След публикуването акциите на Alibaba в САЩ се покачиха с 8,61% до $141,03, като акциите в Хонконг се покачиха с над 7%.[Jiemian, in Chinese]
Свързани
