
Китайският AI сектор се готви за монументална седмица с вълна от нови модели – включително мощен „стелт“ претендент – появяващи се, докато местните технологични гиганти се подготвят да представят своите водещи продукти.
В неделя член на екипа за разработка на модели на Alibaba Cloud издаде заявки за изтегляне – предложение на разработчици за добавяне на нов код към споделен софтуерен проект – на платформи за разработчици с отворен код Hugging Face и GitHub за своето следващо поколение модели. Такива платформи са онлайн хранилища, където програмистите могат да споделят, да си сътрудничат и да управляват софтуерен код, което го прави публично достъпен за използване и модифициране.
Централният елемент на това ново семейство е дългоочакваният Qwen-3.5, който трябва да се появи почти година след пускането на предишното поколение модели на базирания в Ханджоу технологичен гигант, Qwen-3, което помогна на Qwen да се превърне в най-популярното семейство отворени модели в световен мащаб през 2025 г. поради силната си производителност, разрешителния лиценз и широкия диапазон от случаи на употреба.
Alibaba Cloud е звеното за AI и облачни изчисления на Alibaba Group Holding, собственик на South China Morning Post.
Въз основа на предварителната информация, разкрита като част от заявките за изтегляне, Qwen-3.5 ще включва два модела – единият с 9 милиарда параметри и другият с 35 милиарда параметри – с вградена мултимодална поддръжка за първи път. Параметрите са променливите, кодиращи „интелигентността“ на модела, които се коригират по време на обучението. Като цяло по-големият брой променливи означава по-мощен модел, въпреки че изисква повече изчисления. А мултимодалната поддръжка означава, че AI може да разбира и обработва различни типове данни, като текст, изображения и аудио.
Двата модела също ще включват архитектурата от следващо поколение на компанията, която беше представена за първи път през септември в експериментален модел, наречен Qwen3-Next.
