На 20 август DeepSeek обяви отворения код на новия си модел V3.1-Base на Hugging Face. Според компанията моделът има приблизително 685 милиарда параметъра, а дължината на контекста му е разширена до 128K. Той е предварително обучен на огромен масив от данни, обхващащ над 2 трилиона токена текст на множествени езици, като се фокусира върху английски и китайски. Този мащабно обучение гарантира, че моделът притежава задълбочено разбиране на семантиката, контекста и сложните взаимоотношения в езика.
По-рано същата вечер DeepSeek уведоми потребителите, че техният онлайн модел е надстроен до V3.1 с дължина на контекста 128K. Тази версия може да бъде тествана на официалния уебсайт, приложение и мини-програма, като методът за извикване на API остава непроменен.
Компанията отбеляза, че няма потвърдена дата на пускане на дългоочаквания модел DeepSeek R2.
В постоянно развиващия се свят на изкуствения интелект, скоростта на иновациите често се сблъсква с ограниченията на достъпността. Китайската изследователска лаборатория DeepSeek отново предизвиква статуквото, като обяви официалното публикуване на новия си флагмански базов модел, DeepSeek-V3.1-Base, на платформата Hugging Face. Този ход не само затвърждава позицията на DeepSeek като лидер в пространството на отворения код, но и предоставя на разработчиците, изследователите и компании по целия свят безплатен достъп до една от най-мощните и модерни архитектури за обработка на език.
Ключова характеристика на този релиз е, че той е „base“ модел. Това означава, че той не е финонагласен за конкретна задача (като чат или отговаряне на въпроси). Вместо това, той служи като изключително мощен и гъвкав фундамент, който разработчиците могат да адаптират и финонагласят за свои собствени специфични приложения – будни асистенти, специализирани инструменти за кодиране, анализ на настроенията, машинен превод и много други.
Моделът е лесно достъпен чрез платформата Hugging Face Hub, центърът на света на машинното обучение с отворен код.
-
Пряко изтегляне: Моделът може да бъде изтеглен и локално изпълнен.
-
Интеграция с популярни библиотеки: Лесно се интегрира с инструменти като
transformersот Hugging Face,vLLMза бърза инференция иAxolotlза финонагласяване. -
Финонагласяване: Разработчиците могат да вземат този базов модел и да го дообучат с техни собствени данни, за да създадат специализирани AI приложения, адаптирана към техните уникални нужди.
Това е стъпка към отворено бъдеще на AI
С пускането на DeepSeek-V3.1-Base, DeepSeek не просто споделя код; тя споделя потенциал. Това е инвестиция в бъдещето на AI, която насърчава сътрудничество, прозрачност и иновация в глобен мащаб. Този ход показва, че пътят към напредъка в изкуствения интелект не е задържан в затворени лаборатории, а се гради от колективните усилия на глобална общност от инженери, изследователи и мечтатели.
