Продължете към съдържанието

DeepSeek представя нов модел V3.1 с отворен код

  • от

На 20 август DeepSeek обяви отворения код на новия си модел V3.1-Base на Hugging Face. Според компанията моделът има приблизително 685 милиарда параметъра, а дължината на контекста му е разширена до 128K. Той е предварително обучен на огромен масив от данни, обхващащ над 2 трилиона токена текст на множествени езици, като се фокусира върху английски и китайски. Този мащабно обучение гарантира, че моделът притежава задълбочено разбиране на семантиката, контекста и сложните взаимоотношения в езика.

По-рано същата вечер DeepSeek уведоми потребителите, че техният онлайн модел е надстроен до V3.1 с дължина на контекста 128K. Тази версия може да бъде тествана на официалния уебсайт, приложение и мини-програма, като методът за извикване на API остава непроменен.

Компанията отбеляза, че няма потвърдена дата на пускане на дългоочаквания модел DeepSeek R2.

В постоянно развиващия се свят на изкуствения интелект, скоростта на иновациите често се сблъсква с ограниченията на достъпността. Китайската изследователска лаборатория DeepSeek отново предизвиква статуквото, като обяви официалното публикуване на новия си флагмански базов модел, DeepSeek-V3.1-Base, на платформата Hugging Face. Този ход не само затвърждава позицията на DeepSeek като лидер в пространството на отворения код, но и предоставя на разработчиците, изследователите и компании по целия свят безплатен достъп до една от най-мощните и модерни архитектури за обработка на език.

Ключова характеристика на този релиз е, че той е „base“ модел. Това означава, че той не е финонагласен за конкретна задача (като чат или отговаряне на въпроси). Вместо това, той служи като изключително мощен и гъвкав фундамент, който разработчиците могат да адаптират и финонагласят за свои собствени специфични приложения – будни асистенти, специализирани инструменти за кодиране, анализ на настроенията, машинен превод и много други.

Моделът е лесно достъпен чрез платформата Hugging Face Hub, центърът на света на машинното обучение с отворен код.

  • Пряко изтегляне: Моделът може да бъде изтеглен и локално изпълнен.

  • Интеграция с популярни библиотеки: Лесно се интегрира с инструменти като transformers от Hugging Face, vLLM за бърза инференция и Axolotl за финонагласяване.

  • Финонагласяване: Разработчиците могат да вземат този базов модел и да го дообучат с техни собствени данни, за да създадат специализирани AI приложения, адаптирана към техните уникални нужди.

Това е стъпка към отворено бъдеще на AI

С пускането на DeepSeek-V3.1-Base, DeepSeek не просто споделя код; тя споделя потенциал. Това е инвестиция в бъдещето на AI, която насърчава сътрудничество, прозрачност и иновация в глобен мащаб. Този ход показва, че пътят към напредъка в изкуствения интелект не е задържан в затворени лаборатории, а се гради от колективните усилия на глобална общност от инженери, изследователи и мечтатели.

Етикети: