Продължете към съдържанието

Официалната версия на DeepSeek V4 се ​​очаква в средата на юли с удвояване на цените на API за пиковите часове

  • от



Официалната версия на DeepSeek V4 се ​​очаква в средата на юли с удвояване на цените на API за пиковите часове

DeepSeek обяви, че официалната версия на DeepSeek V4 ще стартира в средата на юли, като ще донесе нови функции и оптимизации на производителността заедно със значителна промяна в своя модел на ценообразуване на API. Според имейлите с известия за надстройка, изпратени до потребителите, актуализацията ще въведе ценообразуване по време на деня, което удвоява разходите за API по време на пиковите часове.

Съгласно новата структура, ценообразуването както за моделите DeepSeek V4 Pro, така и за V4 Flash ще остане непроменено през периодите извън пиковите натоварвания, но ще се удвои по време на пиковите часове, определени като 9:00 сутринта до 12:00 часа и 14:00 следобед до 18:00 часа всеки ден. За V4 Pro ценообразуването за влизане в пиковия час за попадение в кеша е зададено на 0,05 юана за милион токени, въвеждане за пропуск в кеша на 6 юана за милион токени и изход на 12 юана за милион токени. Тарифите за пиковите часове на V4 Flash са 0,04 юана за вход с попадение в кеша, 2 юана за въвеждане с пропуск в кеша и 4 юана за милион токени за изход.

Този ход бележи забележителна еволюция в стратегията за ценообразуване на AI, правейки сравнения с ценообразуването на електричеството в пикова долина, използвано от компаниите за комунални услуги. Един потребител отбеляза, че „жетоните стават точно като електричеството – ресурс, който струва повече през периоди на високо потребление и по-малко през времена на ниско търсене.“ Подходът има за цел да изглади скоковете в търсенето и да осигури стабилност на услугата, като стимулира потребителите да преместят неспешните работни натоварвания в часове извън пиковите часове.

DeepSeek V4 първоначално беше пуснат във форма за предварителен преглед през април с контекстни прозорци от милиони токени, разширени възможности на агенти и знание и разсъждения от световна класа. Моделът се предлага в два размера: V4-Pro и V4-Flash, като последният е най-наричаният API модел в световен мащаб за шест последователни седмици според данните на OpenRouter.

Официалната версия V4 въвежда нов механизъм за внимание, работещ на ниво компресия на токена, комбиниран с DeepSeek Sparse Attention (DSA), постигайки водещи в световен мащаб възможности за дълъг контекст, като същевременно значително намалява изискванията за изчисления и памет в сравнение с традиционните подходи. DeepSeek се ангажира, че 1 милион контекстни прозорци на токени ще бъдат стандартни във всички официални услуги занапред.

Докато някои потребители изразиха учудване от модела на многостепенно ценообразуване, анализаторите в индустрията отбелязват, че тъй като изводите от AI стават все по-интензивни към ресурси, променливото ценообразуване, базирано на търсенето, е естествена еволюция на пазара – подобно на начина, по който доставчиците на облачни изчисления таксуват по различен начин за резервирани спрямо инстанции при поискване.



Source link