Продължете към съдържанието

Недостигът на AI Compute в Китай: Истинският проблем не е свръхпредлагането, а нещо по-опасно



Недостигът на AI Compute в Китай: Истинският проблем не е свръхпредлагането, а нещо по-опасно

Доклад на JPMorgan наскоро развълнува общността на AI в Китай с поразителна оценка: до 80% от центровете за данни в страната може да не работят. Числото привлича вниманието, но обединява традиционните IDC хостинг, облачни изчисления, суперкомпютърни центрове и специфичните за AI изчислителни центрове, изградени през последните две години. Това са фундаментално различни видове инфраструктура и събирането им заедно създава подвеждаща картина.

И все пак цифрата не е безсмислена. Това сочи към истинско структурно противоречие в китайския изчислителен пейзаж на ИИ. От една страна, изчисленията от висок клас остават остро оскъдни при големите доставчици на облачни услуги като Alibaba Cloud, Tencent Cloud и Huawei Cloud. От друга страна, десетки новопостроени местни изчислителни центрове за изкуствен интелект отчитат нива на използване до 20-30%.

Пропастта между хартиените изчисления и ефективните изчисления се разширява. Клъстер от 1000 GPU с неадекватна честотна лента на свързване и груба система за планиране може да осигури по-ниска действителна пропускателна способност от добре настроен клъстер от 200 GPU. Много местни изчислителни центрове са изградени като инфраструктурни активи – инвестиционни средства, обвързани със земя, субсидии и брандиране на индустриални паркове – вместо отговор на истинското търсене на пазара.

Междувременно центърът на тежестта на пазара се измества от обучението към изводите. Обучението може да бъде централизирано в западни центрове с евтина зелена енергия, но изводите трябва да са близки до потребителите и бизнес сценариите. Тази структурна промяна означава, че много изчислителни центрове, ориентирани към обучението, сега са изправени пред неудобна реалност: търсенето се е променило, но инфраструктурата не.

По-дълбокото затруднение за домашните AI чипове не е производителността на един чип, а цялата инженерна екосистема. CUDA остава де факто стандартът и разликата между „използваеми“ и „готови за производство“ вътрешни алтернативи все още се измерва в часове на разработчици, разходи за миграция и оперативна несигурност. Истинското изчислително предизвикателство на Китай не е изграждането на повече капацитет — става дума за организиране на съществуващия капацитет в съгласувана, ефективна и достъпна национална компютърна мрежа.



Source link