
На стартовото събитие на 20 май в Оптичната долина на Ухан GigaAI разкри първия в света Physical AGI "Двойна пирамида" архитектура — двуканална рамка, която едновременно се справя с данните и алгоритмичните затруднения, които са блокирали вградения AI да постигне истинско мащабиране.
Полето на въплътената интелигентност отдавна е разделено между два лагера. Поддръжниците на световния модел – включително NVIDIA Cosmos и Google Genie – твърдят, че генеративните видео модели могат да разширят предлагането на данни в мащаб. Защитниците на модела на действие, водени от изследователите на π серията на Physical Intelligence и Diffusion Policy, настояват, че мащабните реални машинни данни са единственият път към генерализирани манипулационни умения. Всеки подход е постигнал реален напредък, но нито един от тях не е разбил фундаменталния въпрос: какви данни и алгоритмична архитектура могат действително да управляват Закон за мащабиране за физическия интелект?
Отговорът на GigaAI е двойната пирамида. На слоя с данни компанията интегрира три източника – реални машинни данни за физика на истината от земята, интернет видео за мащаб и обхват на ситуацията и симулация за неограничено синтетично покритие – в унифициран тръбопровод за обучение, който избягва недостатъците на всеки отделен източник. На слоя на алгоритмите световните модели и VLA моделите са подредени като допълващи се стълбове, като всеки компенсира слепите петна на другия.
Успоредно с архитектурата, GigaAI стартира SeeLight, под-марка за домашни сценарии, и първия си домашен хуманоиден робот с общо предназначение SeeLight S1. Флот от 100 единици вече е разгърнат в реални домове в Ухан, като масовите операции са планирани за третото тримесечие на 2026 г. 12-месечната продуктова пътна карта обхваща три последователни издания на базов модел — GigaBrain-1, GigaBrain-2 и GigaBrain-3 — кулминиращи в това, което GigaAI нарича "GPT-3 момент" за физически AGI.
Най-значимото значение на рамката на двойната пирамида е философско: тя отхвърля рамката или/или, която е поляризирала полето, и предлага, че моделите на света и моделите на действие не са конкуренти, а ко-реквизити за общата физическа интелигентност. Ако подходът се мащабира, както се рекламира, той може да промени начина, по който индустрията мисли за обработката на данни, архитектурата на модела и пътя към роботите с общо предназначение.
