Продължете към съдържанието

Alibaba пуска Qwen-Robot Series, първото си въплътено AI моделно семейство

  • от



Alibaba пуска Qwen-Robot Series, първото си въплътено AI моделно семейство

Alibaba пусна серията Qwen-Robot, първото си въплътено семейство модели на AI, отбелязвайки голям тласък към физическата интелигентност, която свързва големи езикови модели директно с роботизирани действия в реалния свят, съобщиха от компанията във вторник.

Пакетът Qwen-Robot включва три различни модела, всеки от които е насочен към различен слой физически интелект. Qwen-RobotNav управлява визуална езикова навигация, уеднаквяване на следващи инструкции, навигация по точки и цели, проследяване на обекти и автономно шофиране в един модел, обучен на 15,6 милиона проби. Qwen-RobotManip адресира роботизираната манипулация чрез архитектура за действие на визуален език, изградена върху Qwen3.5-4B VL backbone, съчетана с глава за действие на дифузионен трансформатор за съвпадение на потока, обучена върху над 38 100 часа оперативни данни, изградени изцяло от източници с отворен код. Qwen-RobotWorld функционира като световен модел за физически агенти, предвиждайки съвместими с физиката фючърси в сценарии за манипулация, шофиране и навигация чрез интерфейс за действие на естествен език.

Една от най-впечатляващите демонстрации включва внедряването на Qwen-RobotNav върху четирикрак робот Unitree Go2, оборудван с хардуер NVIDIA Jetson Thor и нищо повече от една камера с ниска разделителна способност. Роботът навигира стъпка по стъпка в непознат апартамент, следвайки устни инструкции за преминаване през множество стаи без предварително картографиране, постигайки латентност на извода от само 196 милисекунди.

Alibaba също така представи Qwen-RobotClaw, вътрешна агентна рамка за роботика, която позволява на Qwen VLM агентите да извикват моделите на пакета Qwen-Robot като инструменти за физически свят, управлявайки контекста на задачите с дълъг хоризонт и паметта. Изследователите демонстрираха тази рамка в сценарий от реалния свят, при който агент претърси сграда за налична тоалетна, откри знак за неизправност и автономно препланира маршрута си, за да намери алтернатива.

Компанията също така отвори Chat2Robot, базирана на браузър вградена платформа за оценка на интелигентността, където потребителите могат да разговарят с робот и да наблюдават отговорите в реално време. Понастоящем платформата поддържа Qwen-RobotManip, обучен за 50 задачи, използвайки набора от данни RoboTwin-Clean. Ходът на Alibaba я позиционира редом с основните глобални играчи в надпреварата за свързване на големите езикови модели с взаимодействието на физическия свят, пространство, което според анализаторите може да се превърне в пазар за няколко милиарда долара през следващите три години.



Source link