ШЕНЖЕН – Китайски учени разработиха високопрецизна триизмерна (3D) база данни за лица и постигнаха пробив в персонализираното моделиране, което силно ще поддържа по-естественото взаимодействие между човек и компютър.
За да се даде възможност на виртуалните хора да изразяват ярки емоции, да разпознават човешката идентичност и да демонстрират въплътен интелект, ключовата технология е 3D разпознаване на ключови точки на лицето.
Въпреки това, липсата на широкомащабни и прецизно анотирани набори от данни за 3D лица означава, че повечето настоящи алгоритми за откриване на 3D лицеви ориентири разчитат на помощ от 2D текстури или нефотореалистични цифрови 3D лица. Такова 3D лицево откриване на ключови точки отдавна е възпрепятствано от недостатъчни данни и лоша способност за обобщение.
Изследователски екип от Институтите за напреднали технологии в Шенжен на Китайската академия на науките и Технологичния университет на Фуджиан разработи нова мрежа за внимание на графики с кривини (CF-GAT), способна да предскаже лицеви ориентири директно от необработени облаци от точки, което помага да се постигне съществено подобрение от „един размер за всички“ към персонализирано моделиране.
Това проучване беше публикувано миналата седмица в списанието IEEE Transactions on Circuits and Systems for Video Technology.
Изследователският екип изгради персонализирана 3D/4D лицева система за събиране на данни и проведе стандартизирано събиране на данни, създавайки това, което според него е най-голямата високопрецизна, точно анотирана 3D лицева база данни до момента, включваща приблизително 200 000 висококачествени 3D лицеви сканирания.
Въз основа на това системата от бази данни включва също многоизразен набор от данни за 3D лица, стандартизиран набор от данни за 3D лицеви ориентири, високопрецизен набор от данни за 3D човешко тяло и динамичен набор от данни за 4D изражения на лицето.
„Тези бази данни се превърнаха в основна подкрепа в ключовата технологична верига на хуманоидните роботи, предоставяйки основни данни за възприятие с висока точност, моделиране на изразяване и генериране на поведение“, каза съответният автор Song Zhan.
„В бъдеще тези набори от данни допълнително ще обслужват управляваната от данни система с голям модел хуманоиден робот за изграждане на по-естествени и интелигентни възможности за взаимодействие между човек и робот“, добави той.
