
На 23 декември 2025 г. Alibaba представи големи надстройки на гамата си гласови модели Tongyi Bailing.
Изданието включва модели за разпознаване на реч (Fun-ASR), Text-to-Speech (Fun-CosyVoice3) и гласово взаимодействие от край до край (Fun-Audio-Chat), с олекотени версии с напълно отворен код.
Fun-ASR поддържа смесено разпознаване на реч на 31 езика и въвежда RAG механизъм. Fun-CosyVoice3 позволява междуезично гласово клониране. Моделите с малки параметри с отворен код правят високопроизводителния AI възможен за внедряване на устройството.
Източник: GEEKPARK
