Новая система распознавания речи ориентирована на живое общение, диалекты и смешанную тюркско-русскую речь
В Казахстане разработали масштабную модель автоматического распознавания речи (ASR), способную понимать тюркские языки в их естественной, повседневной форме. Проект стал крупнейшей подобной разработкой в Центральной Азии и впервые был создан внутри страны как полноценная прикладная технологическая платформа, а не экспериментальное решение, передает Astana TV со ссыкой на EL.kz.
Разработка курировалась профильным государственным ведомством и с самого начала позиционировалась как инструмент для практического применения. В отличие от большинства ранее используемых систем, основанных на англоязычных алгоритмах, новая модель изначально строилась с учетом лингвистических особенностей тюркских языков — их морфологии, структуры фраз и специфики ударений.
Фокус на реальную речь
ASR-модель обучалась сразу на шести тюркских языках, что позволило повысить точность распознавания с учетом диалектов и различий в произношении. Такой подход отражает реальную языковую среду региона, где жители часто свободно переходят между языками и используют смешанную речь.
Отдельным вызовом для разработчиков стала тюркско-русская речь, широко распространенная в повседневном общении. Именно на этом этапе большинство импортных решений теряли точность. Новая система демонстрирует устойчивую работу при языковом переключении, сохраняя смысл и контекст высказываний.
Практическое применение
Модель уже готова к внедрению в цифровые сервисы и инфраструктурные платформы. Она стабильно работает в условиях фонового шума и при наличии различных акцентов, что делает ее пригодной для колл-центров, государственных сервисов, голосовых помощников и автоматизированных систем обслуживания.
Использование голосовых технологий позволяет снизить нагрузку на операторов, расширить доступность услуг и оптимизировать операционные расходы. Голосовое взаимодействие перестает быть затратным каналом и становится массовым инструментом коммуникации.
Создание собственной крупной ASR-модели выводит Казахстан на новый уровень в технологической экосистеме региона. Страна постепенно переходит от роли потребителя зарубежных решений к статусу разработчика, способного учитывать языковую и культурную специфику. В этом проекте цифровой суверенитет впервые получил конкретное прикладное воплощение.