Baidu поведала о программе преобразования текста в речь Deep Voice
12-03-2017, 14:45 Information technology (IT) »
Baidu поведала о программе преобразования текста в речь Deep Voice
Лидеры среди китайских систем интернет-поиска компания Baidu поведала общественности о новом проекте под названием Deep Voice. Новая программа способна преобразовывать текст в речь. Как утверждают инсайдеры технология более быстрая и эффективная, чем технология Google WaveNet.
Разработчики заявили, что технология Deep Voice может быть обучена речи всего за пару часов. Человеческое вмешательство в процесс обучения минимальное. Система способна воспроизводить речь естественно и правдоподобно, поскольку компания контролирует передаваемые системой эмоции.
Специалисты компании уверенны, что воспроизведение речи в настоящем времени вполне реально. Разработчики обнародовали примеры работы новинки через сервис Mechanical Turk от Amazon. Было опрошено большое количество пользователей, которые достаточно высоко оценили качество работы программы.
Если сравнивать новинку от Baidu от привычной технологии WaveNet от компании Google, то разработчики уверяют, что нашли проблему в WaveNet. По их мнению, программа от Google требует ряд вычислительных возможностей, и на сегодняшний день ее сложно использовать с приложениями. Разработчики Baidu применили систему глубокого обучения текста, который далее трансформируется в речь. Человеческое вмешательство минимально, но необходимо на определенной стадии. Специалистам приходится на определенном этапе вручную вводить параметры для передачи различных эмоций.
Также читайте: