Инженеры Google опубликовали базу данных из нескольких тысяч записей синтезированных голосов — речевых сигналов, сформированных из печатного текста. Об этом говорится в блоге компании.
В базу входят несколько отрывков текста, синтезированного 68 разными голосами. Все они записаны на английском языке, а некоторые моделируют различные акценты — британский, американский, ирландский и другие.
Пока доступ к дата-сету имеют только разработчики, победившие в конкурсе на разработку алгоритмов для распознавания синтезированной речи Automatic Speaker Verification. В будущем она станет доступной всем желающим.
Источник: hightech.fm










