Шёпот, крик и рэп. Что умеют голосовые роботы и как «варятся» голоса (yet another podcast #41)

184 940
550.4
Яндекс463 тыс
Опубликовано 14 ноября 2024, 8:56
Инженеры Яндекса больше десяти лет разрабатывают технологию распознавания и синтеза речи SpeechKit. Она применяется в Алисе, Браузере, Картах и других продуктах Яндекса. Кроме этого, сервисом Yandex SpeechKit на облачной платформе Yandex Cloud пользуются и другие компании. Они, например, озвучивают контент или автоматизируют кол-центры.

👀 Обо всех возможностях SpeechKit для бизнеса:
clck.ru/3EaxN7

Недавно Яндекс представил принципы этичной работы над синтезом речи, которые применяет команда SpeechKit при разработке технологии. Например, сервис не синтезирует речь людей без их разрешения и информирует дикторов о том, как именно будут использованы их голоса.

👀 Все принципы синтеза речи:
clck.ru/3EaxLV

По этому поводу — выпуск yet another podcast про речевые технологии, которые распознают, анализируют и синтезируют голоса. Как они создаются и на что способны? Заменят ли роботы профессиональных дикторов и какие речевые технологии мошенники используют сегодня? И главное — наступит ли время, когда человек больше не будет говорить по телефону?

На эти и многие другие вопросы отвечают руководитель группы развития речевых технологий Елена Белоброва и руководитель ML-сервисов Yandex Cloud Василий Ершов.

🦸‍♂️ В гостях — Павел Пудан, профессиональный диктор и заместитель председателя Союза дикторов.

yet another podcast — регулярный подкаст о новых технологиях, продуктах Яндекса и людях, которые над ними работают. В каждом выпуске ведущий Павел Кушелев с гостями обсуждают один продукт компании: большое обновление, важную разработку и стоящие за ними процессы.

🎧 НА ДРУГИХ ПЛАТФОРМАХ:

• Яндекс Музыка: music.yandex.ru/album/24046885

• Apple Podcasts: clck.ru/34JYfc

• Google Podcasts: clck.ru/34JYPX

⚡ ЧТО В ВЫПУСКЕ

00:00 — Выпуск про синтез речи
02:06 — Этика речевых технологий — что это?
04:28 — Что нужно для виртуального голоса
06:30 — «Мы варим голоса»
12:01 — Шёпот, милый, нейтральный. Какие голоса есть?
13:45 — Синтез голоса — это быстро?
16:57 — Для создания голоса ещё нужен человек?
18:37 — Час шёпота в студии, и голос готов
21:59 — Кол-центры и роботы
26:07 — «Робот никогда не устаёт»
29:43 — «Позовите оператора!»
33:10 — Самые известные голоса
34:35 — Алиса и Siri читают рэп
36:42 — Генерация голоса без людей
38:11 — Где актёры озвучки незаменимы
40:31 — Царь, Анаксимандр и Вася
41:45 — Дикторы не останутся без работы
45:45 — Робот должен представляться?
49:50 — Как понять, что говоришь с роботом?
53:44 — Лайфхак: как переключиться на оператора
55:16 — «Вам звонит синтез»
57:52 — Разговоры по телефону уйдут в прошлое?
59:49 — Культура звонков в разных странах
01:02:35 — Может ли синтез взять на вас кредит
01:06:02 — Что умеет нейросеть-эмпат
01:11:42 — Как научить нейросеть эмоциям
01:13:35 — А какая польза от эмпатичной нейросети?
01:16:24 — Строгий, милый, добрый. Какие ещё голоса бывают?
01:18:24 — Как сделать синтез своего голоса
01:20:03 — Вопросы! Можно ли объединить SpeechKit и YandexGPT?
01:22:23 — Что будет, если накричать на робота
01:23:47 — Можно ли «украсть» речь?
жизньигрыфильмывесельеавтотехномузыкаспортедаденьгистройкаохотаогородзнанияздоровьекреативдетское