Из всего живого только человека Создатель наградил даром речи, благодаря чему ему удалось столь значительно развить свои интеллектуальные способности и, по мнению многих философов, стать человеку человеком. Осмелимся предположить, что нечто подобное происходит на наших глазах и с компьютером, интенсивно овладевающим широким спектром речевых технологий от работы со звуковыми файлами до синтеза, распознавания и понимания речи [1]. В этой книге мы коснёмся лишь одного аспекта речевых технологий, а именно, синтеза речи, как наиболее близкого её авторам.
О чём машине говорить? Зачем Она заговорила?
Говорящий компьютер - это принципиально новое средство человеко-машинного общения. преимущества и возможности использования которого до конца еще не осознаны широкой общественностью. Здесь уместна аналогия с немым и звуковым кино. Дар речи "великий немой" - кинематограф - получил в конце 20-х годов, но ещё долгое время звуковые фильмы копировали приёмы режиссуры немого кино. Образно говоря, ситуация с современными компьютерами сейчас очень схожая. По-видимому, потребуется еще немало времени, чтобы синтез речи стал органической частью компьютера и был широко востребован.
Синтезатор речи - это одна из составных частей речевого интерфейса, без которой разговор с компьютером не может состояться. При этом имеется в виду прочтение вслух произвольной текстовой информации, а не проигрывание предварительно записанных звуковых файлов. Синтезатор речи обеспечивает выдачу в речевой форме заранее неизвестной информации непосредственно по орфографическому тексту, генерируемому компьютером.
ОГЛАВЛЕНИЕ.
Вместо предисловия. От голоса робота - к персональному клону голоса человека.
Введение.
Глава 1. Фонетико-акустические основы синтеза речи по тексту.
1.1. Общие сведения о языке и речи.
1.2. Система фонем русского языка.
1.3. Оттенки фонем и система аллофонов русской речи.
1.4. Особенности преобразования «буква-фонема» (ПБФ) для русского языка.
1.5. Просодические характеристики русской речи.
1.6. Акустические характеристики речи.
1.7. Информационная и модуляционная структура речевого сигнала.
Глава 2. Методы синтеза фонетико-акустических характеристик речи.
2.1. Методы персонализированного синтеза речевого сигнала.
2.1.1. Основные характеристики артикуляторного метода синтеза речи по тексту.
2.1.2. Основные характеристики формантного метода синтеза речи по тексту.
2.1.3. Основные характеристики компиляционного метода синтеза речи по тексту.
2.1.4. Основные характеристики корпусного метода синтеза речи по тексту.
2.1.5. Выбор метода синтеза речи по тексту для передачи индивидуальности голоса и манеры чтения.
2.2. Методы моделирования просодических характеристик речи.
2.2.1. Автосегментная просодическая модель.
2.2.2. Просодическая модель IPO.
2.2.3. Суперпозиционная просодическая модель.
2.2.4. Непрерывная параметрическая просодическая модель.
2.2.5. Просодическая модель портретов акцентных единиц.
2.3. Методы выбора базовых речевых единиц для синтеза речи.
2.4. Методы формирования речевых и текстовых корпусов для создания индивидуализированных речевых баз данных.
2.5. Методы сегментации и маркировки естественного речевого сигнала.
Глава 3. Экспериментальные исследования фонетико-акустических и просодических характеристик речи.
3.1. Исследование внутрисловных и межсловных фонетико-акустических явлений в русской речи.
3.1.1. Методика эксперимента.
3.1.2. Гласные в сочетаниях «гласная-гласная».
3.1.3 Гласные в сочетаниях «согласная – гласная», «гласная - согласная».
3.1.4 Акустические характеристики согласных.
3.2. Исследование фонетико-акустических особенностей сегментации последовательности слов на слоги.
3.3. Исследование межъязыковых и междикторских различий просодических характеристик речи.
3.3.1. Методика создания мелодических портретов акцентных единиц.
3.3.2. Результаты исследования межъязыковых различий.
3.3.3. Результаты исследования междикторских различий.
3.4. Исследование персональных особенностей синтагматического членения речи.
3.4.1. Методика эксперимента.
3.4.2. Статистические характеристики синтагматического членения.
3.4.4. Обсуждение результатов эксперимента.
Глава 4 Компьютерная модель мультиволнового синтеза речи по тексту.
4.1. Структура синтезатора речи по тексту.
4.2. Текстовый процессор.
4.2.1. Блок предварительной обработки.
4.2.2. Блок морфологической и акцентной маркировки слов.
4.3. Просодический процессор.
4.3.1. Блок членения текста на предложения, пунктационные и лексические синтагмы.
4.3.2. Блок членения ПС и ЛС на синтаксические синтагмы и их разметка на акцентные единицы.
4.3.3. Блок маркировки интонационного типа синтагм.
4.4. Фонетический процессор.
4.4.1. Блок преобразования слов – фонетических исключений.
4.4.2. Блок преобразования буква-фонема.
4.4.3. Блок преобразования фонема-аллофон.
4.5. Акустический процессор.
4.5.1. Блок синтеза акустико-просодических характеристик речевого сигнала.
4.5.2. Блок синтеза акустико-фонетических характеристик речевого сигнала.
4.5.3. Алгоритм просодической обработки речевого сигнала в акустическом процессоре.
4.6. Программная реализация системы синтеза речи “Мультифон”.
4.6.1. Функциональная схема системы.
4.6.2. Пользовательский интерфейс системы «Мультифон».
4.6.3. Оценка разборчивости синтезированной речи.
Глава 5. Компьютерное клонирование индивидуальных характеристик речи.
5.1. Факторы вариативности речевого сигнала.
5.2. Основные этапы компьютерной технологии клонирования фонетико-акустических характеристик речи.
5.2.1. Выбор и подготовка текстовых и речевых корпусов.
5.2.2. Разметка речевого корпуса на фонетические и просодические сегменты.
5.2.3. Автоматическая сегментация и маркировка речевого сигнала.
5.2.4 Создание оптимального набора элементов компиляции.
5.3. Алгоритмы автоматического создания БД фонетических элементов компиляции.
5.3.1 Алгоритмы «отсекающего.
5.5.2. Пользовательский интерфейс системы «ИнтоКлонатор».
5.5.3. Результаты практического использования системы «ИнтоКлонатор».
5.6. Оценка правдоподобия синтезированного речевого клона.
Приложение 1. Текстовый корпус для создания БД элементов компиляции.
П 1.1. Текст для создания мини-набора аллофонов русской речи.
П 1.2. Текст для создания макси-набора аллофонов, диаллофонов и аллослогов русской речи.
П 1.3. Мини-текст для создания основного набора просодических портретов русской речи.
Приложение 2. Таблицы генерации мини-набора аллофонов русской речи.
П 2.1. Аллофоны гласных фонем.
П 2.2. Аллофоны согласных фонем.
Приложение 3. Статистика фонем, дифонем, фонослогов и их аллофонических вариантов.
П 3.1. Фонемы, дифонемы, фонослоги.
П 3.2. Позиционные диаллофоны и аллослоги.
П 3.3. Позиционно-комбинаторные аллофоны, диаллофоны, аллослоги.
Приложение 4. Спектральные портреты основных аллофонов русской речи.
П 4.1. Основные аллофоны гласных фонем: A, E, U, Y, I, O.
П 4.2. Согласные фонемы.
Приложение 5. Мелодические портреты основных интонационных типов вопросительной интонации русской речи.
П 5.1. Мелодические портреты интонации частного и общего вопросов с различным количеством АЕ.
П 5.2. Мелодические портреты интонации частного вопроса с вопросительным местоимением без частицы и с частицами бы, же, -нибудь, ну, а, и, да.
П 5.3. Мелодические портреты интонации частного вопроса с вопросительными частицами ли, разве, правда, никак, а, и.
Приложение 6. Списки служебных частей речи (предлогов, частиц, междометий, союзов), местоимений и словфонетических исключений.
П 6.1. Предлоги.
П 6.2. Частицы.
П 6.3. Междометия.
П 6.4. Союзы.
П 6.5. Местоимения.
П 6.6. Фонетические исключения.
Литература.
Сведения об авторах.
Бесплатно скачать электронную книгу в удобном формате, смотреть и читать:
Скачать книгу Компьютерный синтез и клонирование речи, Лобанов Б.М., Цирульник Л.И., 2008 - fileskachat.com, быстрое и бесплатное скачивание.
Скачать pdf
Ниже можно купить эту книгу по лучшей цене со скидкой с доставкой по всей России.Купить эту книгу
Скачать - pdf - Яндекс.Диск.
Дата публикации:
Теги: учебник по информатике :: информатика :: компьютеры :: Лобанов :: Цирульник
Смотрите также учебники, книги и учебные материалы:
Следующие учебники и книги:
- Методы и средства защиты информации, Хорошко В.А., Чекатков А.А.
- Криптографические методы защиты информации, Рябко Б.Я., Фионов А.Н., 2005
- Свободное программное обеспечение на уроке информатики, Пожарина Г.Ю., 2010
- Получение и обработка изображений на ЭВМ, учебно-методическое пособие, Старовойтов В.В., Голуб Ю.И., 2018
Предыдущие статьи:
- Компьютерное зрение, Современный подход, Форсайт Д.А., Понс Ж., 2004
- Компьютерная лингвистика, Марчук Ю.Н., 2007
- Компьютерная графика и web-дизайн, практикум, Немцова Т.И., Назарова Ю.В., 2010
- Информационный анализ/синтез для формирования вторичного потока документов, Блюменау Д.И., 2002