Разделы сайта

Кодирование речи

Для передачи голоса по IP-сети, человеческий голос оцифровывается (АЦП) при помощи импульсно-кодовой модуляции, сжимается (кодируется) и разбивается на пакеты. На принимающей стороне, происходит обратная процедура - данные извлекаются из пакетов, декодируются и преобразуются обратно в аналоговый сигнал (ЦАП).

Кодирование вносит дополнительную задержку порядка 15-45 мс, возникающую по следующим причинам:

§ использование буфера для накопления сигнала и учёта статистики последующих отсчётов (алгоритмическая задержка);

§ математические преобразования, выполняемые над речевым сигналом, требуют процессорного времени (вычислительная задержка).

Подобная задержка появляется и при декодировании речи на другой стороне.

Задержку кодека необходимо учитывать при расчёте сквозных задержек. Кроме того, сложные алгоритмы кодирования/декодирования требуют более серьёзных затрат вычислительных ресурсов системы.

Проведённый в различных исследовательских группах анализ качества передачи речевых данных через Интернет показывает, что основным источником возникновения искажений, снижения качества и разборчивости синтезированной речи является прерывание потока речевых данных, вызванное:

§ потерями пакетов при передаче по сети связи;

§ превышением допустимого времени доставки пакета с речевыми данными.

Это требует решения задачи оптимизации задержек в сети и создание алгоритмов компрессии речи, устойчивых к потерям пакетов (восстановления потерянных пакетов).

Самое читаемое:

Разработка микроконтроллерного устройства стабилизации температуры
Эффективная организация контроля информации приобретает всё большее практическое значение, прежде всего как условие успешной практической деятельности людей. Объем информации, необходимой для нормального функционирования современного общества, растёт из года в год. На сегодняшний день складывается ситуация, в которой наряду с самой ...

www.techstages.ru : Все права защищены! 2019