Разделы сайта

Кодирование речи

Для передачи голоса по IP-сети, человеческий голос оцифровывается (АЦП) при помощи импульсно-кодовой модуляции, сжимается (кодируется) и разбивается на пакеты. На принимающей стороне, происходит обратная процедура - данные извлекаются из пакетов, декодируются и преобразуются обратно в аналоговый сигнал (ЦАП).

Кодирование вносит дополнительную задержку порядка 15-45 мс, возникающую по следующим причинам:

§ использование буфера для накопления сигнала и учёта статистики последующих отсчётов (алгоритмическая задержка);

§ математические преобразования, выполняемые над речевым сигналом, требуют процессорного времени (вычислительная задержка).

Подобная задержка появляется и при декодировании речи на другой стороне.

Задержку кодека необходимо учитывать при расчёте сквозных задержек. Кроме того, сложные алгоритмы кодирования/декодирования требуют более серьёзных затрат вычислительных ресурсов системы.

Проведённый в различных исследовательских группах анализ качества передачи речевых данных через Интернет показывает, что основным источником возникновения искажений, снижения качества и разборчивости синтезированной речи является прерывание потока речевых данных, вызванное:

§ потерями пакетов при передаче по сети связи;

§ превышением допустимого времени доставки пакета с речевыми данными.

Это требует решения задачи оптимизации задержек в сети и создание алгоритмов компрессии речи, устойчивых к потерям пакетов (восстановления потерянных пакетов).

Самое читаемое:

Модификация метода наименьших квадратов Прони
При передаче и хранении аналоговых сигналов могут происходить искажения или потери участков данных[1,2]. Это могут быть нерегулярные сбои в телеметрических каналах, механические повреждения носителей аудиозаписей (аудиокассет или грампластинок) и другие подобные ситуации, общим в которых является нерегулярность следования поврежден ...

www.techstages.ru : Все права защищены! 2018