Hello our valued visitor, We present you the best web solutions and high quality graphic designs with a lot of features. just login to your account and enjoy ...

Самый первый кодек, разработанный для IP телефонии стал кодек G.711. Этот стандарт стал де-факто самым популярным и нынче используется в таких протоколах как SIP и SCCP. Он использует полосу пропускания в 64 кбит/секунду и наверное знаком всем, кто имеет дело с современной IP-телефонией.
Стандарт был разработан в 70-х годах прошлого столетия и в данный момент срок патента на него истёк, и он является народным достоянием.

Этот кодек не предполагает никакого сжатия, помимо компандирования — метода уменьшения эффектов каналов с ограниченным динамическим диапазоном. В основе данного метода лежит принцип уменьшения количества уровней квантования сигнала в области высокой громкости, сохраняя при этом качество звука. Сигнал в данном кодеке предоставлен потоком величиной 64 кбит/с. Частота дискретизации — 8000 кадров по 8 бит в секунду. Качество голоса субъективно лучше, нежели при применении более позднего кодека G.729.

В стандарте описано две широко использующиеся в телефонии схемы компандирования — Mu-law (используется в Северной Америке и Японии) и A-law (используется в Европе и в остальном мире). Оба алгоритма являются логарифмическими, но более поздний a-law был изначально предназначен для компьютерной обработки процессов.

G.729 является кодеком, который сжимает исходный сигнал с потерей данных. Основная идея, заложенная в G.729 — передача не самого оцифрованного сигнала, а его параметров (спектральной характеристики, количества переходов через ноль), достаточных для последующего синтезирования на принимающей стороне. При этом все основные характеристики голоса, такие как амплитуда и тембр сохраняются.

Пропускная способность канала, на которую рассчитан данный кодек — 8 кбит/с. Длина кадра обрабатываемого G.729 — 10 мс, частота дискретизации — 8 кГц. Для каждого из таких кадров определяются параметры математической модели, которые в дальнейшем и передаются в канал в виде кодов.

При использовании кодирования G.729 задержка составляет 15 мс, из которых 5 мс тратится на заполнение предварительного буфера. Отметим также, что кодек G.729 предъявляет достаточно высокие требования к ресурсам процессора.

Помимо G.711 и G.729 существует ещё масса стандартов для кодирования/декодирования аудиосигналов. Наиболее популярными из них являются, G.729a, G.726, G.728.

Если оценивать их по занимаемой полосе пропускания, то увидим следующую картину:

Кодек Занимаемая полоса
пропускания
G.711 64 кбит/сек
G.729 8 кбит/сек
G.729а 8 кбит/сек
G.726 32 кбит/сек
G.728 16 кбит/сек



Казалось бы, если они используют меньшую полосу, то почему не стали популярнее G.711? Дело в том, что полоса пропускания — не самый важный параметр кодека, важна ещё и скорость работы, и как следствие — загрузка DSP (Digital Signal Processor) — цифровго сигнального процессора, который в реальном времени отвечает за кодирование/декодирования сигнала.

Ещё одним немаловажным критерием определяющим успешность того или иного кодека является MOS (Mean Opinion Score, в русской литературе встречается как усреднённая субъективная оценка). Идея MOS очень проста: специально сформированной группе людей предоставляют возможность воспользоваться системой связи и просят поставить оценку от 1 (ужасно) до 5 (отлично). Усредненные данные такого исследования и называются MOS.

Так вот, для указанных мною кодеков оценки MOS имеют следующие значения:

Кодек MOS Примечание
G.711 4,1 по некоторым источникам 4,45
G.729 3,92 съедает много процессорного времени
G.729а 3,7 работает гораздо быстрее G.729, но в ущерб качества
G.726 3,85  
G.728 3,61  


И вот совокупность всех этих факторов (пропускная способность, скорость работы, MOS) определяет главенство того или иного кодека в царстве цифрового кодирования сигналов.

В IP-телефонии на сегодняшний день наиболее распространено преобразование посредством кодека G.729, а также сжатие G.711.

К слову сказать, все эти стандарты (ну которые начинаются на G.) являются плодами деятельности международного консультационного комитета по телефонии и телеграфии (подразделения ITU — международного союза электросвязи) и по сути дела являются проприетарными. А в наше время сложно представить отсутствие свободных альтернатив у проприетраных стандартов. Так и в сфере кодирования аудиосигналов родился стандарт iLBC (internet Low Bitrate Codec), который использует15,2 Кбит/секунду и имеет оценку MOS 4,1. Именно эти факторы наряду с открытостью оказали влияние на то, что данный стандарт используется в Google talk, Yahoo messenger и всем нами любимом Skype.

В данной статье затронуты только кодеки G, да и то избранная их часть. На самом деле их сейчас очень много. К примеру семейство Siren, iSAC, упомянутый чуть выше iLBC и т.д.

По материалам Хабра