Альтернативным аналоговому скремблированию методом передачи речи в закрытом виде является шифрование речевых сигналов, превращенных в цифровую форму, перед их передачей (см. рис. 6.1 - типы С и D). Этот метод обеспечивает более высокий уровень закрытия в сравнении с описанными выше аналоговыми методами. В основе устройств, работающих по такому принципу, лежит представление речевого сигнала в виде цифровой последовательности, которая закрывается по одному из криптографических алгоритмов.

Основной целью при разработке устройств цифрового закрытия речи является сохранение тех ее характеристик, которые наиболее важны для восприятия слушателем. Один из путей - сохранение формы речевого сигнала. Это направление применяется в широкополосных цифровых системах закрытия речи, однако свойство избыточности информации, содержащейся в человеческой речи, разрешает использовать полосу частот более эффективно. Это направление разрабатывается в узкополосных цифровых системах закрытия речи.

Сохранение формы сигнала требует высокой скорости передачи и, соответственно, использования широкополосных каналов связи. Например, при импульсно-кодовой модуляции (ИКМ), которая используется в большинстве телефонных сетей, необходимая скорость передачи, составляет 64 Кбит/с. В случае применения адаптивной дифференциальной ИКМ она снижается до 32 Кбит/с и ниже. Для узкополосных каналов, которые не обеспечивают такие скорости передачи, необходимы устройства, исключающие избыточность речи при ее передаче. Снижение информационной избыточности речи достигается параметризацией речевого сигнала, при которой характеристики речи, важные для восприятия, сохраняются.

Таким образом, правильное применение методов цифровой передачи речи с высокой информационной эффективностью является крайне важным направлением разработок устройств цифрового закрытия речевых сигналов. В таких системах устройство кодирования речи (вокодер), анализируя форму речевого сигнала, делает оценку параметров переменных компонентов модели генерации речи и передает эти параметры в цифровой форме по каналу связи на синтезатор, где в соответствии с этой моделью по принятым параметрам синтезируется речевое сообщение.

В таких моделях речевой сигнал представляется в виде нестационарного процесса с ограниченной скоростью изменения параметров из-за механической инерции голосовых органов человека. На малых интервалах времени (до 30 мс)

параметры сигнала могут рассматриваться как постоянные. Чем короче интервал анализа, тем более точно может быть представлена динамика речи, но при этом необходима более высокая скорость передачи данных. В большинстве практических случаев используются 20-миллисекундные интервалы, и достигается скорость передачи данных 2400 бит/с.

Наиболее распространенными типами вокодеров являются полосные и с линейным предсказанием. Цель любого вокодера - передача параметров, которые характеризуют речь и имеют низкую информационную скорость. Полосный вокодер достигает этого путем передачи амплитуды нескольких частотных полос речевого спектра. Каждый полосный фильтр такого вокодера возбуждается при попадания энергии речевого сигнала в его полосу пропускания. Поскольку спектр речевого сигнала изменяется относительно медленно, набор амплитуд выходных сигналов фильтров образует пригодную для вокодера основу.

В синтезаторе параметры амплитуды каждого канала управляют коэффициентами усиления фильтра, характеристики которого подобны характеристикам фильтра анализатора. Таким образом, структура полосного вокодера базируется на двух блоках фильтров: для анализа и для синтеза. Увеличение числа каналов улучшает разборчивость, но при этом требуется большая скорость передачи. Компромиссным решением обычно становится выбор 16-20 каналов при скорости передачи около 2400 бит/с.

Полосные фильтры в цифровом исполнении строятся на базе аналоговых фильтров Баттерворта, Чебышева, эллиптических и др. Каждый 20-миллисе-кундный отрезок времени кодируется 48 битами, из них 6 бит отводится на информацию об основном тоне, один бит - на информацию "тон-шум", характеризующую наличие или отсутствие вокализованного участка речевого сигнала; другие 41 бит описывают значения амплитуд сигналов на выходе полосных фильтров.

Существуют разные модификации полосного вокодера, приспособленные для каналов с ограниченной полосой пропускания. При отсутствии жестких требований к качеству синтезированной речи удается снизить количество бит переданной информации с 48 до 36 на каждые 20 миллисекунд, что обеспечивает снижение скорости до 1800 бит/с. Уменьшение скорости передачи до 1200 бит/с возможно в случае передачи каждого второго кадра речевого сигнала и в нем - дополнительной информации о синтезе пропущенного кадра. Потери синтезированной речи от таких процедур не слишком большие, преимуществом же является снижение скорости передачи сигнала.

Наибольшее распространение среди систем цифрового кодирования речи с последующим шифрованием получили системы, основным узлом которых являются вокодеры с линейным предсказанием речи (ЛПР).

Метод с линейным предсказанием речи (ЛПМ) работает блоками отсчетов, для каждого из которых вычисляется и передается частота основного тона, его амплитуда и информация о типе возбуждающего действия. [18]

Полученные таким образом данные преобразуются управляющим устройством в кодовое слово (от 10 до 80 бит, в зависимости от используемого метода). Обновления кодового слова происходит не реже, чем один раз в 10-25 мс. Приемлемый уровень разборчивости может быть достигнутый на скоростях 4,8 Кбит/с и даже 2,4 Кбит/с.

Основные усилия разработчиков конкретных реализаций метода LPC направлены, главным образом, на сокращение времени алгоритмической задержки АтЗ (интервал времени между моментами появления сообщения на входе передающего устройства и появления синтезированной речи на выходе принимающего устройства при непосредственном подключении указанных устройств друг к другу и снижении скорости передачи выходного потока данных). В соответствии с рекомендацией G.728 задержка АтЗ не должна превышать 5 мс, скорость передачи выходного потока данных (передача кодовых слов) должна составлять 16 Кбит/с, а качество речи, синтезируемой на выходе тракта передачи, не должна быть ниже, чем при использовании методов, удовлетворяющих требованиям рекомендаций G.721 и G.726.

При выполнении LPC-анализа следует принять во внимание несколько важных групп факторов. Первая группа - это эксплуатационные характеристики: эффективность и стабильность. Вторая группа включает выбор порядка фильтра Р, размер фрейма анализа N. При кодировании речи выборки речи обычно выбирают с частотой 8 кГц, что дает для анализа спектр 4 кГц. В полосе 4 кГц максимальное количество выделяемых формант равно четырем, что требует фильтра как минимум 8-го порядка. Обычно используется 10-типолюсный фильтр, так что резонансы формант и форма основного спектра моделируются достаточно точно. [18]

Выбор размера фрейма осуществляется в соответствии с условиями стационарности. Обычно выбирается размер фрейма длиной несколько тоновых периодов (приблизительно 16-32 мс). Второй фактор - выбор точек деления анализируемого фрейма. Проблема в том, что не существует единых методов оптимального деления. Среди эффективных приемов можно выделить следующие: первоначальное искажение сигнала до LPC-анализа и использование частичного перекрытия взвешенных фреймов. Перекрытие фреймов призвано попытаться преодолеть некоторые граничные эффекты фреймового LPC-анализа. Длина перекрытия составляет около 10-20% размера фрейма. С успехом используется интерполяция LPC-коэффициентов от одного фрейма к другому с целью сгладить переходные процессы.

Поскольку S(Z) = H(Z)U(Z), то U(Z) = H 1(Z)S(Z) . Сигнал погрешности или возбуждения используется для получения параметров. Одной из причин этого заключается в том, что после инверсной фильтрации остаточный сигнал e(h) имеет существенно менее резкое изменение спектра, чем исходный сигнал A(h).

Математическое представление модели цифрового фильтра, используемого в вокодере с линейным предсказанием, имеет вид кусочно-линейной аппроксимации процесса формирования речи с некоторыми упрощениями, а именно: каждый текущий отсчет речевого сигнала является линейной функцией Р предыдущих отсчетов. Несмотря на несовершенство такой модели, его параметры обеспечивают приемлемое представление речевого сигнала.

В вокодере с линейным предсказанием анализатор выполняет минимизацию ошибки предсказания, представляющей собой разницу текущего отсчета речевого сигнала и средневзвешенной суммы Р предыдущих отсчетов, где Р - порядок предсказания, а весовые коэффициенты являются коэффициентами линейного предсказания.

Оценка качества проводится по минимуму среднеквадратичной величины ошибки предсказания. Существует несколько методов минимизации ошибки. Общим для всех есть то, что при оптимальной величине коэффициентов предсказания спектр сигнала ошибки приближается к "белому" шуму, и соседние значения ошибки имеют минимальную корреляцию. Известные методы делятся на две категории: последовательные и блочные, которые получили наибольшее распространение.

В вокодере с линейным предсказанием речевая информация передается тремя параметрами: амплитудой, сигналом "тон/шум" и периодом основного тона для вокализованных звуков. Так, соответственно федеральному стандарту США, период анализируемого отрезка речевого сигнала составляет 22,5 мс [18], что соответствует 180 отсчетам при частоте дискретизации 8 кГц. Кодирование в этом случае выполняется 54 битами, что соответствует скорости передачи 2400 бит/с. При этом 41 бит отводится на кодирование десяти коэффициентов предсказания, 5 - на кодирование значения амплитуды, 7 - на передачу периода основного тона, и 1 бит определяет решение "тон/шум".

При подобном кодировании предполагается, что все параметры независимы, однако в естественной речи параметры коррелированны, и возможно значительное снижение скорости передачи данных без потери качества, если правило кодирования оптимизировать с учетом зависимости всех параметров. Такой подход известен под названием векторное кодирование. Его применение к вокодеру с линейным предсказанием позволяет снизить скорость передачи данных до 800 бит/с и менее с очень незначительной потерей качества.

Основной особенностью использования систем цифрового закрытия речевых сигналов является необходимость использования модемов. В принципе, возможны следующие подходы при проектировании систем цифрового закрытия речевых сигналов.

Цифровая последовательность параметров речи с выхода вокодерного устройства подается на вход шифратора, где подвергается преобразованию по одному из криптографических алгоритмов, а затем поступает через модем в канал связи, на приемной стороне которого выполняются обратные операции по восстановлению речевого сигнала с применением модема и дешифратора (см. рис. 6.1 - тип В). Модем представляет собой отдельное устройство, обеспечивающее передачу данных по одному из протоколов, рекомендованных МККТТ. Модемы могут быть представлены или в виде отдельных устройств, или в программно-аппаратной реализации самого вокодера.

Функции шифрования и дешифрования обеспечиваются самим модемом (так называемый засекречивающий модем) - обычно по известным криптографическим алгоритмам типа DES и др. Цифровой поток, несущий информацию о параметрах речи, с выхода вокодера непосредственно поступает на такой модем. Организация связи по каналу аналогична описанной выше.

Чтобы избавиться от недостатков кодеров формы и вокодеров, был разработан гибридный метод кодирования, объединяющий преимущества обоих методов. По виду анализа гибридные кодеры делятся на два класса: с частотным разделением и временным разделением.

Главная концепция кодирования с частотным разбиением заключается в разделении речевого спектра на частотные полосы или компоненты. Соответственно, может использоваться или набор фильтров, или блок-преобразователь. После кодирования и декодирования эти составляющие используются для точного воспроизведения модели входного сигнала путем суммирования сигналов, полученных на выходе фильтров, или инверсных значений, полученных после преобразования. [14]

Аналоговое скремблирование | Защита информации в телекоммуникационных системах | Алгоритм речеобразования celp


Защита информации в телекоммуникационных системах



Новости за месяц

  • Май
    2019
  • Пн
  • Вт
  • Ср
  • Чт
  • Пт
  • Сб
  • Вс