В последних разработках шифраторов нового поколения применяют алгоритм речеобразования CELP. Этот метод основан на линейной авторегрессионной модели процесса формирования и восприятия речи и входит в группу методов анализа через синтез, реализующих современные и эффективные алгоритмы информационного сжатия речевых сигналов. Алгоритмы данного класса занимают промежуточное положение между кодерами формы сигнала, в которых сохраняется форма колебания речевого сигнала в процессе его дискретизации и квантования, и параметрическими вокодерами, основанными на процедурах оценки и кодирования небольшого числа параметров речи, объединяя преимущества каждого из них. [18]

Авторегрессионная модель речевого сигнала описывает его с довольно высокой степенью точности и позволяет применять развитый математический аппарат линейного предсказания. При этом обеспечивается более высокое качество декодированной речи, устойчивость к входному акустическому шуму и ошибкам в канале связи по сравнению с системами с другими принципами кодирования.

В рамках данной модели наиболее перспективными методами кодирования считаются методы "анализа через синтез" с использованием многоимпульсного возбуждения. Особенность многоимпульсного возбуждения состоит в том, что в сигнале остатка линейного возбуждения выбираются такие его значения, которые наиболее важны для повышения качества синтезированной речи. При этом используемая в процедуре анализа через синтез схема кодирования, кроме учета ошибок квантования, включает критерии субъективной оценки качества речевого сигнала, что обеспечивает естественное звучание синтезированной речи.

При многоимпульсном возбуждении сигнал остатка линейного предсказания представляется в виде последовательности импульсов с неравномерно распределенными интервалами и с разными амплитудами (около 8-10 импульсов за 10 мс). Амплитуды и положение этих импульсов определяются на покадровой основе (кадр за кадром). Основным преимуществом многоимпульсного возбуждения является то, что оно определяется для любого речевого сегмента и при этом не нужно знаний ни о вокализованности данного сегмента, ни о периоде основного тона.

В зависимости от способа описания сигнала x(h), поступающего на вход фильтра, можно выделить следующие алгоритмы кодирования:

с возбуждением прореженной последовательностью импульсов -

MPLP (Multi Pulses Linear Prediction);

с самовозбуждением - SELP (Self Excited Linear Prediction);

с кодовым возбуждением - CELP.

Экспериментально установлено, что кодовое возбуждение обеспечивает наиболее высокое качество кодирования речевого сигнала, в том числе и при наличии входных акустических помех. Алгоритм CELP наиболее эффективно применяется при передаче речевого сигнала в диапазоне скоростей от 4 до 16 Кбит/с.

Базовая структурная схема передающей (а) и принимающей (б) частей CELP-кодера показана на рис. 6.11.

В сущности говоря, в алгоритме CELP выполняется векторное квантование последовательности x(h), то есть, позиции выборок и их амплитуды в сигнале многоимпульсного возбуждения оптимизируются одновременно. При этом отрезок (сегмент) сигнала возбуждения выбирается из предварительно сформированной постоянной совокупности - кодовой книги, которая содержит довольно большое количество реализаций (например, некоррелированного гауссовского шума). Избранная реализация усиливается и подается на вход цепи фильтров (6.20) и (6.19).

Поиск оптимальных значений gp и Т синтезатора основного тона, коэффициента усиления и номера элемента кодовой книги осуществляется с помощью "анализа через синтез". В канал связи передаются номер (индекс) элемента кодовой книги с соответствующим коэффициентом усиления, параметры синтезатора основного тона, а также коэффициенты линейного предсказания, характеризующие состояние голосового тракта.

Будучи одной из наиболее распространенных, схема с линейным предсказанием и возбуждением от кода CELP является наилучшей схемой для низких скоростей. В CELP присутствует линейный фильтр с изменяемыми во времени параметрами для выделения грубой и точной спектральной информации. Возбуждение выполняется путем перебора всех векторов из возбуждающей кодовой книги. Векторная последовательность, которая обеспечивает минимальную взвешенную ошибку, считается оптимальным возбуждением .

Процедура AbS в CELP требует больших вычислительных ресурсов, а основная кодовая книга является результатом очень большой исследовательской работы. Хотя CELP - это сложный метод, он способен синтезировать речь с высоким качеством даже на низких скоростях. Вариант кодирования CELP выбран для многих систем речевой связи.

Дискретизация речи с последующим шифрованием | Защита информации в телекоммуникационных системах | Речевой кодер


Защита информации в телекоммуникационных системах



Новости за месяц

  • Апрель
    2019
  • Пн
  • Вт
  • Ср
  • Чт
  • Пт
  • Сб
  • Вс