Как бы то ни было, это всё относится к цифровым характеристикам звука (частота, битность, скорость передачи). Однако есть ещё одна характеристика, которая не описывается в документации и которую многие производители и администраторы упускают из виду при производстве и установке голосовых приветствий - это звуковая составляющая, содержащийся диапазон частот в звуке (АЧХ звукового сигнал) и его подверженность изменению при путешествии от АТС и до абонента.
Примеры
Каким образом получается так, что происходит это упущение. Тут есть понимание трёх причин. О них и пойдёт речь далее.
1. Некомпетентность
Первая причина весьма банальна - обычное незнание того, что при производстве звукового файла для последующего воспроизведения через маленький динамик в трубке абонента нет совершенно никакой необходимости передавать максимальный диапазон частот в звуке. Помимо того, что он попросту не передаётся в полном объёме через динамик, так он ещё и искажается при передаче по всему тракту линии. Более того, загрузка звукового файла с широким диапазоном частот даёт нагрузку на систему, замедляется скорость передачи (на этапах, когда передаётся цифровой сигнал) и к тому же, в этот момент неизбежно возникают ошибки, сигнал становится некачественным. На вопрос заказчика производителю голосового приветствия о том, почему голосовое приветствие в телефоне звучит тихо, сразу же следует ответ, что такова природа линии, по которой передаётся звук, таково качество передающей станции АТС – они изменяют исходное голосовое приветствие. Хотя, на самом деле, качество громкости можно было увеличить, загрузив звуковой файл, в котором намеренно ограничен частотный диапазон. Это была рассмотрена распространённая ошибка производителей голосовых приветствий, которые не некомпетентны в специфике.
2. Лень
Вторая же причина кроется в лености. Лень производить какие-то дополнительные работы, которые в принципе можно и не производить рождает халтуру. Правильно, зачем делать что-то ещё дополнительно, когда можно будет сослаться на некачественную систему передачи, линию передачи и устройство воспроизведения?!
3. Намеренное допущение
И наконец, третья причина кроется в намеренном допущении такой ситуации. Отдавая клиенту голосовое приветствие, в котором звук не отфильтрован, в котором содержится полный спектр частот, переданных звуку трактом записи и цепочкой обработок, производители идут на поводу у неправильных тенденций, стремясь блеснуть качеством звука и одновременно боясь осуждения клиентом выполненной работы (в случае передачи файла, обработанного фильтрами). Ведь послушайте, как хорошо звучит голосовое приветствие без соответствующей обработки фильтрами:
M_1_IVR_4_no_teh
PLAY PAUSE |
А вот как это же приветствие звучит с ограниченным частотным диапазоном:
M_1_IVR_4_teh_1
PLAY PAUSE |
Что может сказать клиент о таком звуке, особенно, если сравнит его с другим файлом, произведённым другим исполнителем, но не обработанным должным образом? Конечно же, он не будет вдаваться в подробности и вынесет вердикт о не качественном звуке.
Нежелание доводить до сведения клиента причины такого звучания, подготовленного голосового приветствия, боязнь осуждения, боязнь споров и выслушивания необоснованных претензий, стремление предоставить работу, воспринимаемую клиентом как лучшую, чем все ранее слышанные или хотя бы не худшую на их фоне, заставляет игнорировать момент обработки звукового сигнала фильтрами. Конечно же, гораздо проще снова вспомнить доводы о некачественной системе передачи, линии передачи и устройстве воспроизведения.
Решение
Однако, что же мешает производителю подготовить 2 варианта приветствия? Первый - с полным спектром, покажет всю красоту, глубину, полноту и широту звука, а второй - будет прокомментирован, как файл - оптимизированное голосовое приветствие для установки в офисную АТС или систему провайдера it-телефонии.
Так как сигнал в телефонной линии передаётся в диапазоне от 300 до 3400 герц, проходя через телефонную станцию избыточные частоты отрезаются. Это неизбежно меняет и искажает звук. Соответственно, вследствие такого выхолащивания, меняются и динамические характеристики звука, такие, как громкость, плотность, уровень звукового давления. Поэтому, необходимо заранее избавляться от избытков и приводить в удовлетворительный вид все уровни, пока ещё такая возможность имеется.
Исследование
Давайте попробуем зрительно изобразить, что происходит со звуком на всех этапах. На этом скрине показано изображение звуковой волны, сгенерированное звуковым редактором.
Что мы слышим на рисунке? Да! Именно слышим. Опытные звукорежиссёры могут представить аналог звучания без прослушивания самого звука по анализу отображения волны и других буквенно - цифровых показателей данных, снятых со звука и описать словами, как возможно звучит звук. На картинке изображена довольно плотная звуковая волна с маленьким динамическим диапазоном. Это означает, что повествование диктором ровное, без каких-либо подъёмов и спадов в громкости. Взглянув на АЧХ сигнала, можно сделать утверждение, что файл ещё не подготовлен для воспроизведения через телефонную линию:
M_1_IVR_4_no_teh
PLAY PAUSE |
В общем, в таком виде голосовое приветствие было показано заказчику и принято.
После того, как приветствие устанавливается в систему, запускается передача данных и сигнал попадает на телефонную станцию, лишние частоты срезаются фильтрами. Происходит выхолащивание сигнала. Те частоты, которые изначально передавали всю полноту звука, а на предыдущем изображении формировали ровный и плотный рисунок, теперь выглядят и звучат совсем иначе. Их отсутствие в потоке данных показывается в следующем визуальном отражении:
Сразу, при взгляде на такое изображение волны, хочется внести кое-какие правки. Но сигнал летит абоненту и уже нет возможности его подкорректировать.
Далее, пролетев десятки, сотни, а то и тысячи километров по проводам и воздуху, возможно неоднократно преобразуясь из цифрового в аналоговый и обратно, сигнал попадает в телефонную трубку абонента и начинает воспроизводиться из её малюсенького динамика. Бесчисленные модели телефонных трубок имеют самые разные по качеству динамики, которые вносят свою лепту в звучание. Таким образом, характеристики звука изменились очень сильно.
M_1_IVR_4_no_teh_3
PLAY PAUSE |
Теперь изобразим то же самое, только предварительно подготовим звук.
Исходный файл, ровный плотный сигнал с широким спектром частот:
M_1_IVR_4_no_teh
PLAY PAUSE |
Обрезаем фильтрами и получаем выхолощенный сигнал. Как будто палка колбасы, с которой пообщался голодный кот:
M_1_IVR_4_teh_1
PLAY PAUSE |
Именно на этом этапе происходит ключевой момент обработки звука и увеличения его громкости. Можно поэкспериментировать с настройками и сделать несколько вариантов плотности звука.
Корректируем, заполняя динамическое пространство - провалы (обглоданные голодным котом места), образовавшиеся в результате работы фильтров:
Всё, теперь голосовое приветствие сдаём клиенту. Оно устанавливается в систему и отправляется на телефонную станцию. Есть избытки в сигнале или нет, фильтры на телефонной станции работают как стражники - через них проходит весь сигнал независимо ни от чего. И, тем не менее, фильтры внесут свои коррективы в звук. Попадая в динамик телефонной трубки абонента, звучит уже немного другая звуковая картина:
M_1_IVR_4_teh_3
PLAY PAUSE |
Давайте сравним неоптимизированное и оптимизированное приветствия прослушиваемые абонентом. Вот для сравнения два варианта. Первый вариант предполагает, какой звук был бы доставлен в трубку абоненту без предварительной подготовки. А второй вариант показывает, какой звук будет в итоге слышать абонент, если предварительно звук обработать по приведенной выше интсрукции. Очевидно, что второй вариант звучит более выйгрышно:
Неоптимизированное голосовое приветствие:
M_1_IVR_4_no_teh_3
PLAY PAUSE |
Оптимизированное голосовое приветствие:
M_1_IVR_4_teh_3
PLAY PAUSE |
Конечно же, само звучание и его визуальное отображение не передаёт истинную картину, как если бы это всё было зафиксированно в результате натурального исследования. Представленные данные были сделаны искусственно с целью передать основную мысль о необходимости приведения АЧХ голосовых приветствий к передаваемому диапазону телефонными станциями. Но в целом, эти данные показывают схематично, реальное положение дел при путешествии сигнала от АТС к абоненту.
Аналогии
Есть несколько аналогий, которые можно привести в заключение, объясняя необходимость сжатия спектра:
Изображения в интернете
Публикация картинок на интернет страничке. Перед публикацией, картинка всегда сжимается до необходимых размеров, т.е., если на странице она должна отображаться с шириной в 250 пикселей, то и её необходимо привести к этому знаменателю до загрузки на сервер и размещения на страничке. Однако, некоторые администраторы сайтов грешат игнорированием момента необходимости оптимизации изображений для web, размещая их на сервер в огромных размерах, указывая редактором, в каком размере отображать на страничке, тем самым нагружая систему ненужными процессами, затормаживая загрузку страницы и неэкономно расходуя пространство, выделенное под файлы сайта.
Толпа детей
Дверь и толпа детей. Если построить детей по парам в ряд и направить их, следуя друг за другом, они гораздо безопаснее пройдут препятствие, которое ограничивает своей пропускной способностью. Никогда не протиснутся в дверной проём одновременно 20 детишек. Они будут толкаться, кричать, могут причинить друг другу ранения. Поэтому, их следует организовать ещё до момента прохождения препятствия и толпа детей дисциплинированно пройдёт в дверной проём, следуя друг за другом.