Tuesday 29 May 2012

Синтезированный и самплированный звук в современной музыке

Виктор В. Пушкар
(для журнала Мой Компьютер, 2000 г.)


Эти заметки написаны мной на основе внимательного чтения ученых книг, личного общения с исполнителями очень разных стилей и собирания относительно связанных между собой фактов в Интернет. А также, что более важно, личного опыта нажимания на клавиши и кручения ручек. В результате этих действий на свет появлялась музыка, от индустриального рока до эмбиент и дарквейв. 

То, что играете Вы, может сильно отличаться от того, что играю и слушаю я. Однако конкретная модель синтезатора во многом сохраняет свои свойства, даже если один человек применяет ее в традиционной поп-музыке, а другой - в электронном авангарде. Кроме того, есть законы музыкального восприятия, общие для музыки раннего средневековья, рэпа или брейк-бита. Их знание бывает полезно разным людям и в разных ситуациях. Писать постараюсь попроще, чтобы Вы поняли, но при этом сохраняя в целости наиболее важные моменты. И заодно отвечу на пару читательских FAQ’ов.

Итак,
1. Что же на самом деле способен услышать человек?

Популярное заблуждение: “колебания воздуха с частотой от 20 Гц до 20кГц”. Откройте свой древний учебник акустики на последней странице и посмотрите, в каком году он издан. А теперь внимательно прочтите об условиях эксперимента, в которых народ впервые услышал эти злополучные “двадцать-двадцать”. Участникам предъявлялись простые искусственные сигналы - в основном синусоиды и последовательности импульсов.

Человек уверенно слышит инфранизкие частоты от десятых, а в некотрых случаях - сотых долей герца. Но только в сочетании со звуковыми. Сложная низкочастотная модуляция сигнала обязательно присутствует в голосе певца, партии саксофона или скрипки. Более того, примерно 40% клеток слуховой коры человека реагируют именно на “инфраниз”. Без него звук кажется скучным и “пластмассовым”, с ним - приятным и естественным, даже если проистекает из синтезатора.

Представьте - на вопрос “Что ты слушаешь?” Некто отвечает: “Колебания звуковых частот с низкочастотными модуляциями”. Вы подумаете, что Некто либо шутит, либо издевается над Вами, либо у него легкие проблемы по психиатрической части. Поверьте моему опыту, колебания звуковых частот могут колебаться очень по-разному. Если они оказались достойны фиксирования на пластинке или компакт-диске, весьма вероятно, что это - музыка. А даже в самой странной музыке, включая noise, industrial, radical ambient, есть своя структура, организованная с учетом высоты звука и временных интервалов. Если Некто серьезно утверждает, что его музыка - продукт интуитивного кручения ручек на звуковых модулях и гитарных примочках, можете ему верить. Все равно Некто оценивает результат их кручения в соответствии с законами психоакустики и психологии восприятия, и отбирает среди случайных положений ручек соответсвующие наиболее приятным для собственного слуха звуковым объектам. Будучи талантливым человеком, он отберет Именно То, Что Надо.

Элементарные волновые формы в человеческом восприятии образуют более сложную структуру - звуковой объект. Т.е. - реальный или созданный системой звуковоспроизведения (в самом простом случае, усилителем и колонками) источник звука. Для него характерны индивидуальность и относительное постоянство высоты, тембра и положения в пространстве. В большинстве случаев слушающий может указать на него пальцем: “Я слышу отсюда” и дать пару определений по поводу его характера. Например, “высокий-низкий”, или “яркий”, “чистый”, “медленно вибрирующий”. Конечно, в некоторых особых случаях пианист скажет: “я слышу кабинетный рояль “Блютнер”, а зоолог - “это голос взрослого самца носорога”. При этом они оба слышат звуковые объекты. Голос взрослого самца носорога применить в музыке сложнее, чем кабинетный рояль, однако может найтись благородный безумец, которому это удастся. Самплеры для чего придумали : )?

Объекты приблизительно одинаковой высоты, тембра и положения в пространстве в слухом восприятии, как правило, сливаются. Попробуйте услышать голос отдельно взятого мальчика в хоре, или хотя бы вторую скрипку в оркестре. И наоборот, один музыкальный инструмент может образовывать несколько объектов, различающихся по высоте и тембру.

Звуковые объекты связаны между собой соотношениями консонанса и диссонанса, в зависимости от высоты звука и внутренней структуры. Понятия о взаимном соответствии или несоответствии двух объектов очень сильно различаются в разных культурах. Сравните музыку Японии или Индонезии с немецкой классикой, или даже брит-поп с настоящим черным рэпом. Еще сильнее различаются объяснения этих соответствий, которые Вам дадут музыковед, практикующий звукорежиссер или психолог. Свои объяснения есть у лабуха из соседней “точки общественного питания”, у буддисткого монаха из Тибета, и у регента церковного хора. Возможно, есть они и у Вас. Вы тоже правы. Со своей колокольни...

Звуковое поле - реальное или виртуальное акустическое пространство, в котором существуют объекты. Обычно мы слушаем сочетание того и другого. Сигнал на компакт-диске записан со “своей” искусственной и/или естественной реверберацией. При попадании в комнату, где его слушают, добавляются отражения от стен, пола, резонансы находящихся в ней предметов. Каждый из них вносит больший или меньший вклад в реверберационный процесс. Вы когда-нибудь пробовали слушать любимые диски в комнате, откуда вынесли мебель? Странное ощущение... У акустики каждого реального помещения, у каждого устройства искусственной реверберации есть свои признаки. Как достаточно общие (размер, “яркость”, “теплота”),  так и индивидуальные, безошибочно узнаваемые опытным слушателем.

Комната прослушивания тоже может больше или меньше соответствовать музыке. И по акустике, и даже по своему Дзену. Согласитесь, легче представить команду индустриальных шумовиков-затейников в механическом цехе, чем на сцене оперного театра или на поляне вокруг костра.

УГОЛОК МАНЬЯКА
Расположение звукового объекта может отличаться от расположения источника в физическом пространстве. Например, когда источник звука находится далеко или спрятан за преградой, и мы слышим отражение (объект - отражающая поверхность - оператор) громче прямого сигнала (объект - оператор). Второй случай - когда сигнал подается в систему звукоусиления (см. картинку - где гитарист, где колонки, а где - кажущийся источник звука). Регулируя панораму (громче левый или правый канал), добавляя реверберацию и фазовый сдвиг, мы можем поместить звуковой объект на место играющего музыканта, или в какое-нибудь другое, сделать его точечным либо слегка “растянутым”. Смотря как поставлена акустика и какие эффекты применяются...

Кстати, еще лет двадцать назад проводились опыты следующего характера. На сцене, закрытой плотным занавесом, стояли инструменты и пара хороших колонок. В зал поочередно подавался “живой звук”, и фонограмма со студийного магнитофона, записанная на тех же инструментах теми же музыкантами. Публике задавали один вопрос: играет “фанера” или живой человек? Ответы распределились почти 50:50, т.е. случайно.

Согласен, во время “фанерного” концерта у публики может возникнуть более или менее четкое ощущение, что присутствующих обманывают. Только это больше зависит от качества звукового материала и происходящего на сцене действа, чем от самого факта наличия фонограммы. Кто назовет электронную ритм-секцию в индустриальном роке или рэперские скретчи “обманом покупателя”? Почти любая современная музыка хотя бы чуть-чуть “фанерна” или “электронна”. Или Вы станете ругать фильм о марсианах на том основании, что марсиане там бегают не живые, а снятые на кинопленку : )))?
ВЫХОД ИЗ УГОЛКА МАНЬЯКА

Вернувшись из кинозала в звуковую студию, мы обнаружим, что современная профессиональная аппаратура нижней ценовой категории, т.е. доступная человеку среднего достатка, звучит почти так же убедительно, как самый что ни на есть hi end 60-х и 70-х. А по сервисным функциям иногда его превосходит. Если для старого блюзмена катушечный магнитофон и ламповый комбик - не просто приборы, но и часть образа жизни, то лишенного ностальгических чувств DJ или кибер-панка вполне устроит компьютер со звуковой картой. Их в одном компьютере можно держать больше, чем комбиков и электроорганов в целой студии.

В связи с этим возникает следующий вопрос:
2. Насколько качественно нужно отсамплировать марсианина, кабинетный рояль или взрослого самца носорога, чтобы на слух они воспринимались как настоящие? Для собственного удобства разобъем его на две части. Какими характеристиками должно на сегодняшний день обладать устройство цифровой звукозаписи? И - каким образом его можно применять в музыке?

Для начала напомним читателям основные характеристики самплеров.
Частота самплирования (sampling rate) - количество отсчетов уровня сигнала в единицу времени. Цифро-аналоговый и аналого-цифровой преобразователь (соответственно ЦАП и АЦП) для повышения точности работают от своих часов, частота которых обычно не указывается. Вместо нее дают oversampling rate - цифру, указывающую отношение “частота часов/частота самплирования”.

Разрядность (bit rate) - определяет максимально возможное количество дискретных уровней сигнала в каждом отсчете. Составляет от 8 у самых старых до 16 и даже 24 бит у последних моделей. Собственно, именно эти значения являются “родными” для большиства звуковых систем. Причина понятна: кратность восьми. Некоторые старые самплеры (серии Casio FZ, Ensoniq Mirage, их аналоги от Roland и Akai) были двенадцатибитными. Но потом подешевели конверторы и память. Точно так же сейчас 24-битные устройства вытесняют промежуточные 20-битные. Очень важной характеристикой является разрядность внутренней обработки сигнала. От нее зависит, насколько точно обрабатываются самые тихие участки партии, а также качество работы встроенных эффектов. Операционные системы современных “железных” самплеров  работают с 24, профессиональные программы под PC и Mac - с 24 и 32 битами.

Что происходит, когда Вы “раскладываете” сампл по клавиатуре и воспроизводите его, к примеру, на октаву или квинту ниже начальной высоты? (Кто не учился в музыкальной школе: октава - это соотношение частот 2:1, квинта - 3:2). Операция сдвига по высоте (pitch shift) состоит в том, что скорость воспроизведения изменяется пропорционально транспонированию (изменению высоты). Т.е. исходный звук, понизившись на октаву, делается в два раза длиннее. При этом часть энергии сигнала уходит за пределы звуковых частот и дает посторонние призвуки (alias). Их более или менее успешно убирает специальный фильтр (anti-alias filter). В старых моделях 8...12-битных самплеров их делали более сложными по сравнению с современными, где сами ЦАП звучат на порядок лучше. Вспомните Gravis Ultrasound, звуковые чипы древнего Commodor или Amiga. Для многих компьютерных маньяков они стали такой же частью образа  жизни, как ламповый “комбик” для блюзмена.

Функции time stretch (да, почти как на проигрывателе винила), позволяющая менять длительность независимо от высоты, или транспонировать с сохранением длительности появились позже; они требуют более сложных вычислений, т.к. большую часть отсчетов сигнала волновой редактор “додумывает” самостоятельно. При этом даже в самых продвинутых программах получаются более существенные искажения alias. Успех операции транспонирования зависит еще и от качества самплов. Чем качественней исходный звук, тем больше от него останется : )).

В продолжении: как сделать качественный сампл, что такое Hi-Fi и Lo-Fi, разные способы синтеза, и другие истории из жизни звуковых объектов.

No comments:

Post a Comment