Текст книги "Компьютерная обработка звука"
Автор книги: Александр Загуменнов
сообщить о нарушении
Текущая страница: 1 (всего у книги 27 страниц) [доступный отрывок для чтения: 10 страниц]
Александр Петрович Загуменнов
Компьютерная обработка звука
Введение
Системы цифровой записи и редактирования звука все больше завоевывают мир. Эта книга целиком посвящена вопросам обработки звука, записанного на цифровой носитель, с помощью персонального компьютера. Собственно запись в книге не рассматривается.
В главе 1 охарактеризованы все основные методы компьютерной обработки аудиозаписей.
В главе 2 описываются встраиваемые приложения (plug-in), то есть дополнительные модули, которые можно использовать практически в любой современной программе обработки звука.
В главе 3 приведены приемы работы с программами и встраиваемыми приложениями, предназначенными для реставрации старых записей.
Глава 4 посвящена обработке звука, созданного с применением стандарта MIDI.
В главе 5 основное внимание уделено ведению нотной записи с помощью компьютера.
Глава 6 целиком посвящена форматам звуковых файлов. В частности, рассмотрен звуковой формат Audio MPEG layer-3 (чаще называемый MP3), основанный на психоакустических алгоритмах обработки и дающий очень хорошие результаты по степени сжатия файлов (в среднем в 11–13 раз) с сохранением приемлемого качества звука. Описана технология получения записей в этом формате, начиная с прямого копирования дорожек компакт-диска и заканчивая кодированием звука.
В главе 7 рассмотрено совместное использование аудиозаписей и MIDI, затронуты вопросы синхронизации.
В главе 8 вкратце обозначена проблематика аппаратной обработки звука.
В главе 9 описаны принципы и возможности создания резервных копий звуковых файлов, а также методы оценки емкости накопителей и влияния различных факторов на качество сохраняемого звука.
Глава 10 содержит описание методов подготовки звуковых файлов к публикации в Internet.
Наконец в главе 11 дан краткий обзор Web-сайтов и Web-страниц, относящихся к рассматриваемой в книге теме. С автором можно связаться по адресу: [email protected] (адрес в Internet: http://www.mega.ru/~sound).
Среди программ обработки звука встречаются как совсем простые, которые обычно прилагаются к звуковым картам при их покупке, так и предназначенные для профессиональной работы. Среди последних выделяются Sound Forge, WaveLab, SAW Plus 32 и Samplitude 2496 для Windows, которые и стали предметом рассмотрения в книге. Они позволяют производить различные действия над звуком, так или иначе изменяя его (порой до неузнаваемости).
В последних версиях всех современных программ-секвенсоров MIDI (то есть редакторов MIDI-файлов) предусмотрена возможность записи и редактирования аудиодорожек, что сближает эти программы с многоканальными звукорежиссерскими системами. В книге рассмотрена программа такого класса Cakewalk.
Музыканты по достоинству оценят материал по программам ведения нотной записи, которые в современной литературе практически не рассматривались. В данной книге подробно описана одна из таких программ – Finale 98.
Так как в разных программах используются соответственно разные алгоритмы обработки звука, эффект от их применения на одном и том же звуковом материале также различается. Поэтому каждый из описанных в книге методов обработки иллюстрируется не одной, а несколькими программами.
Все программы, работающие с оцифрованным звуком, предъявляют довольно жесткие требования к компьютеру. Так, вам понадобится достаточно много свободного места на жестком диске (одна минута стереозаписи с качеством компакт-диска занимает около 10 Мбайт). Для надежной записи и качественного воспроизведения звука (а к этому надо стремиться всегда, независимо от того, любитель вы или профессионал) необходим жесткий диск со средним временем доступа не более 11 мс, а также значительный объем оперативной памяти (не менее 64 Мбайт).
Широкие возможности рассматриваемых в книге программ позволяют использовать их для различных целей: производства фонограмм, мультимедийных приложений и аудиофайлов для Internet, компьютерной телефонии, анализа параметров звука, управления музыкальными инструментами, подготовки нот к изданию. Данные программы дополняют друг друга и предоставляют пользователю средства для решения любых профессиональных задач.
В книге вы найдете подробное описание методов обработки звука при помощи этих программ. Они предполагают наличие на вашем компьютере установленного пакета программного обеспечения для поддержки технологии DirectX. Итак, что это за технология и для чего она используется?
Технологии DirectX и VST
Произведенный компанией Microsoft программный интерфейс DirectX сделал возможным разработку программ для профессиональной (то есть производительной и эффективной) работы с графикой и звуком, в том числе и в реальном масштабе времени. Эта технология совершила революцию в области обработки звука в реальном времени на IBM-совместимых компьютерах, хотя предназначалась в основном для разработчиков компьютерных игр. Ее основной смысл заключается в преодолении ограничений Microsoft Windows по быстродействию при работе приложений с устройствами компьютера (памятью, дисплеем, жестким диском и портами ввода-вывода).
Во второй половине 1997 и в начале 1998 годов на пользователей обрушилась лавина модулей эффектов, написанных специально под интерфейс DirectX. Что же представляет собой модуль эффектов, реализованный по новой технологии, и в чем его достоинства? Для работы с модулями эффектов прежде всего необходимо иметь на компьютере программное обеспечение, предназначенное для обработки звука и имеющее поддержку DirectX. В настоящее время к таким программам относятся Cakewalk версии не ниже 6.0, Sound Forge версии не ниже 4.0, Cool Edit Pro, WaveLab версии не ниже 1.6, Cubase VST, а также программы многоканальной аудиозаписи Samplitude 2496 и SAW Plus 32. При установке любой из этих программ, кроме Cakewalk, в вашей системе DirectX-эффекты не появляются, зато возникает возможность их дальнейшего подключения. При этом драйверы используемой звуковой карты должны быть сертифицированы компанией Microsoft на предмет поддержки DirectX.
Теперь, имея на своем компьютере какой-нибудь встраиваемый по интерфейсу DirectX дополнительный модуль (plug-in) эффектов, вы сможете вызывать этот эффект в любой из перечисленных программ. Благодаря такой технологии появляется возможность пользоваться широким набором самых разнообразных аудиоэффектов, не покидая при этом полюбившейся программы редактирования звука. Характерной особенностью DirectX-эффектов является то, что почти все они работают в реальном времени: достаточно нажать на соответствующую кнопку, и вы сможете отстраивать все параметры выбранной опции прямо в процессе воспроизведения звукового фрагмента, к которому применен эффект.
Известные компании – разработчики музыкального программного обеспечения, такие как Waves, Opcode, Arboretum, сделали вывод, что производительность современных процессоров Intel и уровень программного обеспечения позволяют вести обработку аудиоинформации на компьютере, не прибегая к помощи специальных плат-ускорителей, содержащих процессоры, оптимизированные под обработку звука. Такое положение дел открыло фирмам новый рынок сбыта, и перечисленные компании, ранее на протяжении долгого времени разрабатывавшие алгоритмы эффектов под систему ProTools для Macintosh, приступили к переводу своего программного обеспечения на PC.
На сегодняшний день существует уже довольно много всякого рода DirectX-совместимых эффектов: если установить на компьютере все имеющиеся модули, то в меню DirectX (как оно называется, например, в программе Sound Forge) будет более ста позиций.
Некоторые программы поддерживают также и интерфейс VST. Нужно заметить, что VST является в некотором роде конкурентом DirectX, поскольку этот интерфейс был специально разработан фирмой Steinberg как альтернативная база для создания аудиоэффектов в реальном времени. Из программ, поддерживающих одновременно и DirectX, и VST, пока можно назвать только Cubase VST и WaveLab 2.0.
В настоящее время в связи с ростом производительности компьютеров значительно пополняются библиотеки DirectX-модулей: даже те производители, которые на протяжении долгого времени выпускали модули эффектов для системы ProTools, объявили о переносе их на новую платформу.
Преимущество DirectX-модулей перед традиционно использовавшейся программной обработкой звука очевидно: это полная совместимость со все возрастающим количеством программ обработки звука и, конечно же, возможность обработки сигнала в реальном времени.
Аудиоредактор Sound Forge 4.5
Программа Sound Forge 4.5 представляет собой 32-разрядный аудиоредактор с открытой архитектурой, то есть в ней предусмотрена возможность увеличения числа функций за счет так называемых модулей расширения (plug-in), которые можно приобрести отдельно. Программа поддерживает большое число различных форматов звуковых файлов, при этом могут использоваться разнообразные алгоритмы сжатия аудиоданных.
Производитель: Sonic Foundry, Inc.
Адрес производителя в Internet: http://www.sonicfoundry.com (на сайте представлены новейшая техническая информация, демонстрационные версии программных продуктов фирмы, аннотации на них).
Системные требования
Системные требования для разных платформ, поддерживаемых Sound Forge, несколько отличаются. Обратите внимание, что Sound Forge предполагает наличие инсталлированной на вашем компьютере версии Microsoft DirectX 5.2a или выше. При инсталляции пакета установочная программа предупредит вас, если не обнаружит на вашем компьютере DirectX, и предложит установить поддержку.
Минимальные системные требования для использования Sound Forge под Windows 9x и Windows NT (x86 и Pentium) таковы:
• микропроцессор – 486 SX (рекомендуется Pentium);
• дисплей – VGA;
• оперативная память – 8 Мбайт;
• операционная система – Microsoft Windows 9x или Windows NT 4.0 (или старше);
• свободное пространство на жестком диске для установки программы – 5 Мбайт;
• звуковая плата – Windows-совместимая, для качественной работы она должна обеспечивать разрядность 16 бит и частоту дискретизации 44100 Гц при отношении сигнал/шум не менее 80 дБ.
Аудиоредактор WaveLab 2.01
Программа WaveLab 2.01 представляет собой 32-разрядный аудиоредактор с открытой архитектурой, то есть предусмотрена возможность увеличения числа функций за счет так называемых модулей расширения (plug-in), которые можно приобрести отдельно.
Производитель: Steinberg.
Адрес производителя в Internet: http://www.steinberg.net
Системные требования
Минимальные требования к системе у программы не очень высокие. Достаточно иметь 486-й процессор, желательно с математическим сопроцессором. Однако для работы с эффектами в режиме реального времени в программе WaveLab необходим уже Pentium 90. Оперативной памяти должно быть не менее 8 Мбайт, операционная система – Windows 95/98, Windows NT 3.51 или 4.0. WaveLab занимает около 7 Мбайт на жестком диске. Для программы требуется звуковая плата с драйверами под используемые операционные среды. Для качественной работы плата должна обеспечивать разрядность 16 бит и частоту дискретизации 44100 Гц при отношении сигнал/шум не менее 80 дБ.
Программа WaveLab позволяет работать лишь с несколькими наиболее распространенными форматами звуковых файлов.
Почти все эффекты, имеющиеся в программе, действуют в режиме реального времени. Любой из них может быть вызван и применен во время воспроизведения звукового файла, и все изменения параметров практически мгновенно отражаются на звуке. Такой способ работы очень нагляден и экономит много времени. Достигнув желаемого результата, вы можете должным образом обработать файл и сохранить все изменения.
К достоинствам WaveLab, бесспорно, следует отнести его поразительную скорость, великолепное качество математики, в особенности алгоритмов сжатия и растяжения звуковых фрагментов во времени, работу в режиме реального времени. Одной из интересных особенностей программы является возможность обработки любого сигнала, поступающего на ее вход, собственными эффектами без записи на диск. При таком режиме работы WaveLab становится по сути настоящим процессором эффектов.
Программа многоканальной записи SAW Plus 32
Преимущество новой 32-разрядной архитектуры, которую имеет программа SAW Plus 32, может быть реализовано только при использовании платформы Windows NT с 64 Мбайт оперативной памяти (32 Мбайт недостаточно, так как Windows постоянно будет требоваться подкачка буферов из расположенного на жестком диске файла виртуальной памяти). Определенное увеличение эффективности по сравнению с 16-разрядной архитектурой может наблюдаться и под Windows 95, но в большинстве случаев для максимального увеличения эффективности необходима все же Windows NT.
SAW Plus 32 требует минимум 256 цветов для графики. Однако, чтобы не возникло проблем с Windows, использующей палитру в разных приложениях, настоятельно рекомендуется установка дисплея в 16-битную цветовую гамму (65535 цветов). Это позволит избежать цветовых искажений на экране.
Производитель: Innovative Quality.
Адрес производителя в Internet: http://www.iqsoft.com
Программа многоканальной записи Samplitude2496
Samplitude 2496 позволяет записывать 24-разрядные аудиофайлы с частотой дискретизации до 96 кГц на стольких дорожках звукового канала, сколько позволяет мощность вашего компьютера. Внутренняя обработка и хранение данных могут быть сделаны в 32-разрядном формате с плавающей точкой. Также может быть применено преобразование данных в сторону понижения до 16-разрядного формата.
Программой предусмотрена возможность увеличения числа функций за счет модулей расширения (plug-in), поддерживающих технологию Microsoft DirectX.
Новым свойством программы является способность создавать образ аудио-CD в реальном масштабе времени. При этом выполняются все процессы обработки (автоматические изменения громкости и панорамы, разнообразные эффекты и др.).
Samplitude может использоваться как аппаратный микшерный пульт, работающий в реальном масштабе времени.
Производитель: SEK'D.
Адрес производителя в Internet: http://www.sekd.com и http://www.sekd.de
Секвенсор Cakewalk Pro Audio 8.0
Одна из наиболее развитых программ-секвенсоров, она обладает всеми возможностями редактирования MIDI-файлов, характерными для такого класса программ, одновременно предоставляя множество других удобных инструментов для работы.
Операционная система: Windows 95/98, Windows NT 4.0.
Программа Cakewalk Pro Audio 8.0 позволяет использовать эффекты в реальном времени, хотя для этого требуется компьютер не ниже Pentium 120 МГц и возникает ряд ограничений на число одновременно включенных эффектов.
Производитель: Twelve Tone Systems, Inc.
Адрес производителя в Internet: http://www.cakewalk.com
Программа ведения нотной записи Finale 98
Программа предназначена для записи нотных партитур, их печати, воспроизведения через звуковую карту и преобразования в MIDI. Имеет богатейшие встроенные средства редактирования нот и музыкального строя, а также допускает установку встраиваемых модулей (plug-ins), которые обеспечивают многочисленные дополнительные возможности по автоматизации редактирования.
Операционная система: Windows 95.
Производитель: Coda Music Technology, Inc.
Адрес производителя в Internet: http://www.codamusic.com
Глава 1
Обработка аудиозаписей
Программы, предназначенные для обработки аудиозаписей, как правило, имеют сходный пользовательский интерфейс. На экране мы видим волновую форму сигнала в графическом представлении: по вертикали – амплитуда, по горизонтали – время. Изгибы волновой формы дают общее представление о звуке, хотя визуально нельзя оценить тонкости звучания. Визуальное представление звука на экране помогает в работе, но «последней инстанцией» контроля все равно остается слух.
В данной книге намеренно не рассматриваются способы записи звука на компьютере: методов много, влияют на них как применяемая аппаратура, так и поставленные задачи. Но один из них – метод многоканальной записи – будет все же рассмотрен особо, поскольку является чрезвычайно важным для последующей обработки звука.
Кроме того, современные программы, допускающие такой метод записи, сами обеспечивают широкие возможности по обработке фонограмм.
Многоканальная запись
Суть метода многоканальной последовательной записи заключается в том, что ансамбль записывается частями (например, сначала только аккомпанемент, а затем солист). Делается это так: после записи аккомпанемента его воспроизводят, подавая сигнал на головные телефоны. В студии у микрофона располагается солист, который исполняет свою партию под аккомпанемент, прослушиваемый им через наушники. Запись солиста ведется на отдельный канал. Потом каналы с записями аккомпанемента и солиста микшируются (совмещаются при помощи микшера), звукорежиссер подбирает и регулирует соотношения уровней между каналами. Суммарный сигнал представляет собой законченную фонограмму полного произведения.
Запись аккомпанемента, в свою очередь, может быть сделана таким же методом: на отдельный канал записывается каждая группа исполнителей или даже каждый инструмент из ансамбля.
Многоканальная запись облегчает работу исполнителей, сокращает число репетиций и записываемых дублей.
Такой метод записи дает возможность наиболее выгодным образом расположить микрофоны для каждого исполнителя или группы исполнителей, не заботясь об их акустическом разделении и о том влиянии, которое могли бы оказать эти микрофоны на звучание других исполнителей.
Применение многоканальной последовательной, поочередной записи отдельных групп инструментов или исполнителей дает возможность использовать многочисленные звуковые трюки, часто весьма эффектные. Например, запись дуэта, в котором партии обоих голосов исполняются одним и тем же певцом; запись какого-либо музыкального инструмента в несвойственном ему регистре и т. д.
Для многоканальной записи используются либо особые многодорожечные магнитофоны, либо специальное программное обеспечение, если запись ведется в цифровом виде на компьютер, звуковую рабочую станцию или цифровой магнитофон. Такое оборудование позволяет записать музыкальный ансамбль по частям, каждую группу исполнителей (или каждый инструмент) – на отдельный канал записи. Затем при воспроизведении сигналы всех каналов микшируются для получения окончательной однодорожечной (моно) или двухдорожечной стереофонической фонограммы.
Первые профессиональные многодорожечные магнитофоны появились в семидесятые годы и произвели подлинную революцию в методах записи и обработки музыкальных произведений с большим числом исполнителей. Благодаря им представилась возможность записывать отдельно инструменты и инструментальные группы больших симфонических оркестров, вокалистов и т. п.
При многоканальной параллельной записи все группы исполнителей записываются одновременно, каждая на свой канал. Исполнители и микрофоны должны быть расположены так, чтобы микрофон каждого канала воспринимал звуки в основном только от своей группы исполнителей. Когда запись закончена, включается воспроизведение и выполняется микширование (сведение) сигналов всех каналов в один канал (для монофонической записи) или два канала (для стереофонической записи). Такой способ применяется в основном при записи больших музыкальных коллективов.
Чтобы звучание всех партий, записанных в разное время на разных каналах, совпало и при этом точно соблюдался ритмический рисунок произведения, всем исполнителям на головные телефоны для синхронизации подается записанный ранее сигнал ритмической партии. Для следующей группы исполнителей будут воспроизводиться уже записанные партии и т. д. Распределение исполнителей по группам зависит прежде всего от характера и инструментовки произведения, а также от акустических характеристик студии. Поэтому для каждого конкретного случая звукорежиссер подбирает свои условия записи. Дальнейшее сведение и монтаж производятся так же, как и при методе параллельной записи.
Для подобного рода записи на компьютере должна быть установлена такая звуковая карта, которая позволяла бы одновременно осуществлять запись и воспроизведение (обеспечивала бы полный дуплексный режим) для того, чтобы непосредственно при записи следующего канала можно было воспроизводить ранее записанные каналы.
Многоканальная запись в Samplitude 2496
Нелинейная система монтажа в программе Samplitude 2496 (последняя к моменту написания книги известная автору версия была 5.05) воплощена в концепции так называемого Virtual project (Виртуальный проект), или VIP. Это по сути многоканальный магнитофон с расширенными функциями редактирования каждого канала в отдельности и всей записи в целом. Все операции вырезки, изменения уровня громкости, наложения и замещения звука, введения эффектов и пр. полностью виртуальны. Это означает, что исходный звуковой материал при любых экспериментах не разрушается. Рассмотрим подробнее эту технологию.
Для начала вы создаете новый виртуальный проект: выполняете команду New Multitrack Project (Новый многоканальный проект) из меню File (Файл), которая откроет доступ к окну Setup for new VIP (Установки нового виртуального проекта), показанному на рис. 1.1.
Рис. 1.1. Окно установок нового виртуального проекта в программе Samplitude 2496
Здесь определяются настройки проекта, которые надо сделать сразу.
Track Number (Число каналов). В зависимости от версии программы: для Samplitude Studio и Samplitude 2496 – без ограничений; для Samplitude Pro – максимум 8; для Red Roaster 24 – 2. Одноканальные проекты еще называют CD Projects (Проекты компакт-диска). Файлы в таком проекте располагаются последовательно, как и на компакт-диске, с указанием интервалов пауз между ними при помощи операции Set Pause Time (Установка интервала паузы) в меню CD.
Sample Rate (Частота дискретизации). Допустимые значения: 22050, 32000, 44100, 48000, 88200 и 96000.
Name (Название). Задается произвольное имя файла, в котором будет сохранен проект.
Default VIP Length (Длительность проекта по умолчанию). Допустимые значения: 1 мин, 10 мин или 60 мин.
Grid (Сетка). Если опция помечена, в окне виртуального проекта будет отображена масштабная сетка, тип которой определяется секцией Units of Measurement.
Units of Measurement (Единицы измерения). Выберите один из шести типов: Samples (Выборки), Milliseconds (Миллисекунды), SMPTE 24 Frames (Формат SMPTE 24 кадра), SMPTE 25 Frames, SMPTE 30 Frames, Bars/Beats (Такты/Длительности).
Fix Vertically (Фиксировать по вертикали). Если помечена эта опция, диапазоны (то есть фрагменты) в звуковом проекте можно будет выделить только по горизонтали (по всей высоте канала).
Snap to Objects (Привязка объектов). Активизируется объектная сетка. Объекты будут точно соотнесены, синхронизированы друг с другом.
Lock Recorded Objects (Блокировать записанные объекты). Записанные объекты немедленно, как только они размещены в канале виртуального проекта, блокируются. Это предотвращает случайное удаление или перемещение и особенно важно для многоканальных проектов.
Сделав настройки, нажмите кнопку OK, после чего будет открыто окно нового проекта, вид которого представлен на рис. 1.2 (в варианте с масштабной сеткой).
Рис. 1.2. Окно нового виртуального проекта
Окно разделено по вертикали на однотипные каналы, в правой части каждого канала будет размещена волновая форма, в левой части находятся органы управления. Назначение кнопок следующее:
? – Справка. Открывает информацию о канале или диалоговое окно реквизитов (правой кнопкой мыши), которые позволяют ввести имя канала, выбрать устройства для записи и воспроизведения, а также выполнить массу настроек, общих для всех каналов фонограммы.
M (Mute) – Приглушить. Отключаются соответствующие каналы. Если же нажать правую кнопку мыши, для выбора выводится список устройств воспроизведения.
S (Solo) – Соло. Если кнопка активна, воспроизводится только один канал (даже если нажата кнопка Mute).
L (Lock) – Блокировать. Редактирование канала не допускается.
V (Volume) – Громкость. Активизирует кривую автоматизации громкости.
P (Panorama) – Панорама. Активизирует кривую автоматизации панорамы.
R (Record) – Запись. Подготавливает канал для записи. Нажав здесь правую кнопку мыши, можно выбрать в контекстном меню устройство записи.
Multi-Card Mode (Режим поддержки нескольких звуковых карт). Эта кнопка активизирует воспроизведение через несколько аудиовыходов. В данном режиме виртуальный проект не воспроизводится больше через устройство, определенное в системе, а использует устройства, назначенные каждому индивидуальному каналу. Обратите внимание, что в режиме Multi-Card секция Master в окне Mixer (Микшер) недоступна.
Восемь кнопок в нижней левой части окна виртуального проекта позволяют сохранить до четырех общих установок (S1 … S4), включая масштаб изображения, позицию окна и его режим, и до четырех установок масштаба (Z1 … Z4). Чтобы сохранить установку, удерживайте клавишу Shift и нажмите одну из кнопок. Чтобы выбрать сохраненную установку, щелкните по кнопке, не нажимая клавишу Shift.
Создав виртуальный проект, можно выполнить поканальную запись. Кроме того, в любой канал можно интегрировать предварительно сделанные WAV-файлы. Для такой интеграции предусмотрены два метода.