Рис. 1.
Структура звуковой картыРассмотрим состав аппаратных
средств простейшей звуковой карты (рис. 1). Аналоговые сигналы от
различных источников - микрофона, CD (здесь обычно используется
аналоговый интерфейс CD-ROM), линейного входа, а также ЦАП и синтезатора
- смешиваются микшером. Микшер для каждого входа имеет аналоговые
регуляторы с цифровым управлением, позволяющие изменять усиление и
баланс стереоканалов. Микшер может быть дополнен регулятором тембра -
простейшим регулятором усиления высоких и низких частот или
многополосным эквалайзером (на рисунке не показан). С выхода микшера
аналоговый сигнал поступает на линейный выход и оконечный усилитель.
Мощности усилителя, устанавливаемого на звуковых картах, достаточно для
"раскачки" небольших пасивных колонок или наушников. Любопытно, что на
некоторых высококачественных картах усилитель маломощный, работающий
только на наушники или активные колонки - мощному усилителю в общем-то
не место рядом со слаботочными сигнальными цепями. Собственно
цифровые каналы звуковой карты проходят через интерфейсные схемы от шины
расширения до ЦАП и от АЦП обратно к шине. Для передачи потоков данных
традиционно используются каналы DMA шины ISA - один 8-битный и один
16-битный. Несмотря на наличие двух каналов DMA далеко не все карты
позволяют работать в полнодуплексном режиме цифрового канала -
одновременно и независимо вводить и выводить цифровой поток. Полный
дуплекс нужен, например, для IP-телефонии: аналоговый сигнал от
микрофона поступает на АЦП, с которого цифровой поток в сжатом виде
укладывается в пакеты IP-транспорта. Одновременно из принятых пакетов
данные через ЦАП направляются на аудиовыход. В структуре, изображенной
на рис. 1, эти потоки пересекутся в микшере. Полный дуплекс обеспечивают
далеко не все модели звуковых карт. Полнодуплексные карты имеют
раздельные микшеры для записи и воспроизведения, есть карты и с более
сложной структурой. О синтезаторах и портах MIDI поговорим позже, а
сейчас вернемся к обработке оцифрованного аудиосигнала. Цифровое
хранение обеспечивает богатейшие возможности нелинейного монтажа
аудиозаписей. Под нелинейностью подразумевается возможность
произвольного доступа к любым фрагментам записи. Даже простейшие
средства "фонографа" позволяют вырезать или вставить любой фрагмент
записи, состыковать (один за другим) фрагменты или наложить один на
другой. Программная реализация монтажа является "бескровной" и позволяет
легко отказаться от проведенных действий. После такого монтажа работа с
магнитной лентой, ножницами и скотчем, которой не было альтернативы еще
в 80-е годы, кажется кошмаром (а ведь делали!). Поиск начала и конца
требуемого фрагмента делается теперь с помощью точного
указателя-курсора, а не на слух, протягивая ленту туда-сюда по магнитной
головке вручную. При цифровом хранении легко реализуются многие
эффекты, которые ранее требовали громоздких электромеханических
или электроакустических устройств или сложной аналоговой электроники.
Прежде всего, это искусственная реверберация и эхо.
Известно, что в закрытом помещении (например, зале), от источника до
слушателя доходит не только прямой звук, но и отраженный (многократно)
от различных поверхностей (стен, колонн и т.п). Отраженные сигналы
приходят относительно прямого с различными задержками и затуханием. Это
явление называется реверберацией. Акустика зала (реверберационные
характеристики) должна соответствовать его назначению - в помещении с
малой реверберацией музыка будет звучать "сухо", а в помещении с
длительной реверберацией речь будет неразборчивой. В студиях звукозаписи
естественную реверберацию часто подавляют, а в запись добавляют
искуственную реверберацию "по вкусу". В до-цифровую эпоху использовали
ревербераторы на электромеханических линиях задержки, акустические
камеры с микрофонами или магнитофонные ревербераторы. Все это было и
дорого, и громоздко, некачественно и трудно управляемо. При цифровой
записи или воспроизведении реверберация достается практически даром. Для
этого достаточно на вход ЦАП подавать не просто очередную выборку, а
сложить ее с одной или несколькими предыдущими выборками, которые еще
присутствуют в памяти. Конечно, эти "отстающие" выборки должны быть
уменьшены по уровню - в цифровой форме эти операции выполнить не
проблема. Задержку (отставание выборки) и уровень каждого эхо-сигнала
легко задать программно, количество составляющих определяется только
производительностью процессора, обрабатывающего эти сигналы. Таким
образом, появляется возможность имитации воспроизведения в каком-либо
знаменитом зале - для этого достаточно снять его характеристики и
заложить их в программу (конечно, на практике это не совсем просто, но
возможно). Искуственное эхо технически отличается от реверберации
лишь большим временем задержки, так что теперь и с ним нет
проблем. На основе смещения выборок можно делать и более сложные
эффекты. В цифровой форме представления легко имитируется эффект
Допплера - изменение частоты при быстром приближении/удалении источника
звука к слушателю. С этим эффектом сталкивались все - однотонный свисток
приближающегося поезда звучит выше, а удаляющегося - ниже реального
тона. В цифровом виде при воспроизведении накопление отставания выборок
приведет к понижению тона, а сокращение отставание - к повышению.
Конечно, как и невесомость в самолете, этот эффект действует недолго -
до переполнения или опустошения буфера выборок. Но если отставание
"покачивать", возникает эффект частотной модуляции. Управляя "качанием"
одной или нескольких выборок, можно получать такие эффекты, как как
"расстроенный рояль" (синусоидальное покачивание одной-двух выборок),
"хорус" (псевдослучайные колебания нескольких выборок), "фэйзинг" и
некоторые другие. Кроме фокусов с задержками, возможно использование
и цифровой фильтраци - от реализации простейших темброблоков и
эквалайзеров, до "вырезания" голоса из песни (эффект "караоке"). Все
упирается в фантазию программиста и вычислительные ресурсы процессора.
Раньше обработка сигналов в реальном масштабе времени была уделом лишь
специализированных сигнальных процессоров (например, TMS). В них
предусмотрены специальные средства для таких функций, как, например,
быстрое преобразование Фурье. Теперь же эта работа под силу и "обычным"
Pentium, не говоря уже о MMX и Pentium II. Специализированные
сигнальные процессоры DSP (Data Signaling Processor)
входят в состав "продвинутых" звуковых карт. Как и графические
акселераторы, они позволяют выполнять действия по обработки сигналов, не
загружая центральный процессор. Это немаловажно: например, чтобы иметь
возможность работать на компьютере (Pentium MMX-166), слушая музыку из
MP3-файлов через обычную звуковую карту (GUS), пришлось отключить все
"навороты" типа эквалайзеров и т.п. Для тех же, кто не считает
необходимостью приобретение дорогих карт, существует масса программных
продуктов, реализующих сложные эффекты и на центральном процессоре PC.
Михаил Гук ( Mgook@stu.neva.ru) Опубликовано
в газете "КомпьютерИнфо" (СПб.) 29-38, 1998 г. Публикация в печатных
изданиях только с разрешения автора, ссылка
обязательна.
Книги | Статьи | Начало | Продолжение
Copyright (c) М. Гук, 1999. Дизайн (с) О. Гук, 1999.
|