Трехмерный Звук
Что должно быть 3D? Симфонический оркестр? Гребенщиков? Представляете: сижу как бы во чреве Гребенщикова, а голос его обнимает меня со всех направлений.
Е. Козловский, КТ N 32 (260), стр.46.
Для чего нужен и где применяется трехмерный звук
В повседневной реальности мы слышим звуки, приходящие со всех сторон - сверху, снизу, слева и справа. Наш слуховой аппарат может более или менее точно определять направление на источник звука и расстояние до него. Поэтому вполне разумно желание, чтобы радиоприемники, телевизоры, магнитофоны, музыкальные центры, компьютеры и другие воспроизводящие звук аппараты максимально воссоздавали реальное (или похожее на реальное) трехмерное звуковое поле. Представьте себе такую картину. Вы смотрите по телевизору фильм ужасов. Главный герой, "окруженный" таинственными звуками, пробирается через заброшенное кладбище. Однако отождествлять себя с героем, сопереживать ему сильно мешает то обстоятельство, что таинственные звуки не окружают вас, а исходят из одной точки - телевизора. Из-за этого мгновенно разрушается вся аура таинственности, "настрашниться" в полной мере будет проблематично. С другой стороны, оправданность применения объемного звука в музыкальной звукозаписи не столь очевидна. Дотошное воспроизведение трехмерных шумов концертного зала действительно впечатляет. Меня, например, потрясло сверх реалистичное, заставляющее недовольно оборачиваться с целью сделать замечание, сморкание соседа сзади на одной из 3D звуковых демонстрационных записей, скачанных из Интернет. Но все это больше курьезы, чем серьезные музыкальные произведения, изготовленные по технологии объемного звука. А вот компьютерные игры значительно оживляются трехмерным звуком. Потребители-геймеры и разработчики компьютерных игр однозначно проголосовали за объемный звук. Что и нашло отражение в созданном Microsoft программном обеспечении поддержки игровых приложений DirectX, позволяющим разработчику создавать объемное звуковое сопровождение с использование (или без использования) аппаратных ускорителей обработки звука наподобие звуковой карты Monster Sound 3D, Turtle Beach Montego A3DXStream или SoundBlaster Live. В принципе использование DirectX/DirectSound совместимых звуковых карт должно позволять расставлять виртуальные источники звука в любой точке пространства, например, вокруг рабочего места журналиста, программиста или верстальщика. Причем в минимальной, но полнофункциональной конфигурации требуется всего два реальных (колонки или стереотелефоны) источника звука. Таким образом, можно улучшить обычный стерео звук от близко стоящих друг к другу колонок (обычно слева и справа от дисплея) виртуально разместив их на оптимальном для проявления стерео эффекта расстоянии от слушателя. Заметьте, что при этом реальные колонки вообще не надо передвигать, все сделает 3D звуковой процессор.
Рис. 1 Интерфейс пользователя процессора трехмерного звука (Monster Sound 3D)
Развитие методов воспроизведения и записи объемного звука.
Первым шагом к многомерному звуку было стерео воспроизведение. Но качество звучания, реализуемое обычной стереофонической системой или головными стерео телефонами, не полностью удовлетворяет взыскательных слушателей. Хотя стерео системы и создают эффект пространственного звучания за счет синтеза панорамы мнимых источников звука между двумя громкоговорителями, все же стереозвучание имеет существенный недостаток. Стерео панорама получается плоской и ограничена углом между направлениями на громкоговорители. Такое звучание в значительной степени лишено естественности, свойственной тому, что достигается в реальном звуковом поле. Головные стерео телефоны также не позволяют получить естественное звучание воспроизводимой фонограммы. Дело в том, что возникающее при этом впечатление бесконечной ширины стерео базы и четкая локализация звукового изображения внутри головы слушателя не может удовлетворить требовательных меломанов. Следующим шагом была квадрофония. Были разработаны несколько несовместимых друг с другом систем JVC CD-4, CBS SQ и Sansui QS. Мнения экспертов о звуковых возможностях квадрофонических систем не были восторженными. Большинство слушателей отмечало, что квадрофонические системы не обеспечивают полную имитацию реального звукового поля. Во-первых, при квадрофонии не получается круговая стерео панорама - слушатель ощущает обычную стерео панораму перед собой и позади себя. Во-вторых, все мнимые источники звука располагаются в одной плоскости и на линии между динамиками, т.е. нет глубины и нет, собственно, 3-го измерения и объемного трехмерного звучания. После неудач с квадрофонией разработчики видимо решили, что все дело в недостаточном количестве каналов воспроизведения и на свет появились очень многоканальные монстры.
Рис. 2 Многоканальная система звуковоспроизведения.
Лидерство в создании многоканальных систем звуковоспроизведения захватила фирма Dolby. Ее система под названием "Multichannel Surround Sound" установлена (по сведениям с www.dolby.com) более чем в 14000 кинотеатрах. Вскоре бум на супер многоканальность прошел и Dolby разработала гораздо более аскетичную систему "Dolby Digital Surround", состоящую всего из шести громкоговорителей (левого, центрального, правого, сабвуфера, левого и правого "surround") и предназначенную для домашнего применения.
Рис. 3 Система звуковоспроизведения "домашнего театра" Dolby.
Самое смешное, что Dolby Digital удивительно похожа на разработанную в России в 70-х годах систему звуковоспроизведения ABC. Основной, видимо, незапатентованный должным образом признак (и отличие от квадрофонии) которой заключается в размещении тыловых громкоговорителей не за слушателем, а точно слева и справа. Именно такое размещение динамиков позволяет создавать круговую звуковую панораму и именно на таком расположение динамиков настаивает Dolby. Совпадение?! Естественно, эти системы звуковоспроизведения не имеют третьего измерения. Наиболее совершенный метод имитации реального трёхмерного звукового поля это бинауральная звукозапись. Бинауральный метод состоит в том, что звуковая информация воспринимается микрофонами, размещёнными в ушных раковинах человека или “искусственной головы” - модели, симулирующей слуховое восприятие человека.
|
|
|
Рис. 4 Искусственная голова и 3D микрофон.
Сигналы, поступающие с каждого микрофона, усиливаются раздельными усилителями низкой частоты и воспроизводятся стереотелефонами. В идеале такая система позволяет создать полную иллюзию естественного звучания. Она как бы переносит слушателя из помещения прослушивания в помещение, откуда ведётся передача. Однако полноценно прослушивать её можно только с помощью стереотелефонов и при условии, что в качестве образца для создания искусственной головы использовалась именно ваша голова. Поэтому для получения максимально возможного эффекта рекомендуется использовать специальные микрофоны, помещаемые в ваши собственные уши (см. рис. 4).
Рис. 5 3D микрофон для использования с живой человеческой головой.
Следует отметить, что записи, сделанные с помощью микрофонов, помещенных в ваши собственные уши, будут иметь ценность в основном только для вас. При прослушивании таких записей другими людьми могут ощущаться значительные отклонения в структуре воображаемого звукового поля от оригинала из-за возможных аномалий, значительных отклонений характеристик вашего (или других людей) слуха от средних значений.
При воспроизведении бинаурального сигнала через звуковые колонки из-за попадания сигнала правого канала в левое ухо слушателя и наоборот возникают перекрёстные искажения, в конечном счете сводящие на нет все преимущества бинаурального звуковоспроизведения. Указанные недостатки в значительной мере удаётся устранить с помощью специальных устройств обработки звуковых сигналов, позволяющих получить бинауральный эффект при прослушивании бинауральной записи через колонки. Такие устройства получили название бифонических процессоров. Запись производится с микрофонов, расположенных в искусственной голове, а воспроизводится после обработки бифоническим процессором, в котором точно рассчитанная величина сфазированного, задержанного и скорректированного по частоте сигнала левого канала вычитается из сигнала правого канала и наоборот. После обработки бифоническим процессором сигналы, приходящие из колонок в уши слушателя, суммируются так, что левое ухо слышит только сигналы левого канала, а правое - правого. Таким образом, можно сказать, что бифонический эффект подобен бинауральному и отличается от него только способом воспроизведения бинауральной записи. И хотя площадь, где он отчётливо проявляется, невелика, зато, находясь в её пределах, слушатель может иметь представление о расстоянии до источников звука и их взаимном расположении в пространстве в момент записи. Этого не удаётся достигнуть при стереофоническом звуковоспроизведении, дающем представление только о расположении источников звука на линии между звуковыми колонками. Другое интересное свойство бифонического процессора - это возможность расширения с его помощью стерео базы обычных стереофонических записей. Конечно, бифонический процессор может быть реализован чисто программными методами с использованием методов цифровой обработки сигналов в реальном времени.
Теоретические основы 3-х мерного звука
Реальные источники звука (поющая птичка, работающий трактор и т.д.) довольно часто можно приближенно считать точечными. То есть это моно источники. Стерео эффект возникает при восприятии звука левым и правым ухом. В зависимости от азимутального, широтного расположения и дальности до источника звука изменяются частотные характеристики человеческих ушей. Причем изменяются они не синхронно, по-разному. То есть усредненные частотные характеристики ушей одинаковы только при расположении источника звука точно в плоскости симметрии головы. На рис. 5 хорошо видна большая разница в форме импульсных реакций и амплитудно-частотных характеристик, полученных с помощью помещенных внутри ушей микрофонов и смещенного относительно оси симметрии головы источника звука.
Рис. 6 Частотные характеристики человеческих ушей при несимметричном расположении источника звука.
Многочисленные измерения показывают значительные изменения частотных характеристик в зависимости от расстояния и направления на источник звука. Наиболее очевидна разная задержка сигналов и разница в амплитудах. Видимо, наш мозг каким-то образом анализирует эти изменения и разницу характеристик и делает вывод о расположении источника звука в 3-х мерном пространстве. Таким образом, ощущение местоположения источника звука в пространстве тесно связано с характеристиками звуковоспринимающего аппарата человека (амплитудно-частотной характеристикой и относительной задержкой сигнала). Для имитации таких свойств можно произвести достаточно подробные измерения усредненных характеристик нашего слухового аппарата и построить на их основе цифровые фильтры. Чем детальнее моделируется пространственная частотная характеристика слухового аппарата, тем сложнее получаются фильтры. После этого создание искусственного объемного звукового поля будет заключаться в обработке сигналов от моно источников парами (для левого и правого уха) цифровых фильтров с параметрами, соответствующими желаемому направлению на источники звука.
Трехмерный звук и персональные компьютеры
В последние несколько лет на рынке появились дешевые и очень мощные процессоры обработки сигналов (DSP). Фирма Analog Devices (см. www.analog.com) выпускает один из самых интересных на сегодня процессоров AD21160 SHARC. Это 32-битное устройство с производительностью 1000 MIPS (миллионов инструкций в секунду), способное обрабатывать целые числа и числа с плавающей точкой. Система команд этого DSP весьма совершенна и очень удобна для программистов и позволяет легко решать как системные, так и специфические вычислительные задачи типа цифровых адаптивных рекурсивных и нерекурсивных фильтров для трехмерного звука, БПФ и операций с матрицами. Имеется компилятор с языка
C. На кристалле размещается быстрая RAM объемом от 250 кБ до 2 МБ и масочное ПЗУ, процессоры ввода вывода, DMA контроллеры и быстрые последовательные порты. Возможна организация многопроцессорной системы. SHARC имеет небольшие габариты (27 mm * 27 mm) и потребляет всего 9 ватт. Столь малая потребляемая мощность позволяет устанавливать несколько таких DSP на малогабаритные PCI карты. Менее совершенные предшественники AD21160 широко используются в звуковых картах Monster Sound 3D. SHARC в настоящее время, по моим данным, применяется в основном в мощной современной студийной аппаратуре (например, DSP/FX cards).
|
|
Рис.
7 Процессор обработки сигналов SHARCПриборы обработки звуковых сигналов более узкого назначения выпускаются фирмами Vortex Chips (Aueral AU8820, 330 MIPS) и E-mu (EMU10k, 1000 MIPS). Первый из них используется в звуковой карте Turtle Beach Montego A3DXStream, второй в SoundBlaster Live от Creative Labs. Кстати, забавные сплетни о стремлении Creative Labs. запатентовать даже самые банальные вещи типа 8-точечной интерполяции, кэширования данных и табличного синтеза можно прочитать по адресу www3.techstocks.com/~wsapi/investor/repliestothis-3560864. Система команд AU8820 и EMU10k значительно проще набора инструкций AD21160 и ориентирована на табличный синтез музыкальных звуков (64..128 голосов), электронные эффекты реверберации, флэнжера, хоруса, разнообразной фильтрации и трехмерного звука (до 32 источников звука). DSP производятся также фирмами Motorola и Texas Instruments и имеют параметры, незначительно уступающие характеристикам выше перечисленных устройств. Наличие на рынке столь совершенных устройств позволило создавать относительно недорогие звуковые карты, оснащенные DSP и способные в реальном времени реализовывать бифонические процессоры и цифровые фильтры, необходимые для качественного моделирования человеческого слухового аппарата. Таким образом, 3-х мерный звук из экзотики превращается в стандартную функцию практически любой современной звуковой карты среднего ценового диапазона. В дополнение к цифровым имитирующим фильтрам такие звуковые карты позволяют реализовывать эффект Доплера (смещение высоты звука движущегося источника), придающий еще большую реалистичность компьютерным играм. Некоторые звуковые карты с DSP (www.sblive.com) имеют богатый набор звуковых эффектов, ревербераторов и фильтров, иногда существенно улучшающих звучание компакт дисков (но это все же дело вкуса). Любители домашней компьютерной звукозаписи также имеют возможность поэкспериментировать с 3-х мерным звуком. Практически для всех популярных программ редактирования звуковых файлов имеются так называемые plug-ins, поддерживающие создание объемно звучащих произведений (см. www.qsound.com).
Симаненков Дмитрий. (e-mail: guitarfx@мэйл.ру)