Как сделать искажение звука
Что такое искажение (дисторшн) в музыке? Когда и как его использовать?
Программное обеспечение для создания музыки имеет ограничения по уровню громкости звукового сигнала. Если аудиосигнал превышает эти пределы, он будет искажаться и выдавать резкий, громкий неприятный звук, который заставляет большинство людей закрывать уши.
Нежелательное искажение (дисторшн) негативно влияет на качество микса. Но это имеет и множество музыкальных применений, когда вводится намеренно и аккуратно. Искажение улучшает звучание синтезаторов и гитар, придаёт энергию и напор барабанам и придает скучному звучанию нужный настрой.
Мы находимся в расцвете для дисторшна как музыкального, так и эстетического эффекта. Сильные хаусные и хип-хоповые треки с прикрепленным описанием «lo-fi» поднимаются на большой волне блоговой шумихи. DIY-лейблы выпускают кассетные ленты. Даже поп-вокалисты используют дисторшн.
В этой статье я покажу вам, как творчески использовать дисторшн в вашем аудиоредакторе (DAW), наряду с аудио-примерами.
Типы искажения и их источники
Дисторшн может возникать при записи, продакшне и «инженерной» стадии песни. Вот лишь несколько примеров того, как могут происходить нежелательные искажения:
Усечение вызвано сбросом битов при воспроизведении или рендеринге аудиосигнала, что может привести к появлению искаженного сигнала низкого уровня.
А теперь вернемся к клиппингу. Цифровые и аналоговые искажения происходят, когда аудиосигнал проходит через максимальный уровень мощности системы, который в DAW обычно составляет 0 dBFS (децибел полной шкалы). При клиппинге, вы теряете участки сигнала выше порога в 0 dBFS, обрезая сигнал.
Цифровые искажения происходят, когда аудиосигнал выходит за пределы максимальной мощности DAW, которая в DAW обычно составляет 0 дБ. Для продолжения воспроизведения DAW будет сжимать фрагменты сигнала выше порога искажения, обрезая форму сигнала.
Поскольку синусоидальная волна искажается, она начинает звучать ближе к прямоугольной волне. Эта новая информация гармоник увеличивает воспринимаемую громкость сигнала.
Пиковый уровень в синусоидальной волне может не измениться на счетчике при достижении порога искажения (хотя значения счетчиков передискретизации будут), но уровень нового искаженного сигнала будет меняться при воспроизведении и будет казаться громче. Так как же это может быть использовано более творческим, музыкальным способом? Давайте узнаем.
Пленочная сатурация (Feathering). Искажения плёнки
Когда цифровая техника была представлена как средство производства музыки, многие жаловались на то, что ей не хватает теплоты и характера аналоговой технологии. В какой-то степени это так и есть. Как вы слышали выше, цифровые искажения могут быть резкими. Но когда магнитная лента перегружена аудиосигналом, она создает богатое, гармонично управляемое искажение, называемое сатурацией.
В наши дни мы можем воспроизводить аналоговую сатурацию в наших DAW с помощью таких плагинов, как Tape Machine и других. Сатурация может быть эффективно использована практически на любом элементе микса, но, пожалуй, она приносит наибольшее удовольствие при применении к барабанам. Послушайте эти барабаны без сатурации.
Грув присутствует, и удары тоже звучат довольно сильно. Но перкуссии и рабочему не помешает «подгруз». Поэтому я применил пресет Ozone 8 Advanced Vintage Tape «Clean Fifteen» для разогрева средних и высоких частот.
Здесь Tape Machine добавляет ясности и заполняет пустое пространство между каждым ударом. Несмотря на то, что барабаны оснащены современной системой подбора и размещения звука, они «чувствуются» как аналоговый звук. В вашем собственном DAW вы можете подчеркнуть низкие и высокие звуки, и гармоники в соответствии с вашим стилем.
Будьте осторожны при применении сатурации к хай-хэтам, тарелкам, клаве и колокольчикам. Эти звуки уже богаты высокочастотным компонентом и станут грубыми и резкими с добавлением или усилением гармоник.
От теплого до абразивного
Если вы думаете, что элемент микса звучит скучно и может выиграть от добавления гармоник, запустите плагин с искажениями, такой как Trash 2. Это выходит за рамки тонкости сатурации и действительно позволяет искусно использовать искажения. Плагин имеет два этапа обработки искажений, каждый из которых имеет свою собственную кривую и настройки драйва. Он также включает в себя фильтр и встроенную задержку.
Как правило, вы всегда хотите работать с высококачественными сэмплами и записями. Искажения во многих случаях улучшают звучание, но обычно ухудшают звучание низкого качества. Так как большинство синтезаторов включают в себя в основном контент среднего и высокого диапазона, то искажения наиболее эффективны при добавлении яркости и переливающихся звуков.
Я буду работать с этим фоновым «пэдом» в стиле Брайана Эно.
Я специально хочу улучшить высокие частоты, поэтому я включил многополосный режим Trash 2 и увеличил драйв для пользовательского частотного диапазона 4-10 кГц.
Подчеркивается воздушность пэда, а также приятная шероховатая текстура.
По мере того, как вы увеличиваете драйв искажений, ваш синтезатор начинает петь или даже кричать, когда меняется тембр.
Драйв увеличит амплитуду вашего сигнала, и сделает ваш микс громче. Следите за выходным сигналом Trash 2, чтобы громкость была одинаковой до и после искажения. Переключите байпас плагина, чтобы проверить это. То, что ваш микс громкий, не означает, что он полный.
В паре с низкочастотным звуком (также проходящим через Trash 2) мы получаем большую динамическую чистку звука.
Существует бесчисленное множество вариантов обработки в Trash 2, поэтому я рекомендую вам изучить плагин, чтобы найти пресеты, которые вам нравятся.
Будущее искажения
Обработка аудио для ютуба и стримов: как сделать дикторский голос программными средствами
Содержание
Содержание
Создание видеороликов, трансляция подкастов и стримов — все это становится популярнее с каждым годом. Растущая конкуренция выдвигает больше требований к качеству контента, особенно к технической части — мало кто будет терпеть хрипящий звук и едва различимую речь, которую заглушает фоновая музыка. В этой статье рассматриваются базовые методы обработки голоса, которые помогут сделать его сопоставимым по качеству с речью профессионального диктора или радиоведущего.
Общие советы
Стоит сразу оговориться: хорошего результата не получится без хороших «сырцов» — исходный материал должен быть качественным. В идеале, речь должна не только записываться на хороший микрофон и звуковую карту, но и быть начитанной с дикцией, произношением, интонациями, выразительностью, характером, манерой и правильным дыханием. Возможные дефекты речи — ярко выраженная картавость или гнусавость — обработкой не исправляются.
Набор неплохих бесплатных плагинов от DAW Reaper можно скачать с официального сайта — там есть все необходимое. Для тех, кто всерьез увлечется звукорежиссурой, можно посоветовать более продвинутые пакеты плагинов от Waves, Fabfilter, Softube — их существует множество на любой вкус.
Обработку стоит выполнять на студийных мониторах или в наушниках студийного уровня. Без качественного контроля будет сложно разобрать, что вообще происходит с аудиосигналом.
Обрабатываем звук для оффлайн-видео
Итак, голос записан, и теперь нужно его обработать.
Начать стоит счистки материала: убрать все шумы в паузах, если необходимо — вдохи, вздохи и другие артефакты. Можно сделать все вручную, а можно поставить нойз-гейт. Он должен находится в самом начале цепи обработки. Настроить гейт очень просто: параметр threshold означает порог его срабатывания, здесь нужно взять самый громкий участок с шумами и сделать уровень thrershold чуть выше его. Attack — как быстро гейт «открывается» для пропуска полезного сигнала, release — как быстро он «закрывается» для удаления шума. Главное, чтобы гейт не откусывал слишком тихие слова.
Следующий шаг — шумоподавление. Нужно найти участок записи без какого-либо сигнала, чтобы на нем присутствовал только шум цепи звукозаписи. Если уровень шума ниже 50 дБ (как на скриншоте выше) — можно смело махнуть на него рукой и не делать ничего, такой шум никто не услышит. Если шум явно заметен, можно использовать специальные плагины (например, reafir от Reaper или denoiser в Cubase) для его удаления, либо подрезать эквалайзером пару самых шумных частот — точно так же, как будут удалятся резонансы в следующем пункте.
Фильтрация и удаление резонансов. Бывает, что низкий мужской голос начинает неприятно бубнить в районе 100–200 Гц, либо высокий женский тембр в сочетании с не самым лучшим микрофоном неприятно режет по ушам. Так и проявляются резонансы. Избавиться от них просто: нужно поставить в цепь обработки эквалайзер и узкой полосой с большим усилением (10–30 дБ) “пройтись” по всему частотному спектру, вычисляя самые неприятные места с режущим ухо свистом, звоном или гудением. Их необходимо ослабить узкой полосой на 3–5 дБ. Главное здесь не перестараться — удаления всего двух-трех основных резонансов обычно хватает для дикторского голоса.
Поиск и подрезание резонанса
Помимо этого, можно вовсе удалить целые куски спектра, в которых нет никакого полезного сигнала. Это делается с помощью low-pass и hi-pass фильтров, которые обрезают высокие и низкие частоты соответственно.
Чаще всего проблемы встречаются в следующих областях:
● Ниже 75–100 Гц — здесь находится, в основном, низкочастотный бубнящий шум. Можно смело применить hi-pass фильтр и обрезать все до этих значений.
● 100–150 Гц — тут нередко находятся гудящие частоты, особенно это касается мужского вокала, записанного в небольшой комнате. Можно подрезать их узкой полосой.
● 800–1000 Гц — здесь может располагаться «гундосый» назальный тон, который также имеет смысл подрезать узкой полосой.
● 4–9 кГц — тут находятся сибилянты — шипящие согласные звуки «с-с-с», «ш-ш-ш», «щ-щ-щ», которые могут неприятно свистеть при записи. Для борьбы с ними обычно используется деэссер — специальный прибор, который смягчает резкость свистящих согласных. Но можно не заморачиваться, найти самую неприятную частоту и также подрезать ее узкой полосой.
● Выше 16 кГц — в человеческой речи редко присутствует что-то полезное выше этой частоты, так что можно смело применять low-pass фильтр.
Так выглядит эквалайзер после вырезания резонансов и ненужных частот
Добавление недостающих частот. Теперь, когда остался только полезный сигнал, нужно сделать его четче и ярче. В качестве отправной точки будут полезны следующие данные:
● 180–240 Гц — прибавление 3–5 дБ широкой полосой в этой области сделает мужскую речь более полной и читаемой. Для женской речи это будет 200–300 Гц.
● 1.5–2 — 5 кГц — это самый важный диапазон для голоса, так называемая область разборчивости. Человеческий слух наиболее чувствителен именно к этим частотам, стоит прибавить их широкой полосой на 3–8 дБ.
● 9–11 кГц — эти частоты отвечают за яркость голоса. Их очень часто не хватает в речи, записанной даже на студийный микрофон, особенно в заглушенной комнате, которая с аппетитом пожирает верха вокала. Нередко приходится значительно прибавлять этот диапазон — на 6–12 дБ, чтобы придать речи ясности. Но нужно следить за шипящими согласными.
● Выше 12 кГц — это область «воздуха», поднятие которой позволит сделать речь более натуральной и яркой. Обычно для этой и предыдущей области частот используется параметр эквалайзера hi-shelf, который выглядит как «планка» и позволяет моментально «осветлить» голос.
При эквализации низких частот лучше использовать узкие полосы, а при высоких — широкие, это сделает работу эквалайзера менее заметной.
Компрессия. Компрессором убирается разница между громкими и тихими участками записи. В итоге голос будет звучать равномерно, от хлопков и кашля слушатель не будет вздрагивать, а при шепоте ему не придется прибавлять громкость. Понять работу компрессора поможет аналогия с громкой музыкой в комнате, которая не нравится соседу за стенкой. Параметр threshold будет тем критическим уровнем громкости музыки, при превышении которого сосед начинает тарабанить по батарее монтировкой; attack — как быстро он бежит к батарее при превышении этого уровня; ratio — насколько нужно убавить громкость, чтобы успокоить соседа; а release — как долго сосед перестает возмущаться после убавления громкости. Сосед-компрессор заставляет несчастного меломана держать уровень громкости музыки в определенных пределах. Начать настройку можно со следующих значений:
● Ratio: 4:1 (таким образом, если сигнал превышает порог на 4 дБ, то он скомпрессируется до 1 дБ выше порога)
● Attack: как правило, для голоса хорошо работает быстрая атака в районе 5–10 мс, она позволяет компрессору срабатывать мгновенно. Если при этом компрессия начинает съедать согласные — атаку нужно увеличить.
● Release: если в компрессоре есть функция авторелиз, можно ей и воспользоваться. Если нет — начать стоит с 40–50 мс.
● Output или make-up: если в компрессоре есть функция автомейкапа, можно применить ее. В противном случае компенсацию громкости можно выполнить вручную на слух — главное, чтобы итоговый сигнал не попадал в красную зону.
Есть проверенный метод настройки компрессора «на слух» для новичков: нужно выкрутить ratio и threshold на максимум, attack и release — на минимум. Так будет лучше слышно, что прибор делает с сигналом. Далее подбирается атака, потом релиз, а параметрами ratio и threshold регулируется уровень до желаемых значений. Как правило, уровень компрессии отображается на индикаторе «вверх ногами», ведь компрессор работает на понижение сигнала. Параметр threshold следует установить таким образом, чтобы компрессор срезал около 6 дБ для тихого голоса и около 12 дБ для громких участков.
Лимитер и компрессор в роли лимитера
Если фоновая музыка в видео заглушает речь, нужно выставить RMS музыки и RMS голоса одинаковыми, после чего убавить музыку на 5–10 дБ. Если в некоторых местах слова все еще неразборчивы, можно применить к музыкальной подложке эквализацию. Достаточно посмотреть на эквалайзер для речи и сделать все наоборот в эквалайзере для музыки: например, если в речи 5 кГц приподнято широкой полосой, то в музыке эти же 5 кГц нужно убавить.
Обрабатываем звук в онлайне
У стримов и подкастов есть своя специфика при обработке голоса — здесь важно, чтобы плагины не были ресурсоемкими и не сильно грузили компьютер. Поэтому стоит использовать минимально необходимый набор эффектов.
Чаще всего для стримов используется программа OBS Studio. В ней можно загружать точно те же VST-плагины для обработки звука, что и в DAW. Если используется не OBS Studio, то для обработки голоса можно воспользоваться отдельной программой для потоковой обработки звука VSTHost, она работает с любыми приложениями для стримов.
Так выглядит плагин ReaFIR в OBS Studio
Для обработки голоса потребуется необходимый минимум:
2. Гейт. Если в звуке для оффлайн-видео можно вручную вырезать все крики детей за окном и рев соседского перфоратора за стеной, то с онлайном такой фокус не провернуть. Понадобится гейт.
● Release можно сделать длинным, около 200 мс, поскольку работа гейта будет слишком слышна при быстром релизе. Правильно настроенный гейт почти незаметен для слушателя и удаляет лишь шумы и призвуки в паузах между фразами.
● Уровень гейта нужно сделать чуть выше, чем фоновый шум, не стоит выставлять уровень рядом с уровнем голоса.
● Простой способ настройки гейта для речи — нужно сложить губы трубочкой и шумно выдохнуть воздух в сторону от микрофона, запомнить на индикаторе значение уровня этого шума и выставить его на гейте.
3. Эквалайзер. Здесь все то же самое, что и для оффлайн-видео: нужно отфильтровать лишние частоты, вырезать пару самых противных резонансов и добавить частот в области разборчивости. Также стоит посмотреть на индикатор: если звук после обработки эквалайзером «пикует» в красной зоне, нужно прибрать выходной Gain, если, наоборот, слишком тихий — прибавить.
4. Компрессор. Для стримов он имеет даже большее значение, чем для оффлайн-видео — в онлайне ни один диктор не сможет уследить за динамикой своего голоса на протяжении нескольких часов. Следует быть готовым к тому, что речь будет то едва слышной, то слишком громкой. Поэтому нужно использовать более жесткие настройки компрессора, чем для оффлайн-видео. Начать можно с ratio 10:1, атаки 5 мс и релиза в 30 мс или автоматически.
При подобных настройках нет необходимости в лимитере — компрессор будет выполнять его роль. Но если динамика речи очень большая и не позволяет настроить гейт (то слова начинают обрезаться, то шум просачивается в эфир), тогда можно использовать два компрессора: первый, с более мягкими настройками (ratio 3:1) поставить перед гейтом, второй, в качестве лимитера — в конце цепи (ratio выкрутить на максимум, threshold — так, чтобы компрессор срабатывал только при очень громких фразах).
Дайте послушать результаты!
Разобраться в обработке звука по тексту бывает непросто, но результат того стоит. Смотрите сами. Точнее, слушайте.
Качественный звук в современных видео и стримах значит ничуть не меньше, чем видео в высоком разрешении. А порой и больше — ведь многие ставят ролики на фон, смотря их вполглаза и воспринимая происходящее в основном на слух.
При этом стоит учесть, что данное руководство дает лишь базовые настройки в качестве точки отсчета. Конечный результат должен подбираться аудиально, ведь главный инструмент в работе звукорежиссера — это его собственные уши.