Формат MIDI (Musical Instrument Digital Interface) был изначально разработан для управления музыкальными инструментами. Сегодня он используется в области электронных музыкальных инструментов и устройств компьютерного синтеза.
Кодирование звуковой информации 🎤 Оцифровка звука
Одной из основных задач вычислительной техники является представление данных в формате, пригодном для хранения и передачи. Эти данные могут быть различных типов — аудио, текст, графика и т.д. Эта статья посвящена кодированию звуковой информации. В этой статье вы узнаете основные принципы и определения. Кроме того, после прочтения этого текста вы сможете вычислить объем аудиофайла. Читайте дальше!
Чтобы понять эту тему, необходимо знать, что такое звуковая информация (аудио).
Звук — это непрерывная аналоговая волна, проходящая через окружающую среду. Средой может быть воздух, жидкости, твердые тела, электричество и т.д.
Звук как непрерывная волна характеризуется двумя свойствами — частотой и амплитудой.
Амплитуда определяет интенсивность звукового сигнала. Чем больше амплитуда, тем больше громкость.
Частота описывает тональность звуковой информации. Чем выше частота, тем выше высота тона. Человеческое ухо может воспринимать волны от 20 Гц до 20 кГц. 1 Гц соответствует одной длине волны звука в секунду.
Это интересно Как зарегистрировать домен самостоятельно 🙆. Что для этого нужно + инструкция
Представление и кодирование звуковой информации в компьютере
Для представления и кодирования звука используются специальные устройства и программное обеспечение. Давайте рассмотрим весь процесс более подробно.
- Аудиоинформация, поступая из окружающей среды (например, по воздуху), преобразуется в электрический сигнал. Для этого используется такое устройство, как микрофон .
- После этого звук поступает на АЦП ( аналого-цифровой преобразователь ), где подвергается оцифровке.
- На последнем этапе информация ( уже в двоичном виде ) кодируется при помощи специальной программы – аудиокодека. На выходе получается файл в специальном формате ( например, mp3 ), который можно хранить, воспроизводить и передавать.
Особый интерес представляет оцифровка, также называемая аналого-цифровым преобразованием (АЦП), при которой аналоговый сигнал заменяется цифровым.
Основной принцип аналого-цифрового преобразования заключается в том, что амплитуда волны измеряется через равные промежутки времени. Этот процесс также называется выборкой.
Дискретизация — это процесс, при котором непрерывная функция представляется в виде дискретной последовательности ее значений. Схематически дискретизация может быть представлена следующим образом:
Дискретизация характеризуется двумя величинами:
- Частота шага по времени;
- Шаг квантования.
Первая величина указывает на частоту взятия проб и измеряется в герцах (количество измерений за одну секунду). Частота временного шага определяется с помощью теоремы Котельникова.
Шаг количественной оценки характеризуется количеством шагов, на которые округляются значения амплитуды волны.
Количество шагов, на которое округляются значения сигнала, зависит от аналого-цифрового преобразователя. В настоящее время используются 16-, 32- и 64-битные устройства.
Количество битов, необходимое для количества уровней, называется глубиной кодирования аудиоинформации.
Глубина кодирования связана с количеством уровней по формуле:
Где i — битовая глубина АЦП.
Чем больше выборок берется в единицу времени и чем больше глубина кодирования, тем выше качество выходных аудиоданных и тем точнее АЦП.
Расчет объема аудио файла
Вес» аудиофайла зависит от качества оцифровки и должен быть рассчитан по следующей формуле:
- N – длительность звучания в секундах;
- K – разрядность АЦП (глубина кодирования) в битах;
- F – частота взятия дискрет в герцах;
- Z – количество каналов ( 1- моно, 2 — стерео).
Пример: вычисление громкости аудиофайла со следующими характеристиками: монофонический звук, частота дискретизации 8 кГц, глубина 8 бит (телефонная связь) и продолжительность 60 секунд.
\V = 60*1*8000*8=3840000 \Bits
2. Понятие звукозаписи
Запись — это хранение информации о свойствах звуковых волн.
Различают аналоговый и цифровой методы записи. В аналоговой записи непрерывный «отпечаток» звуковой волны помещается на носитель. Например, на пластинке записывается непрерывная канавка, изгибы которой следуют за амплитудой и частотой звука.
Аналоговая звукозапись
Цифровой метод записи
16.3. Оцифровка звука
Для того чтобы компьютер мог обрабатывать звук, непрерывный звуковой сигнал должен быть преобразован в цифровую, дискретную форму. Для этого необходимо провести отбор проб времени и количественную оценку: Параметры звукового сигнала измеряются не непрерывно, а через определенные промежутки времени (временная выборка); результаты измерений записываются в цифровом виде с ограниченной точностью (квантование).
Как правило, в компьютер поступает не сам звук, а электрический сигнал, полученный от какого-либо устройства: Микрофон, например, преобразует звуковое давление в электрические колебания, которые затем обрабатываются.
При записи стереозвука (двухканальная запись) оцифровывается не один электрический сигнал, а два, таким образом, количество цифровой информации удваивается.
Суть временной дискретизации заключается в том, что аналоговый звуковой сигнал разбивается на отдельные небольшие временные участки и для каждого из них устанавливается определенное значение громкости (рис. 3.13). Другими словами: Уровень аналогового сигнала измеряется через определенные промежутки времени. Количество таких измерений в секунду называется частотой дискретизации.
Частота дискретизации — это количество измерений уровня звука в секунду.
Рисунок 3.13: Временная выборка звукового сигнала (A(t) — амплитуда, t — время).
Частота дискретизации измеряется в герцах (Гц) и килогерцах (кГц); 1 кГц = 1000 Гц. Частота дискретизации 100 Гц означает, что было измерено 100 уровней звука в секунду.
Качество записи зависит не только от частоты дискретизации, но и от глубины кодирования звука.
Глубина или разрешение аудиокодирования — это количество информации, необходимое для кодирования дискретных уровней громкости цифрового звука.
Измерения звукового сигнала (см. рисунок 3.13) дают значение интенсивности на каждом «шаге» сигнала, при этом все результаты измерений попадают в определенный диапазон.
Для записи результата измерения объема в памяти компьютера зарезервировано n бит. Вы знаете, что с помощью этого можно закодировать ровно 2 n различных результатов измерений. Таким образом, при n = 8 мы можем закодировать 256 различных измерений объема. По этой причине мы можем разделить весь диапазон, в котором находятся результаты измерения уровня звука, на 256 различных поддиапазонов — уровней звука — и присвоить каждому из них уникальный код. Затем каждый имеющийся результат измерения уровня звука может быть отнесен к подзоне, в которую он попадает, и закодирован номером (кодом) соответствующего уровня звука.
В зависимости от конкретного случая на практике используются различные частоты дискретизации и глубины кодирования (табл. 3.13).
Таблица 3.13
Примеры параметров оцифровки звука
САМОЕ ГЛАВНОЕ
Звук — это волна, распространяющаяся в воздухе, воде или другой среде, амплитуда и частота которой постоянно меняются.
Для того чтобы компьютер мог обрабатывать звук, непрерывный звуковой сигнал должен быть преобразован в цифровую, дискретную форму. Для этого необходимо провести отбор проб времени и количественную оценку: Параметры звукового сигнала измеряются не непрерывно, а через определенные промежутки времени (временная выборка); результаты измерений записываются в цифровом виде с ограниченной точностью (квантование).
Таким образом, оцифровка звука искажает сохраненный сигнал двумя способами: во-первых, информация о фактическом изменении звука между измерениями теряется из-за дискретизации, а во-вторых, квантификация сохраняет дискретные, а не точные значения.
Объем оцифрованного аудиофрагмента в битах является произведением частоты дискретизации в Гц, глубины кодирования аудио в битах, длительности аудио в секундах и количества каналов.