Звук. Как кодируется звук. Цифровой звук.

29 марта 2011





Звук –это распространяющиеся в упругих средах – газах, жидкостях и твёрдых телах – механические колебания, воспринимаемые органами слуха.





Понятие звука

Теперь немного поразмышляем. Если, к примеру, в горах упал камень, а рядом не было никого, кто мог бы слышать звук его падения, существовал звук или нет? На вопрос можно ответить и положительно и отрицательно в равной степени, так как слово «звук» имеет двоякое значение. Поэтому нужно условиться, что же считать звуком – физическое явление в виде распространения звуковых колебаний в воздухе или ощущения слушателя.

Первое по существу является причиной, второе следствием, при этом первое понятие о звуке – объективное, второе – субъективное.

В первом случае звук действительно представляет собой поток энергии, текущей подобно речному потоку. Такой звук может изменить среду, через которую он проходит, и сам изменяется ею.



Во втором случае под звуком мы понимаем те ощущения, которые возникают у слушателя при воздействии звуковой волны через слуховой аппарат на мозг. Ощущая звук, человек может испытывать различные чувства. Самые разнообразные эмоции вызывает у нас тот сложный комплекс звуков, который мы называем музыкой. Звуки составляют основу речи, которая служит главным средством общения в человеческом обществе. И, наконец, существует такая форма звука, как шум. Анализ звука с позиций субъективного восприятия более сложен, чем при объективной оценке.

Распространение звука в пространстве и его воздействие на органы слуха человека.

При достижении звуковой волной какой-либо точки пространства, частицы вещества, до того не совершавшие упорядоченных движений, начинают колебаться. Любое движущееся тело, в том числе и колеблющееся, способно совершать работу, то есть оно обладает энергией. Следовательно, распространение звуковой волны сопровождается распространением энергии. Источником этой энергии является колеблющееся тело, которое и излучает в окружающее пространство(вещество) энергию.

Органы слуха человека способны воспринимать колебания с частотой от 15 Гц до 20 кГц. Механические колебания с указанными частотами называются звуковыми или акустическими(акустика – учение о звуке)

Итак, звук – это волновой колебательный процесс, происходящий в упругой среде и вызывающий слуховое ощущение. Однако восприимчивость человека к звукам избирательна, поэтому мы говорим о слышимых и неслышимых звуках. Совокупность тех и других в общем напоминает спектр солнечных лучей, в котором есть видимая область – от красного до фиолетового цвета и две невидимые – инфракрасная и ультрафиолетовая. По аналогии с солнечным спектром звуки, которые не воспринимаются человеческим ухом, называются:

— инфразвуками (упругие колебания и волны с частотами, лежащими ниже области слышимых человеком частот, до 15 Гц)
— ультразвуками (упругие колебания и волны с частотами приблизительно от 20 кГц до 1 ГГц.

Как кодируется звук



Звук представляет собой распространяющуюся чаще всего в воздухе, воде или другой среде волну с непрерывно изменяющейся интенсивностью и частотой.

Человек может воспринимать звуковые волны (колебания воздуха) с помощью слуха в форме звука различая при этом громкость и тон.

Чем больше интенсивность звуковой волны, тем громче звук, чем больше частота волны, тем выше тон звука.


Зависимость громкости, а также высоты тона звука от интенсивности и частоты звуковой волны

Герц (обозначается Гц или Hz) — единица измерения частоты периодических процессов (например колебаний).
1 Гц означает одно исполнение такого процесса за одну секунду: 1 Гц= 1/с.

Если мы имеем 10 Гц, то это означает, что мы имеем десять исполнений такого процесса за одну секунду.

Человеческое ухо может воспринимать звук с частотой от 20 колебаний в секунду (20 Герц, низкий звук) до 20 000 колебаний в секунду (20 КГц, высокий звук).

Кроме того, человек может воспринимать звук в обширном диапазоне интенсивностей, в котором максимальная интенсивность больше минимальной в 1014 раз (в сто тысяч миллиардов раз).

Для того, чтобы измерять громкость звука придумали и применяют специальную единицу "децибел" (дБ)

Уменьшение или увеличение громкости звука на 10 дБ соответствует уменьшению или увеличению интенсивности звука в 10 раз.

Временная дискретизация звука

Для того чтобы компьютерные системы могли обрабатывать звук, непрерывный звуковой сигнал должен быть преобразован в цифровую, дискретную форму с помощью временной дискретизации.

Для этого, непрерывная звуковая волна разбивается на отдельные маленькие временные участки, для каждого такого участка устанавливается определенная величина интенсивности звука.

Таким образом, непрерывная зависимость громкости звука от времени A(t) заменяется на дискретную последовательность уровней громкости. На графике это выглядит как замена гладкой кривой на последовательность «ступенек».



Для записи аналогового звука и его преобразования в цифровую форму используется микрофон, подключенный к звуковой плате.

Чем гуще на графике будут располагаться дискретные полоски, тем качественнее в итоге получится воссоздать первоначальный звук

Качество полученного цифрового звука зависит от количества измерений уровня громкости звука в единицу времени, т. е. частоты дискретизации.

Частота дискретизации звука - это количество измерений громкости звука за одну секунду.

Чем большее количество измерений производится за одну секунду (чем больше частота дискретизации), тем точнее «лесенка» цифрового звукового сигнала повторяет кривую аналогового сигнала.

Каждой «ступеньке» на графике присваивается определенное значение уровня громкости звука. Уровни громкости звука можно рассматривать как набор возможных состояний N (градаций), для кодирования которых необходимо определенное количество информации I, которое называется глубиной кодирования звука.

Глубина кодирования звука — это количество информации, которое необходимо для кодирования дискретных уровней громкости цифрового звука.

Если известна глубина кодирования, то количество уровней громкости цифрового звука можно рассчитывать по общей формуле N = 2I.

Например, пусть глубина кодирования звука составляет 16 битов, в таком случае количество уровней громкости звука равно:

N = 2I = 216 = 65 536.

В процессе кодирования каждому уровню громкости звука присваивается свой 16-битовый двоичный код, наименьшему уровню звука будет соответствовать код 0000000000000000, а наибольшему — 1111111111111111.

Качество оцифрованного звука

Итак, чем больше частота дискретизации и глубина кодирования звука, тем более качественным будет звучание оцифрованного звука и тем лучше можно приблизить оцифрованный звук к оригинальному звучанию.



Самое низкое качество оцифрованного звука, соответствующее качеству телефонной связи, получается при частоте дискретизации 8000 раз в секунду, глубине дискретизации 8 битов и записи одной звуковой дорожки (режим «моно»).
Но следует помнить, что для улучшения этого звука в телефонии применяются приборы, напоминающие синтезаторы речи и вокодеры. О вокодерах, также доступна эта статья

Самое высокое качество оцифрованного звука, соответствующее качеству аудио-CD, достигается при частоте дискретизации 48 000 раз в секунду, глубине дискретизации 16 битов и записи двух звуковых дорожек (режим «стерео»).

Необходимо помнить, что чем выше качество цифрового звука, тем больше информационный объем звукового файла.

Можно легко оценить информационный объем цифрового стереозвукового файла длительностью звучания 1 секунда при среднем качестве звука (16 битов, 24 000 измерений в секунду). Для этого глубину кодирования необходимо умножить на количество измерений в 1 секунду и умножить на 2 канала (стереозвук):

16 бит × 24 000 × 2 = 768 000 бит = 96 000 байт = 93,75 Кбайт.

Звуковые редакторы

Звуковые редакторы позволяют не только записывать и воспроизводить звук, но и редактировать его. Наиболее видными можно смело назвать, такие как Sony Sound Forge, Adobe Audition, GoldWave и другие.



Оцифрованный звук представляется в звуковых редакторах в наглядной визуальной форме, поэтому операции копирования, перемещения и удаления частей звуковой дорожки можно легко осуществлять с помощью компьютерной мыши.

Кроме того, можно накладывать, перехлёстывать звуковые дорожки друг на друга (микшировать звуки) и применять различные акустические эффекты (эхо, воспроизведение в обратном направлении и др.).

Звуковые редакторы позволяют изменять качество цифрового звука и объём конечного звукового файла путём изменения частоты дискретизации и глубины кодирования. Оцифрованный звук можно сохранять без сжатия в звуковых файлах в универсальном формате WAV (формат компании Microsoft) или в форматах со сжатием OGG, МР3 (сжатие с потерями).
Также доступны менее распространённые, но заслуживающие внимания форматы со сжатием без потерь. О музыкальных форматах читайте нашу статью: Разнообразие цифровых форматов

При сохранении звука в форматах со сжатием отбрасываются не слышимые и невоспринимаемые («избыточные») для человеческого восприятия звуковые частоты с малой интенсивностью, совпадающие по времени со звуковыми частотами с большой интенсивностью. Применение такого формата позволяет сжимать звуковые файлы в десятки раз, однако приводит к необратимой потере информации (файлы не могут быть восстановлены в первоначальном, исходном виде).
_________________________________________________________________

[i]Статью подготовил и отредактировал NECRODEFLORATOR, вся информация была взята из открытых источников в интернете. Специально для AmDm.ru

Взято Отсюда и отсюда.