• Главная
  • Карта сайта
Не найдено

Аудіо-кодування: секрети розкрито

  1. Налаштування аудіо для відеозахвату і трансляції. Як люди, безпосередньо пов'язані з AV сферою, ми...
  2. Розрядність
  3. бітрейт
  4. Частота дискретизації, розрядність і бітрейти в реальному житті.
  5. Наші рекомендації
  6. При записи аудіо з відео ...
  7. При потокової передачі аудіо з відео ...

Налаштування аудіо для відеозахвату і трансляції.

Як люди, безпосередньо пов'язані з AV сферою, ми постійно говоримо про аудіо-кодуванні і аудіокодек, а що ж це таке? Аудіокодек - це, по суті, пристрій або алгоритм, здатний кодувати і декодувати цифровий аудіосигнал.

Аудіокодек - це, по суті, пристрій або алгоритм, здатний кодувати і декодувати цифровий аудіосигнал

На практиці аудіоволни, які передаються по повітрю, є тривалими аналоговими сигналами. Сигнали перетворюються в цифровий формат пристроєм, який називається аналого-цифровий перетворювач (АЦП), а пристрій зворотного перетворення - цифро-аналоговий перетворювач (ЦАП). Кодек знаходиться між цими двома функціями і саме він дозволяє відкоригувати деякі важливі параметри для успішного захоплення, записи і трансляції звукового сигналу: алгоритм кодека, частота дискретизації, розрядність і швидкість передачі даних.

Кодек знаходиться між цими двома функціями і саме він дозволяє відкоригувати деякі важливі параметри для успішного захоплення, записи і трансляції звукового сигналу: алгоритм кодека, частота дискретизації, розрядність і швидкість передачі даних

Три найбільш популярних аудиокодека: Pulse-Code Modulation (PCM), MP3 і Advanced Audio Coding (AAC). Вибір кодека визначає ступінь стиснення і якість запису. PCM - кодек, який використовується комп'ютерами, CD-дисками, цифровими телефонами і іноді SACD-дисками. Джерело сигналу для PCM семпліруется через рівні інтервали, і кожен семпл є амплітуду аналогового сигналу в цифровому значенні. PCM - це найбільш простий варіант для оцифровки аналогового сигналу.

При наявності правильних параметрів цей оцифрований сигнал може бути повністю реконструйований назад в аналоговий без будь-яких втрат. Але цей кодек, що забезпечує практично повну ідентичність оригінальному аудіо, на жаль, не дуже економічний, що виражається в дуже великих обсягах файлів, а такі файли не підходять для потокового мовлення. Ми рекомендуємо використовувати PCM для запису цифрових образів для ваших джерел або коли ви займаєтеся постобработкой аудіо.

На щастя, у нас завжди є можливість вибрати інший кодек, який може стискати цифрові дані (в порівнянні з PCM) на підставі деяких корисних спостережень про поведінку звукових хвиль. Але в цьому випадку доводиться йти на компроміс: всі альтернативні алгоритми пов'язані з «втратами», так як неможливо повністю відновити вихідний сигнал, але, тим не менш, результат все одно хороший настільки, що більшість користувачів не зможуть вловити різницю.

MP3 - це формат аудіо-кодування з використанням як раз такого алгоритму стиснення цифрових даних, який дозволяє зберігати аудіосигнал в менші за обсягом файли. Кодек MP3 найчастіше використовується користувачами для запису і зберігання музичних файлів. Ми рекомендуємо застосовувати MP3 для трансляцій аудіо-контенту, так як йому потрібна менша пропускна здатність мережі.

AAC - це більш новий алгоритм кодування аудіосигналу, що став «наступником» MP3. AAC став стандартом для форматів MPEG-2 і MPEG-4. По суті це теж кодек стиснення цифрових даних, але з меншою, ніж у MP3, втратою якості при кодуванні з однаковими бітрейтами. Ми рекомендуємо використовувати цей кодек для онлайн трансляцій.

Частота дискретизації (кГц, kHz)

Частота дискретизації (або частота семплювання) - частота, з якою відбувається оцифровка, зберігання, обробка або конвертація сигналу з аналога в цифру. Дискретизація за часом означає, що сигнал представляється поруч своїх відліків (семплів), узятих через рівні проміжки часу.

Вимірюється в герцах (Гц, Hz) або кілогерцах (кГц, kHz,) 1 кГц дорівнює 1000 Гц. Наприклад, 44 100 семплів в секунду можна позначити як 44 100 Гц або 44,1 кГц. Обрана частота дискретизації буде визначати максимальну частоту відтворення, і, як випливає з теореми Котельникова, для того, щоб повністю відновити вихідний сигнал, частота дискретизації повинна в два рази перевищувати найбільшу частоту в спектрі сигналу.

Як відомо, людське вухо здатне вловлювати частоти між 20 Гц і 20 кГц. З огляду на ці параметри і значення, показані в таблиці нижче, можна зрозуміти, чому саме частота 44,1 кГц була обрана в якості частоти дискретизації для CD і до сих пір вважається дуже хорошою частотою для запису.

З огляду на ці параметри і значення, показані в таблиці нижче, можна зрозуміти, чому саме частота 44,1 кГц була обрана в якості частоти дискретизації для CD і до сих пір вважається дуже хорошою частотою для запису

Є ряд причин для вибору більш високої частоти дискретизації, хоча може здатися, що відтворювати звук поза діапазону людського слуху - марна трата сил і часу. При цьому середньостатистичному слухачеві буде цілком достатньо 44,1 - 48 кГц для якісного вирішення більшості завдань.

Розрядність

Поряд з частотою дискретизації є таке поняття як розрядність або глибина звуку. Розрядність - це кількість біт цифрової інформації для кодування кожного семпли. Простіше кажучи, розрядність визначає «точність» вимірювання вхідного сигналу. Чим більше розрядність, тим менше похибка кожного окремого перетворення величини електричного сигналу в число і назад. З мінімальною можливою розрядністю є тільки два варіанти вимірювання точності звуку: 0 для повної тиші і 1 для звучання в повному обсязі. Якщо розрядність дорівнює 8 (16), то при вимірюванні вхідного сигналу може бути отримано 28 = 256 (216 = 65 536) різних значень.

Розрядність закріплена в кодеку PCM, але для кодеків, які передбачають стиснення (наприклад, MP3 і AAC) цей параметр розраховується при кодуванні і може змінюватися від семпли до семпли.

бітрейт

Бітрейт - це показник кількості інформації, яким кодується одна секунда звучання. Чим він вищий, тим менше спотворень і тим ближче закодована композиція до оригіналу. Для лінійного PCM бітрейт розраховується дуже просто.

бітрейт = частота дискретизації × розрядність × канали

Для таких систем як Epiphan Pearl, які кодують лінійний PCM 16-біт (розрядність 16), цей розрахунок може бути використаний для визначення, скільки додаткових смуг пропускання може знадобитися для PCM аудіо. Наприклад, для стерео (два канали) оцифровка сигналу проводиться з частотою 44,1 кГц на 16-біт, а бітрейт при цьому розраховується таким чином:

44,1 кГц × 16 біт × 2 = 1 411,2 кбіт / с

Тим часом алгоритми стиснення аудіосигналу, такі як AAC і MP3, мають меншу кількість біт для передачі сигналу (в цьому і полягає їхня мета), тому вони використовують невеликі бітрейти. Зазвичай значення знаходяться в діапазоні від 96 кбіт / с до 320 кбіт / с. Для цих кодеків чим вище бітрейт ви вибираєте, тим більше аудіо біт ви отримуєте на семпл, і тим вищою буде якість звучання.

Частота дискретизації, розрядність і бітрейти в реальному житті.

Аудіо CD-диски, одні з перших найбільш популярних винаходів для простих користувачів для зберігання цифрового аудіо, використовували частоту 44,1 кГц (20 Гц - 20 кГц, діапазон людського вуха) і розрядність 16-біт. Дані значення були обрані, щоб при хорошій якості звуку мати можливість зберігати як можна більше аудіо на диску.

Коли до аудіо додалося відео і з'явилися DVD, а пізніше Blu-Ray диски, був створений новий стандарт. Записи для DVD і Blu-Rays зазвичай використовують лінійний формат PCM з частотою 48 кГц (стерео) або 96 кГц (звук 5.1 Surround) і розрядність 24. Ці значення були обрані в якості ідеального варіанту, щоб зберігати аудіо з синхронізацією з відео і при цьому отримувати максимально можливу якість з використанням додаткового доступного дискового простору.

Наші рекомендації

CD, DVD і Blu-Ray диски переслідували одну мету - дати споживачеві високоякісний механізм відтворення. Завданням всіх розробок було надати високу якість аудіо та відео, не піклуючись про величину файлу (аби він уміщався на диск). Така якість міг забезпечити лінійний PCM.

Навпаки, у мобільних засобів інформації і потокового медіа зовсім інша мета - використовувати максимально низький бітрейт, при цьому достатній для підтримки прийнятного для слухача якості. Для цього завдання найкраще підходять алгоритми стиснення. Тими ж принципами ви можете керуватися для своїх записів.

При записи аудіо з відео ...

У разі якщо запис буде використовуватися для подальшої обробки, вибирайте кодек PCM з частотою 48 кГц і максимальної розрядністю (16 або 24), щоб забезпечити найкращу якість аудіо. Ми рекомендуємо дані параметри для Epiphan Pearl .

При потокової передачі аудіо з відео ...

При потокової передачі або запису для подальшої трансляції можна отримати гарне звучання аудіо при меншій смузі пропускання, використовуючи кодеки AAC або MP3 з частотою 44,1 кГц і бітрейт 128 кбіт / с або вище. Такі параметри гарантують, що звук буде досить хороший і не позначиться на якості трансляції.

Як люди, безпосередньо пов'язані з AV сферою, ми постійно говоримо про аудіо-кодуванні і аудіокодек, а що ж це таке?
Провайдеры:
  • 08.09.2015

    Batyevka.NET предоставляет услуги доступа к сети Интернет на территории Соломенского района г. Киева.Наша миссия —... 
    Читать полностью

  • 08.09.2015
    IPNET

    Компания IPNET — это крупнейший оператор и технологический лидер на рынке телекоммуникаций Киева. Мы предоставляем... 
    Читать полностью

  • 08.09.2015
    Boryspil.Net

    Интернет-провайдер «Boryspil.net» начал свою работу в 2008 году и на данный момент является одним из крупнейших поставщиков... 
    Читать полностью

  • 08.09.2015
    4OKNET

    Наша компания работает в сфере телекоммуникационных услуг, а именно — предоставлении доступа в сеть интернет.Уже... 
    Читать полностью

  • 08.09.2015
    Телегруп

    ДП «Телегруп-Украина» – IT-компания с 15-летним опытом работы на рынке телекоммуникационных услуг, а также официальный... 
    Читать полностью

  • 08.09.2015
    Софтлинк

    Высокая скоростьМы являемся участником Украинского центра обмена трафиком (UA — IX) с включением 10 Гбит / сек... 
    Читать полностью