RuNormy.RU
Untitled Page
RuNormy.RU
Untitled Page
"ГОСТ Р 53556.11-2014. Национальный стандарт Российской Федерации. Звуковое вещание цифровое. Кодирование сигналов звукового вещания с сокращением избыточности для передачи по цифровым каналам связи. Часть III. (MPEG-4 AUDIO). Аудиокодирование без потерь"
Скачать текст бесплатно в формате MS Word
Поделитесь данным материалом с друзьями:

Скачать
Утвержден и введен в действие
Приказом Федерального
агентства по техническому
регулированию и метрологии
от 17 марта 2014 г. N 148-ст

НАЦИОНАЛЬНЫЙ СТАНДАРТ РОССИЙСКОЙ ФЕДЕРАЦИИ

ЗВУКОВОЕ ВЕЩАНИЕ ЦИФРОВОЕ

КОДИРОВАНИЕ СИГНАЛОВ ЗВУКОВОГО ВЕЩАНИЯ С СОКРАЩЕНИЕМ
ИЗБЫТОЧНОСТИ ДЛЯ ПЕРЕДАЧИ ПО ЦИФРОВЫМ КАНАЛАМ СВЯЗИ

ЧАСТЬ III

(MPEG-4 AUDIO)

АУДИОКОДИРОВАНИЕ БЕЗ ПОТЕРЬ

Digital sound broadcasting. Coding of signals of sound
broadcasting with reduction of redundancy for transfer
on digital communication channels. Part III
(MPEG-4 audio). Audio lossless coding

ISO/IEC 14496-3:2009
(NEQ)

ГОСТ Р 53556.11-2014

ОКС 33.170

Дата введения
1 января 2015 года

Предисловие

1 РАЗРАБОТАН Техническим комитетом по стандартизации ТК 480 "Связь"
2 ВНЕСЕН Техническим комитетом по стандартизации ТК 480 "Связь"
3 УТВЕРЖДЕН И ВВЕДЕН В ДЕЙСТВИЕ Приказом Федерального агентства по техническому регулированию и метрологии от 17 марта 2014 г. N 148-ст
4 Настоящий стандарт разработан с учетом основных нормативных положений международного стандарта ИСО/МЭК 14496-3:2009 "Информационные технологии. Кодирование аудиовизуальных объектов. Часть 3. Аудио" (ISO/IEC 14496-3:2009 "Information technology - Coding of audio-visual objects - Part 3: Audio", NEQ) [1]
5 ВВЕДЕН ВПЕРВЫЕ

Правила применения настоящего стандарта установлены в ГОСТ Р 1.0-2012 (раздел 8). Информация об изменениях к настоящему стандарту публикуется в ежегодном (по состоянию на 1 января текущего года) информационном указателе "Национальные стандарты", а официальный текст изменений и поправок - в ежемесячном информационном указателе "Национальные стандарты". В случае пересмотра (замены) или отмены настоящего стандарта соответствующее уведомление будет опубликовано в ближайшем выпуске ежемесячного информационного указателя "Национальные стандарты". Соответствующая информация, уведомление и тексты размещаются также в информационной системе общего пользования - на официальном сайте Федерального агентства по техническому регулированию и метрологии в сети Интернет (www.gost.ru)

1 Область применения

Этот стандарт описывает алгоритм кодирования аудиосигналов без потерь: аудиокодирование без потерь MPEG-4 (ALS).
MPEG-4 ALS являются схемой сжатия данных цифрового аудио без потерь, то есть декодируемые данные являются разрядно-идентичной реконструкцией исходных входных данных. Входные сигналы могут быть целочисленными данными PCM от 8- до 32-разрядной длины слова или 32-разрядными данными IEEE с плавающей точкой. MPEG-4 ALS обеспечивает широкий диапазон гибкости с точки зрения компромисса сжатия - сложности, поскольку комбинация нескольких инструментов позволяет определить уровень компрессии с различными степенями сложности.

2 Технический обзор

2.1 Структура кодера и декодера

Входные аудиоданные делятся на фреймы (кадры). В пределах фрейма каждый канал может быть дополнительно разделен на блоки аудиосэмплов (выборок аудио) для дальнейшей обработки. Для каждого блока вычисляется ошибка прогноза, используя краткосрочный прогноз и дополнительно долгосрочный прогноз (LTP). Межканальная избыточность может быть удалена объединенным кодированием каналов, используя либо дифференциальное кодирование пар каналов, либо многоканальное кодирование (MCC). Остающаяся ошибка прогноза является в итоге кодированной энтропией.
Кодер генерирует информацию о потоке битов, позволяющую произвольный доступ с промежутками в несколько фреймов. Кодер может также обеспечить контрольную сумму CRC, которую может использовать декодер, чтобы проверить декодируемые данные. Декодер применяет инверсные операции кодера в обратном порядке. Его вывод является разрядно-идентичной версией исходных входных аудиоданных.

2.2 Расширения с плавающей точкой

В дополнение к целочисленным аудиосигналам MPEG-4 ALS также поддерживает сжатие аудиосигналов без потерь в 32-разрядном формате с плавающей точкой IEEE. Последовательность с плавающей точкой моделируется суммой целочисленной последовательности, умноженной на константу (ACF: Approximate Common Factor), и остаточной последовательностью. Целочисленная последовательность сжимается, используя основные инструменты ALS для целочисленных данных, в то время как остаточная последовательность отдельно сжимается замаскированным инструментом Lempel-Ziv.

3 Термины и определения

3.1 Определения

В стандарте используются следующие определения и сокращения.

Frame Сегмент аудиосигнала (содержащий все каналы).
Block Сегмент одного звукового канала.
Sub-block Часть блока, которая использует те же параметры кодирования энтропии.
Random Access Frame Фрейм, который может декодироваться без декодирования предыдущих фреймов.
Residual Ошибка прогноза, то есть истинный минус предсказанного сигнала.
Predictor/Prediction Filter Линейный фильтр FIR, который вычисляет оценку входного сигнала, используя предыдущие выборки.
Prediction order Порядок фильтра прогноза (число коэффициентов прогнозирующего устройства).
LPC coefficients Коэффициенты фильтра прогноза прямой формы.
Parcor coefficients Представление parcor коэффициентов прогнозирующего устройства.
Quantized coefficients Квантованные коэффициенты parcor.
LTP Долгосрочный прогноз.
Rice code Также известно как код Golomb-Rice. В этом документе используется краткая форма.
BGMC Блоковый код Block Gilbert-Moore Code (также известен как код Elias-Shannon-Fano).
CRC Контроль циклически избыточным кодом.
LPC Кодирование с линейным предсказанием.
PCM Импульсно-кодовая модуляция.
Mantissa Дробная часть данных с плавающей точкой.
Exponent Экспоненциальная часть данных с плавающей точкой.
ACFC Кодирование с приближенным общим множителем.
Masked-LZ Замаскированное кодирование Lempel-Ziv.
MCC Многоканальное кодирование.
MSB Старший значащий бит.
LSB Младший значащий бит.

3.2 Мнемоника

uimsbf Целое число без знака, старший значащий бит сначала
simsbf Целое число со знаком, старший значащий бит сначала
bslbf Битовая строка, левый бит сначала, где "левый" является порядком, в котором пишутся биты
EEE32 32-разрядные данные с плавающей точкой IEEE (4 байта), старший значащий бит сначала
Мнемонический код Райса и BGMC указывают, что используются кодовые комбинации переменной длины.

3.3 Типы данных

В разделах псевдокода используются следующие типы данных:

INT64 64-разрядное целое число со знаком (дополнение до двух)
long 32-разрядное целое число со знаком (дополнение до двух)
short 16-разрядное целое число со знаком (дополнение до двух)
x. y Дробное представление с фиксированной точкой со знаком, где x является числом битов слева от точки в двоичном числе, и y является числом битов справа от точки в двоичном числе (представление знака дополнения до двух). 64-разрядное целое число со знаком (дополнение до двух)
Если перед типом данных добавляется "без знака", то типом является тип без знака вместо типа со знаком.

3.4 Замечания по реализации

В этом документе есть несколько логарифмических арифметических вычислений в форме 'ceil(log2(...))', которые определяют целочисленное значение, которое описывает число необходимых битов для определенного параметра.
Чтобы избежать непоследовательных результатов и реализовать ceil() и log2(), не должны использоваться никакие функции с плавающей точкой. Чтобы получить математически корректные целочисленные результаты, должны использоваться реализации с фиксированной точкой (например, применение сдвигов битов).

4 Синтаксис

4.1 Конфигурация декодера

Таблица 1

Синтаксис ALSSpecificConfig

Синтаксис Количество битов Мнемоника
Для просмотра документа целиком скачайте его >>>
Нормы из информационного банка "Строительство":
Пожарные нормы:
ГОСТы:
Счетчики:
Политика конфиденциальности
Copyright 2020 - 2022 гг. RuNormy.RU. All rights reserved.
При использовании материалов сайта активная гипер ссылка  обязательна!