Видеокодер Dr.DivX (доктор DivX) - руководство пользователя.

Автор: Виктор Норкин

страницы: 1 2 3 4 5 6 7 8 9 10   

Глоссарий (словарь терминов и определений)
3:2 Pulldown - преобразование 3 к 2
Преобразование фильма с частотой кадров 24 fps (кадра в секунду) к фильму с частотой 30 кадров в секунду, в котором каждый видео-кадр описывается 3 строками. Результирующее видео имеет повторяющуюся последовательность из 3 строк, сопровождаемых 2 кадрами.
AC3.Также известен как цифровой аудиоформат Dolby Digital от Dolby LabsTM. Он может поддерживать до 5.1 каналов звука.
AVI. Audio Video Interleave - чередование аудио и видео (привязка их друг к другу): Это формат видео, обычно используемый на компьютерах с операционной системой windows. Данный формат определяется как некое объединение аудио и видео данных, без указания на какой-то определенный кодек.
B-кадры/ двунаправленное кодирование. Существует три типа кадров, которые возможны в DivX видео-потоке. Эти кадры называются I-кадры (Intra), P-кадры (Predicted - кадры предсказания) и B-кадры (двунаправленные). До появления кодека DivX версии 5.0 использовались только I и P кадры. I-кадры кодируются, используя информацию только из самого кодируемого кадра, они не используют информацию из других кадров (временную компрессию). I-кадры основаны на обычном сжатии одиночных кадров в формат JPEG.
P-кадры (Predicted - кадры предсказания) предсказывают следующие кадры и могут также ссылаться на I- или P-кадры, т.е. Р-кадры кодируются с использованием информации из предыдущих кадров. В любой видеопоследовательности всегда найдется группа кадров, многие из которых будут одинаковыми и будут содержать одно и то же изображение. Например, если вы смотрите новости, и обратите внимание, на какого либо движущегося персонажа, то можете заметить, что для нескольких кадров фон за ним почти всегда остается без изменений. (Помните, что обычно кадры сменяются с частотой 25 или 30 кадров в секунду). Таким образом, вместо независимого JPEG-кодирования каждого кадра, вы можете использовать избыточность предыдущих кадров, применяя P-кадры. По существу, P-кадры это будущие кадры, которые определяют, как блок в предыдущем кадре переместился в текущем Р-кадре. Таким образом, вместо пространственного JPEG-кодирования кадра, P-кадр только говорит "Эй, блок, в предыдущем кадре, двигайся в точку с координатами (X,Y)". Данный алгоритм временного кодирования требует гораздо меньше данных, чем пространственное кодирование каждого кадра. По существу, мы передаем разность между соседними кадрами, а это более эффективно, чем передача обычного I-кадра.
Версия DivX Pro 5.0 позволяет также использовать B-кадры, которые помогают DivX кодеку предсказывать будущие кадры, выбирая наилучшее предсказанное соответствие между двумя кадрами, вместо одного. B-кадры это кадры, которые строятся на анализе предсказания кодеком не только бедующих кадров, но и кадров предсказанных ранее, а такими кадрами могут быть I или P-кадры. Использование сокращает объем данных, требуемых для кодирования кадра. Кроме того, использование B-кадров улучшает качество фильма, особенно в областях кадра, где движущиеся объекты открывают скрытые области.
Bitrate - битрейт
Битрейт - это битовая скорость передачи данных, т.е. число бит передаваемых в единицу времени, обычно измеряется в битах в секунду. При кодировании видео различают видео - и аудиобитрейт, при кодировании каждый параметр задается своим значением и не зависит от другого.
Brightness - яркость
(1) Интенсивность цвета, определяемая в градациях от черного (нулевая яркость) к белому (максимальная яркость).
CBR/VBR постоянный/ переменный битрейт
Constant Bitrate/ Variable Bitrate - постоянный/ переменный битрейт. При постоянном битрейте, на каждый кадр фильма выделяется одинаковое количество битов. При переменном битрейте, кадры, требующие лучшего качества, получают большее количество битов и наоборот. Заметим, что динамичные сцены фильма требуют большее количество битов, чем плавные.
Codec -кодек
COder/DECoder - Кодер-декодер (сокращенно кодек): Кодек - это часть программного обеспечения, которая позволяет вам кодировать данные (обычно аудио или видео) в определенный формат, а также может обратно декодировать, закодированные в этом формате данные. Популярные кодеки: MPEG-1, MPEG-2, MPEG-4, Indeo, и т.п.
AVI, ASF и другие - это не кодеки, а форматы данных, которые могут быть получены с помощью кодеков.
Composite Video - композитное видео
Это сигнал, в котором luminance (составляющая яркости), chrominance (составляющая цветности), и sync (синхронизация) объединены в один сигнал, используемый в стандарте телевизионного вещания.
De-blocking -разблокирование изображения
Деблокинг - это фильтр, работающий с блоками 8x8 пиксель в яркостной и цветовой составляющих. Он помогает уменьшить блокирующие артефакты, вызванные DCT-алгоритмом пространственного сжатия, который используется кодеком. Блокирование - это наиболее заметный артефакт, поэтому деблокинг это самый первый фильтр, который должен применяться.
De-ringing
De-ringing это фильтр, используемый для уменьшения шума вблизи резких переходов, вызванных дискретностью квантования (так называемый эффект Гиббса - Gibbs effect). Такого рода шумы наиболее заметны при оцифровке анимации, так как там наиболее высокие частотные коэффициенты. Распределение яркостной составляющей активируется только на 6 уровне пост-процессорной обработки. Из-за высоких требований к центральному процессору и относительно низкого влияния фильтра, он включается только на процессорах Pentium-III или выше.
Decoding - декодирование
Термин Декодирование описывает процесс преобразования сжатого (закодированного) файла в удобное для просмотра изображение.
De-interlace - деинтерлейс (удаление чересстрочности)
Это процесс удаления артефактов вызванных природой чересстрочного видео (два поля на один кадр).
Demultiplexing - разделение
Демультиплексирование - это процесс обратный мультиплексированию (объединению). При демультиплексировании объединенный аудио/видео поток будет разделяться на несколько потоков, состоящих из видео-потока, и, по крайней мере, одного аудио-потока и потока синхронизации. Каждый VOB-кодер разделяет VOB-файлы перед кодированием (например, так поступают кодеры FlasKMPEG, MPEG-2avi, DVD2MPG, ReMPEG-2), также действует и каждый DVD-проигрыватель (аудио и видео потоки будут обрабатываться различными аппаратными схемами, или декодироваться различными фильтрами на компьютере).
Digital Video - цифровое видео
Цифровое видео обычно сжимается, потому что в несжатом виде оно требует терабайты памяти (один терабайт это тысяча гигабайт или около 1012 байт). Так как стандартное сжатие без потери качества недостаточно для видео, то кодеки удаляют избыточную информацию, которую человеческий глаз вряд ли увидел бы. Так для современного сжатия и этого все еще не достаточно, то применяются алгоритмы ключевых, I- и Р-кадров, для еще большего сокращения размеров файла и экономии дискового пространства.
DirectX
DirectX - это интерфейс прикладных программ (API - Application Programs interface), разработанный фирмой Microsoft (впервые для Windows 95) для создания и управления графикой и мультимедийными эффектами в программах, таких как игры и активные Интернет страницы. DirectX включает Direct-Draw API для прямого доступа к видеопамяти.
DivXTM
DivXTM - это технология сжатия цифрового видео, которое может быть загружено из Интернет по выделенному или коммутируемому соединению за относительно короткое время без заметной на глаз потери качества изображения.
Encoding - кодирование
Это процесс сжатия "сырого" несжатого файла, путем кодирования его в заданный формат с сохранением заданного качества.
FilmFX
Этот алгоритм пост-обработки добавляет "тепло" к видеофильму для тех пользователей, которым нравятся теплые оттенки вместо четкости цифрового видео. FilmFx-фильтр лучше всего подходит не только для добавления "теплоты" к видеофильму, но и для сокращения воспринятой в цифровом видео блокировки и уменьшению нагрузке на процессор при декодировании.
Frame - кадр
Это основа всего фильма, один кадр представляет одну картинку. Фильм обычно идет с частотой 24, 25 или 30 кадров в секунду, что эквивалентно показу 24 (25 или 30) картинок в секунду. Представьте 24 картинки, с птицей на каждой. На первой картинке птица находится слева, на каждой последующей она постепенно сдвигается вправо, на последней картинке птица находиться на самом правом краю. Когда эти 24 картинки будут последовательно и очень быстро показаны, то человеческий глаз увидит, что птица летит слева направо.
Frameserving
Frameserving - фреймсервинг, это использование одной программы декодирования или чтения видео-файла для того, чтобы передать декодированное изображение другой программе редактирования или кодирования видео.
Global Motion Compensation - общая компенсация движения
Global Motion Compensation (GMC) - общая компенсация движения помогает улучшить комплексные сцены, в которых представлено панорамирование и масштабирование. Возможность сократить объем данных от одного кадра к другому может уменьшаться, так как есть некоторое сходство между панорамированием и масштабированием изображения. Чтобы наиболее эффективно компенсировать движение, это сходство может использоваться, в тех группах блоков, которые чаще всего встречаются в таких сценах.
Hue - оттенки
Оттенок - это общая градация всех цветов.
I and P Frames (I- и P-кадры)
Это кадры, описывающие только отличие от предшествующего им кадра (это не совсем точное определение, но этим способом можно получить картинку). Например, мы имеем ключевой кадр с птицей на облачном небе. Тогда мы можем использовать I-кадр, который "говорит" что-то типа: "Переместить птицу на один дюйм влево и на дюйм вниз".
Inverse Telecine
Inverse Telecine - этот процесс выполняет извлечение из видео источника оригинальных 24 кадров в секунду (видео стандарта PAL) из 29,97 кадров в секунду (видео стандарта NTSC), т.е. преобразовывает видео NTSC-стандарта к PAL или SECAM.
Keyframe - ключевой кадр
Полный кадр, но сильно сжатый (компрессированный).
Letterbox
Формат кадра кинофильма гораздо шире стандартного телевизионного кадра. Поэтому, чтобы сохранить формат изображения при показе по телевидению, кинофильм будет иметь черные полосы сверху и снизу.
Mark In - отметить начало
Выбор первого кадра видеофрагмента
Mark Out - отметить конец
Выбор последнего кадра видеофрагмента.
MP3
MP3 (MPEG-1 Audio Layer-3) это стандартная технология и формат сжатия звуковой последовательности в очень малый файл (уменьшение примерно в 20 раз от размера исходного файла) с сохранением при воспроизведении уровня качества оригинального звукового файла. MP3-технология использует психо-акустическое моделирование, чтобы уменьшить размер аудиофайла и сохранить высокий уровень качества звука.
MPEG
Аббревиатура MPEG означает Motion Picture Expert Group (экспертная группа по разработке стандартов цифрового вещания) и одновременно сокращением MPEG обозначается общее наименование видеоформатов. Экспертная группа определяет стандарты для цифрового видео, такие как MPEG-1 (используемый в дисках Video CD), MPEG-2 (используемый в дисках DVD и SVCD), MPEG-4 (используемый в видеотехнологии DivX), а также некоторые аудиостандарты - среди которых MP3 и AAC.
MPEG-4
MPEG-4 это стандарт, разработанный 11 рабочей группой MPEG из ISO (International Standard Organization - международной организации по стандартизации) в октябре 1998 (дата первого проекта стандарта). MPEG-4 это стандарт зрелой цифровой эры. Со своими дополнительными особенностями MPEG-4 предлагает лучшую компрессию, интерактивность и универсальный Internet/ беспроводный доступ к данным.
Multipass encoding - многопроходное кодирование
Истинное многопроходное кодирование в настоящее время доступно только для WM8 и MPEG-2 (SVCD и miniDVD). Кодер, поддерживающий многопроходность, на первом проходе анализирует видео-поток и записывает все, с чем сталкивается, в log-файлы. Предположим, что мы имеем короткий фрагмент, начинающийся со сцены диалога, где мы кое-что вырезали, и в которой камера остается неподвижной. Затем переходим к кадрам с карате, с большим количеством быстро сменяющихся сцен и активно разворачивающимся действием (люди, летящие в воздухе, удары ногой, кулаками и т.п.).
Обычно при постоянном битрейте, кодер каждую секунду получает больший или меньший битрейт (это можно лишь с натяжкой назвать 100% постоянным битрейтом, но это детали). В то время как в многопроходном режиме переменного битрейта, кодер будет использовать битрейт согласно знанию о видео-потоке, то есть сцена с диалогом получит выделенный битрейт, а сцена борьбы - значительно больший.
Чем будет больше проходов, тем будет более совершенное распределение битрейта. В одиночном проходе переменного битрейта, кодер должен основывать свое решение о том, где и какой битрейт использовать, исключительно на знании состава своего предыдущего кодирования.
Multiplexing - объединение
Видео и аудио потоки обычно кодируются отдельно. Вы должны соединить их, чтобы получить видеофильм, который можно воспроизвести (конечно, вы можете воспроизводить аудио и видео отдельно на двух проигрывателях, но вам потребуется жесткая взаимная синхронизация потоков) Во время мультиплексирования аудио и видео треки объединяются в один аудио-видео поток. Аудио и видео поток будет существовать вместе с синхронизирующей и навигационной информацией, которая будет добавлена, для того чтобы проигрыватель мог осуществить перемотку вперед-назад без рассинхронизации аудио и видео.
PCM
Pulse Code Modulation - импульсно-кодовая модуляция, это наиболее простое двоичное представление цифрового звука. Звуковой сигнал преобразуется в выборки (семплы), соответствующие частоте сигнала. Затем каждая выборка (семпл) записывается в поток, без применения каких либо методов сильного сжатия.
Quarter Pel - четвертные пиксели. Как уже было сказано при описании B-кадров, количество передаваемых данных уменьшается, когда вместо полного кадра передается отличие между двумя кадрами (ошибка предсказания). Разница между кадрами в последовательности кадров обычно передается на основе вычислений движения макроблоков (16х16 пиксель) или блоков (8х8 пиксель). Например, в первом кадре часть изображения расположена в координатах (1,1), а в следующем кадре оно может переместиться в координаты (1,2). Вы можете понимать, что изображению в одном блоке, вероятно, потребуется большая точность, чем предоставляется ограниченной возможностью блочного перемещения, ограниченной только целым значением пикселя (1,1). Поэтому DivX повысил предыдущую точность, используя половины пикселов (1.5, 1.5), чтобы обеспечить возможность использования четвертей пикселов в кодеке (1.25, 1.75). Четвертные пиксели выполняют определенную фильтрацию каждого блока, чтобы создать виртуальный блок, который описывает появление оригинального блока при перемещении на ? пикселя.
Telecine. Это процесс приведения источника с частотой 24 кадра в секунду к частоте 29,97 кадров/сек. или к частоте 29,97х2 interlaced fields per second - чередования полей в секунду.

страницы: 1 2 3 4 5 6 7 8 9 10