Про сжатие видео — Введение / Habr
Идут дни, требования к качеству видео постоянно растут. При этом ширина каналов и емкость носителей не могла бы поспевать за этим ростом, если бы не совершенствовались алгоритмы сжатия видео.Далее пойдет речь именно о некоторых базовых понятиях сжатия видео. Некоторые из них несколько устарели или описаны слишком просто, но при этом дают минимальное представление о том, как все работает.
Поиск векторов движения для компенсации движения (-: Об этом далее…
Характеристики видеопотока
Практически все знают, что любое видео – это множество статичных картинок, которые сменят друг друга во времени. Далее это упорядоченное множество мы будем называть видеопотоком. Они бывают разными, поэтому здесь крайне полезно провести небольшую классификацию:
- Формат пикселя. Пиксель не дает нам никакой информации кроме его цвета. Однако восприятие цвета сильно субъективно и были приложены большие усилия для создания систем цветопредставления и цветопередачи, которые были бы приемлемы для большинства людей. Так цвет, видимый нами в реальном мире, является достаточно сложным по спектру частот света, что передать его в цифровом виде крайне сложно, а отобразить еще сложней. Однако было замечено, что все тремя точками в спектре можно достаточно точно приблизить отображаемый цвет к настоящему в метрике восприятия цвета обычным человеком. Эти три точки: красный, зеленый и синий. То есть их линейной комбинацией мы можем покрыть большую часть видимого спектра цветов. Поэтому самый простой способ представления пикселя:
- Размер кадра. Мы уже взяли и закодировали все пиксели видеопотока и получили огромный массив данных, но он неудобен в работе. Поначалу все очень просто, кадр характеризуется: шириной, высотой, размерами видимой части и форматом (об этом чуть позже). Тут наверняка многим покажутся знакомыми цифры: 640×480, 720×480, 720×576, 1280×720, 1920×1080. Почему? Да потому что, они фигурируют в разных стандартах, например разрешение 720×576 имеет большая часть европейских DVD. Нет, конечно, можно сделать видео размером 417×503, но не думаю, что в этом будет что-то хорошее.
- Формат кадра. Даже зная размеры кадра, мы не можем представить массив пикселей в более удобной форме, не имея информации о способе “упаковки” кадра. В простейшем случае ничего хитрого: берем строку пикселей и выписываем подряд биты каждого закодированного пикселя и так строчку за строчкой. То есть выписываем столько строк, сколько у нас высота по столько пикселей, сколько у нас ширина и все подряд, по порядку. Такая развертка называется
- Частота кадров. Одни из стандартных значений: 23.976, 24, 25 и 29.97 кадров в секунду. Например, 25 к/с используется в европейском телевидении, 29.97 в американском, а с частотой 24 к/с снимают на кинопленку. Но откуда взялись “странные” 23.976 и 29.97? Открою секрет: 23.976 = 24/1.001, а 29.97 = 30/1.001, то есть в стандарт американского телевещания NTSC заложен делитель 1.001. Соответственно при показе киноленты произойдет совсем небольшое замедление, которое не будет заметно зрителю, но если это музыкальный концерт, то скорость показа настолько критична, что лучше изредка пропускать кадры и опять же зритель ничего не заметит. Хотя я немного обманул, по американскому телевизору никогда не показывается “24” кадра в секунду, а показывается “30” чересстрочных кадров (и того 59.94 полукадра в секунду, что соответствует частоте их электросети), но они получаются “методом спуска” ( 3:2 pulldown). Суть метода состоит в том, что у нас есть 2 полных кадра и 5 полукадров, и мы информацией из первого кадра заполним первые 3 полукадра, а из второго оставшиеся 2. То есть последовательность полукадров такова: [1 top, 1 bottom], [1 top, 2 bottom], [2 top, 3 bottom], [3 top, 3 bottom], [4 top, 4 bottom] и т.д. Где top – верхние строки (поля, fields
- Глобальные характеристики. Все вышерассмотренное относится к локальным свойствам, то есть тех, которые отражаются во время воспроизведения. Но длительность видеопотока по времени, объем данных, наличие дополнительной информации, зависимости и т.п. Например: видеопоток может содержать в себе один поток, отвечающий левому глазу, а другой поток некоторым образом будет хранить информацию об отличии потока правого глаза от левого. Так можно передавать стерео видео или всенародно известное “3D”.
Почему видео нужно сжимать?
Если мы будем передавать видео несжатым, то ни на что серьезное нам не хватит ни каналов связи, ни места для хранения данных. Пусть мы имеем HD поток с характеристиками:
1920x1080p, 24 к/с, RGB24 и подсчитаем “стоимость” такого потока.
1920*1080*24*24 = 1139 Мегабит/с, а если захотим записать 90 минутный фильм, то потребуется 90*60*1139 = 750 Гигабайт! Круто? Это при том, что видео фильма изумительного качества с тем же 1920x1080p на BluRay будет занимать 20 Гб, то есть разница почти в 40 раз!
Очевидно, что видео требует сжатия, особенно учитывая то, что можно сократить размер в 40 и более раз, оставив при этом зрителя в восторге.
На чем можно сэкономить?
- Кодирование цвета. Наверняка многие знают, что когда-то давно телевидение было черно-белым, но сегодняшнее телевидение целиком в цвете. Но черно-белый телевизор по-прежнему может показывать передачи. Дело в том, что в телесигнале яркость кодируется отдельно от цветных составляющих и представляется в формате YUV (подробнее на википедии). Где Y компонента – это яркость, а U и V – цветовые компоненты и все это вычисляется по “волшебной” формуле:
Y = 0.299 * R + 0.587 * G + 0.114 * B
U = -0.14713 * R - 0.28886 * G + 0.436 * B
V = 0.615 * R - 0.51499 * G - 0.10001 * B
Как видно, преобразование линейное и невырожденное. Следовательно, мы можем с легкостью получать обратно значения R, G и B. Допустим под хранение Y, U и V мы выделим по 8 бит, тогда было 24 бита на пиксель и так и осталось. Никакой экономии. Но человеческий глаз чувствителен к яркости, а вот к цвету он не сильно притязателен. Да и почти на всех изображениях цвета сменяют друг друга не так часто. Если мы условно разделим изображение на слои Y, U и V и яркостный слой оставим без изменений, а слои U и V в два раза сократим по высоте и в два раза по ширине и того в четыре раза. Если раньше на каждый пиксель тратили 24 бита, то теперь тратим 8*4+8+8=48 бит на 4 пикселя, то есть, грубо говоря, 12 бит на пиксель (именно поэтому данный формат кодирования называется YV12). За счет цветового прореживания мы сжали поток в два раза без особых потерь. Например, JPEG всегда выполняет подобное преобразование, но по сравнению с другими возможными артефактами прореживание цвета не несет никакого вреда. - Избыточность изображения. Здесь особо останавливаться не буду, поскольку здесь нет никаких отличий от алгоритмов сжатия изображений. Тот же JPEG сжимает изображение за счет его локальной избыточности методами дискретного косинусного преобразования (DCT) и квантования, о чем опять же можно прочитать на википедии. Обозначу лишь то, что встроенный в кодек алгоритм сжатия статичных изображений должен хорошо сжимать даже отдаленно напоминающее реальные изображения, скоро узнаете зачем.
- Межкадровая разность. Наверняка, любой, посмотрев любое видео, заметит, что изображения не меняются резко, а соседние кадры достаточно похожи. Конечно, резкие смены бывают, но они обычно происходят при смене сцен. И тут возникает проблема: как компьютер должен представлять все то многообразие возможных преобразований изображения? На помощь приходит алгоритм
Разница до компенсации движения
Разница между оригиналом и скомпенсированным кадрамиЗдесь четко видно, что исходная межкадровая разность значительно больше, чем разность между исходным и скомпенсированным кадрами. С учетом объемов информации при сжатии изображений мы можем сохранить вектора движения почти бесплатно. Сделали это и потом сжали изображение скомпенсированной межкадровой разности алгоритмом сжатия статических изображений. А так как на второй картинке откровенное месиво, то алгоритм сжатия изображений должен корректно с такими вещами работать. В силу большой избыточности таких изображений они сжимают очень сильно. Но если кодек сжимает их слишком сильно, то и возникает эффект блочности. Старые алгоритмы никак не учитывают изменения объектов по яркости и именно поэтому по телевизору видно блочность президента при вспышках фотокамер.
- Организация последовательностей кадров. В первую очередь кодек должен быть чувствителен к смене сцен. Определить это достаточно просто, так как компенсация движения отработает в этом случае безобразно. Кадр начала новой сцены логично сохранить “как есть”, поскольку он ни на что ранее встречавшееся не похож. Такие кадры называют опорными (I-frame). А далее идут кадры, к которым применялась компенсация движения, то есть они зависят от опорного кадра и друг от друга. Это могут быть P-frame или B-frame. Первые могут опираться только на предыдущие кадры, а последние могут на левого и правого соседа. I-кадр и все его зависимые образуют
- Избыточность выходных данных. Даже после выполнения всех сжимающих процедур поток коэффициентов имеет избыточность. Далее может применяться разные методы сжатия без потерь. В кодеке H.264, например, есть два варианта CABAC и CAVLC, реализующие арифметическое сжатие с мощной вероятностной моделью и реализующие Хаффмана с более простой моделью. ПО непонятным причинам компания Apple предпочитает последний вариант, хотя на хороших декодерах разница в быстродействии незначительна.
Вместо заключения
Я постарался рассказать некоторые базовые понятия, не сильно нагружая техническими подробностями. Далее я расскажу о структуре кодеков, контейнеров и т.д. Для тех, кто серьезно интересуется сжатием и обработкой видеоданных существует сайт compression.ru, поддерживающийся родной лабораторией компьютерной графики и мультимедиа ВМК МГУ.
Продолжение следует…
Википедия — свободная энциклопедия
Избранная статья
Американская экспедиция на К2 1953 года (англ. 1953 American Karakoram expedition) — американская экспедиция на вершину Чогори под руководством доктора Чарльза Хьюстона, состоявшаяся летом 1953 года и ставившая своей целью первое восхождение на второй по высоте восьмитысячник планеты. Это была пятая по счёту попытка восхождения на К2 и третья со стороны американских альпинистов.
Экспедиция вылетела из Нью-Йорка в Карачи 25 мая 1953 года и после почти месячного перехода к Базовому лагерю у подножия К2 начала свою работу на горе. За чуть менее чем полтора месяца осады ребра Абруццкого (Абруцци) были организованы восемь промежуточных лагерей. В последнем из них (на высоте 7770 м) 2 августа собрались все участники экспедиции, готовясь к финальному рывку. Однако в ночь на 3 августа на гору обрушился шторм, который не утихал последующие две недели. На пятые сутки пережидания непогоды неожиданно тяжело заболел один из сильнейших участников экспедиции Арт Гилки, которому требовалась немедленная эвакуация вниз, но альпинисты смогли её начать лишь 10 августа. Вечером того же дня Арт Гилки погиб в результате схода снежной лавины, но, даже не имея «на руках» больного, все альпинисты смогли спуститься в Базовый лагерь только 15 августа, претерпев все возможные испытания.
Хотя экспедиция не достигла своей главной цели, в альпинистских кругах на десятилетия вперёд она стала эталоном альпинистской взаимовыручки и, по словам Райнхольда Месснера, «самой потрясающей неудачей, которую только можно себе представить».
Хорошая статья
Солове́цкий ка́мень в Санкт-Петербурге — памятник жертвам политических репрессий в СССР и борцам за свободу. Он находится на Петроградской стороне в историческом центре города, на его старейшей площади — Троицкой. Этот сквер расположен рядом с местами, непосредственно связанными с политическими репрессиями в СССР — Домом политкаторжан, тюрьмой и некрополем Петропавловской крепости, Большим домом.
Памятник представляет собой гранитную глыбу, привезённую с территории бывшего Соловецкого лагеря, считающегося символом ГУЛАГа и советского государственного террора в целом. Он был установлен по инициативе и силами бывших политических заключённых и Санкт-Петербургской организации «Мемориал». Авторами памятника выступили художники Юлий Рыбаков и Евгений Ухналёв, которые в советское время сами пережили политическое заключение. Мемориал призван увековечить память не только о жертвах репрессивной системы и о борцах с ней, но в широком смысле он символизирует ценность свободы, прав человека и человеческого достоинства. Соловецкий камень является центральным местом мероприятий, посвящённых памяти жертв государственного террора в СССР, а также других правозащитных акций.
Изображение дня
«Дрозд-отшельник» — один из геоглифов Наски
Википедия — свободная энциклопедия
Избранная статья
Американская экспедиция на К2 1953 года (англ. 1953 American Karakoram expedition) — американская экспедиция на вершину Чогори под руководством доктора Чарльза Хьюстона, состоявшаяся летом 1953 года и ставившая своей целью первое восхождение на второй по высоте восьмитысячник планеты. Это была пятая по счёту попытка восхождения на К2 и третья со стороны американских альпинистов.
Экспедиция вылетела из Нью-Йорка в Карачи 25 мая 1953 года и после почти месячного перехода к Базовому лагерю у подножия К2 начала свою работу на горе. За чуть менее чем полтора месяца осады ребра Абруццкого (Абруцци) были организованы восемь промежуточных лагерей. В последнем из них (на высоте 7770 м) 2 августа собрались все участники экспедиции, готовясь к финальному рывку. Однако в ночь на 3 августа на гору обрушился шторм, который не утихал последующие две недели. На пятые сутки пережидания непогоды неожиданно тяжело заболел один из сильнейших участников экспедиции Арт Гилки, которому требовалась немедленная эвакуация вниз, но альпинисты смогли её начать лишь 10 августа. Вечером того же дня Арт Гилки погиб в результате схода снежной лавины, но, даже не имея «на руках» больного, все альпинисты смогли спуститься в Базовый лагерь только 15 августа, претерпев все возможные испытания.
Хотя экспедиция не достигла своей главной цели, в альпинистских кругах на десятилетия вперёд она стала эталоном альпинистской взаимовыручки и, по словам Райнхольда Месснера, «самой потрясающей неудачей, которую только можно себе представить».
Хорошая статья
Солове́цкий ка́мень в Санкт-Петербурге — памятник жертвам политических репрессий в СССР и борцам за свободу. Он находится на Петроградской стороне в историческом центре города, на его старейшей площади — Троицкой. Этот сквер расположен рядом с местами, непосредственно связанными с политическими репрессиями в СССР — Домом политкаторжан, тюрьмой и некрополем Петропавловской крепости, Большим домом.
Памятник представляет собой гранитную глыбу, привезённую с территории бывшего Соловецкого лагеря, считающегося символом ГУЛАГа и советского государственного террора в целом. Он был установлен по инициативе и силами бывших политических заключённых и Санкт-Петербургской организации «Мемориал». Авторами памятника выступили художники Юлий Рыбаков и Евгений Ухналёв, которые в советское время сами пережили политическое заключение. Мемориал призван увековечить память не только о жертвах репрессивной системы и о борцах с ней, но в широком смысле он символизирует ценность свободы, прав человека и человеческого достоинства. Соловецкий камень является центральным местом мероприятий, посвящённых памяти жертв государственного террора в СССР, а также других правозащитных акций.
Изображение дня
«Дрозд-отшельник» — один из геоглифов Наски
Характеристики видео для ютуб — SocialnieSety.Ru
Чтобы делать качественный видеоконтент на ютуб, нужно разобраться со всеми характеристиками, которые рекомендует видеохостинг. О них и пойдет разговор в этом посте.
Характеристики видео для ютубО параметрах, которых вы будете придерживаться для своего видеоконтента на ютуб, я рекомендую подумать заранее. Начните с проверки возможностей вашей съемочной аппаратуры, программы для монтажа и компьютера, сравните их с рекомендациями для видео от YouTube и подберите для себя оптимальные характеристики. Это существенно упростит вашу работу, особенно на стадии монтирования.
Разрешение видео и соотношение сторон
Проигрыватель ютуб целиком вмещает видео с соотношением сторон 16:9. Если видео будет иметь другое соотношение, то к записи будут добавлены черные полосы, по горизонтальные (сверху и снизу) или вертикальные (слева и справа) соответственно. Но, смотреть видеоролики, занимающие всю область видеоплеера, намного приятнее, чем записи, где «добрая» часть экрана окрашена в черный цвет. Поэтому советую настроить свои камеры на съемку в следующих разрешениях с соотношением сторон 16:9:
- 2160p: 3840×2160
- 1440p: 2560×1440
- 1080p: 1920×1080
- 720p: 1280×720
- 480p: 854×480
- 360p: 640×360
- 240p: 426×240
Форматы видеофайлов для ютуб
Чтобы избежать проблем с загрузкой ролика на свой канал, снимайте и обрабатывайте видео только в тех форматах, которые доступны для загрузки на YouTube. Ютуб позволяет грузить контент на свой канал в следующих форматах:
- MOV
- MPEG4
- MP4
- AVI
- WMV
- MPEGPS
- FLV
- 3GPP
- WebM
Если ваша камера не поддерживает ниодин из указанных форматов, то придется подыскать программу, чтобы перевести видео в рекомендуемый. В любом случае, загрузить видео в другом формате вы не сможете, или сможете отхватив при этом геморой.
Длительность видео и размер файла
YouTube позволяет загружать на свой канал видеозаписи продолжительностью до 12 часов. Но изначально пользователи могут загружать записи длиной до 15 минут. Чтобы снять этот лимит, вам понадобится подтвердить аккаунт. Сделать это можно на странице подтверждения аккаунта YouTube.
Что касается размера файла видеозаписи, то разрешено загружать файлы до 128 ГБ. Если ваш файл весит больше, вы можете воспользоваться сжатием видеофайла в видеоредакторе без существенной потери качества. Для этого используйте видеокодек H.264.
Поделиться статьей:
Сжатие видео — Википедия
Сжатие видео (англ. Video compression) — технология цифровой компрессии телевизионного сигнала, позволяющая сократить количество данных, используемых для представления видеопотока. Сжатие видео позволяет эффективно уменьшать поток, необходимый для передачи видео по каналам радиовещания, уменьшать пространство, необходимое для хранения данных на носителе. Недостатки: при использовании сжатия с потерями появляются характерные, иногда отчётливо видные артефакты — например, блочность (разбиение изображения на блоки 8×8 пикселей), замыливание (потеря мелких деталей изображения) и т. д. Существуют и способы сжатия видео без потерь, но на сегодняшний день они уменьшают данные недостаточно.
Видео по сути своей является трёхмерным массивом цветных пикселей. Два измерения означают вертикальное и горизонтальное разрешение кадра, а третье измерение — время. Кадр — массив всех пикселей, видимых камерой в данный момент времени, или просто изображение. В видео возможны также так называемые полукадры (см.: чересстрочная развёртка).
Сжатие было бы невозможно, если бы каждый кадр был уникален и расположение пикселей было полностью случайным, но это не так. Поэтому можно сжимать, во-первых, саму картинку — например, фотография голубого неба без солнца фактически сводится к описанию граничных точек и градиента заливки. Во-вторых, можно сжимать похожие соседние кадры. В конечном счёте, алгоритмы сжатия картинок и видео схожи, если рассматривать видео как трёхмерное изображение со временем как третьей координатой.
Помимо сжатия с потерями видео также можно сжимать и без потерь. Это означает, что при декомпрессии результат будет в точности (бит к биту) соответствовать оригиналу. Однако при сжатии без потерь невозможно достигнуть высоких коэффициентов сжатия на реальном (не искусственном) видео. По этой причине практически всё широко используемое видео является сжатым с потерями (в том числе на потребительских цифровых видеодисках, видеохостингах, в спутниковом вещании). На веб-сайтах для маленьких роликов без звука иногда используются простые форматы GIF и APNG.
Сжатие видео и технология компенсации движения[править | править код]
Одна из наиболее мощных технологий, позволяющая повысить степень сжатия, — компенсация движения. При любой современной системе сжатия видео последующие кадры в потоке используют похожесть областей в предыдущих кадрах для увеличения степени сжатия. Однако, из-за движения каких-либо объектов в кадре (или самой камеры) использование подобия соседних кадров было неполным. Технология компенсации движения позволяет находить похожие участки, даже если они сдвинуты относительно предыдущего кадра.
Аналоговые принципы сжатия видеосигнала, основанные на особенностях зрения человека, известны с момента появления телевидения как такового, а вершин своего развития достигли в совместимых системах цветного телевидения NTSC, SECAM и, особенно, PAL. Именно благодаря сжатию данных удавалось передавать цветное изображение с разложением в 625 строк в полосе частот, изначально определенной для стандарта разложения 441 строка. В аналоговых системах для этого использовалось свойство линейчатости спектра телевизионного сигнала и снижение яркостной и цветовой чувствительности глаза в зоне мелких деталей. Таким образом, можно было передавать максимум информации в низкочастотной части спектра телевизионного сигнала (крупные детали изображения), но без особых потерь качества изображения срезать высокочастотную часть спектра, оставив в нем только первые гармоники сигналов, несущие информацию о мелких деталях. Информация о цветовой составляющей подвергалась еще большему ограничению по частоте и вдобавок ее спектр смещался таким образом, чтобы гармоники сигналов строчной частоты, несущих информацию о цвете, оказывались в промежутках между гармониками сигнала яркости. Цифровые же методы сжатия видеосигнала появились практически одновременно с появление АЦП, способных работать на видеочастоте и процессоров, способных выполнять арифметические операции примерно на трехкратной видеочастоте. Такие устройства начали выпускаться в начале 1980-х годов.
В таблице ниже показана неполная история развития международных стандартов видеосжатия
Год | Стандарт | Издатель | Применение |
---|---|---|---|
1984 | H.120 | МСЭ-Т | |
1988 | H.261 | МСЭ-Т | видеоконференция, видеосвязь |
1993 | MPEG-1 Part 2 | ИСО, МЭК | Video CD |
1995 | H.262/MPEG-2 Part 2 | ИСО, МЭК, МСЭ-Т | DVD Video, Blu-ray, Digital Video Broadcasting, SVCD |
1996 | H.263 | МСЭ-Т | видеоконференция, видеосвязь, видео в мобильных телефонах (3GP) |
1999 | MPEG-4 Part 2 | ИСО, МЭК | видео в Интернете (DivX, Xvid …) |
2003 | H.264/MPEG-4 AVC | Sony, Panasonic, Samsung, ИСО, МЭК, МСЭ-Т | Blu-ray, HD DVD, Digital Video Broadcasting, Apple TV |
2009 | VC-2 (Dirac) | OИКиТ | видео в Интернете, HDTV вещание, UHDTV |
2013 | H.265 | ИСО, МЭК, МСЭ-Т |
На конец 2011 года практически все алгоритмы сжатия видео (например, стандарты, принятые ITU-T или ISO) используют дискретное косинусное преобразование (DCT) или его модификации для устранения пространственной избыточности. Другие методы, такие как фрактальное сжатие и дискретное вейвлет-преобразование, также были объектами исследований, но сейчас обычно используются только для компрессии неподвижных изображений.
Использование большинства методов сжатия (таких, как дискретное косинусное преобразование и вейвлет-преобразование) влечёт также использование процесса квантования. Квантование может быть как скалярным, так и векторным, тем не менее, большинство схем сжатия на практике используют скалярное квантование вследствие его простоты.
Телевидение[править | править код]
Современное цифровое телевещание стало доступным именно благодаря видеокомпрессии. Телевизионные станции могут транслировать не только видео высокой четкости (HDTV), но и несколько телеканалов в одном физическом телеканале (6 МГц).
Хотя большинство видеоконтента сегодня транслируется с использованием стандарта сжатия видео MPEG-2, тем не менее новые и более эффективные стандарты сжатия видео уже используются в телевещании — например, H.264 и VC-1.
Форматы видеофайлов | Обзор расширений видео
Автор статьи: Алёна Давыдова 18 июня 2019Форматы видеофайлов определяют структуру видео, т.е. отражают, как именно хранится файл на каком-либо носителе информации. В настоящее время существует огромное количество разнообразных форматов видеофайлов, и разобраться в их особенностях иногда бывает довольно сложно. Кроме этого, пользователи часто путают понятия «кодек», «контейнер», «стандарт видео» и подменяют одно другим.
В настоящей статье мы постараемся разобраться, какие бывают форматы видео, каковы их отличия и в какой формат конвертировать видео лучше всего.
Кодеки видео
Для сжатия цифровых мультимедиа файлов используется специальные программы — кодеки. Это своеобразная формула, которая определяет, каким образом можно «упаковать» видео контент. Кодеки выполняют и обратную операцию раскодирования, в этом случае их называют декодерами.
Наиболее популярными видео кодеками являются следующие: DivX, XviD, H.261, H.263, H.264 и др. Любая операционная система изначально содержит некий набор кодеков, но, как правило, их недостаточно для воспроизведения определенных форматов видеофайлов.
Контейнеры видео
Кодеки преобразуют данные в особый файл, который называют контейнером. Контейнер — это специальная оболочка, в которой хранится зашифрованная с помощью кодеков информация. По сути, медиаконтейнеры — это и есть форматы видеофайлов, которые содержат данные о своей внутренней структуре. Первый медиаконтейнер был создан в 1985 году.
В контейнере может храниться информация разного качества, в частности, изображения, аудио, видео и субтитры. Разные виды контейнеров определяют объем и качество информации, которая может быть в нем сохранена, но при этом не влияют на способы кодирования данных.
Преобразование форматов
На практике возникает огромное количество случаев, когда необходимо преобразовать ролики из одного формата в другой. Основная проблема заключается в том, что различные устройства накладывают особые требования к качеству загружаемого видео, в частности к его формату. В этой ситуации на помощь приходят специальные программы — конвертеры, которые позволяют переделать клипы в нужный формат. Например, удобный видео конвертер на русском языке — ВидеоМАСТЕР.
Далее рассмотрим наиболее известные форматы видеофайлов.
AVI
Audio-Video Interleaved — один из самых распространенных медиаконтейнеров для операционных система Windows. Этот формат может содержать в себе информацию четырех типов: видео, аудио, текст и midi. В этот контейнер может входить видео различных форматов от MPEG-1 до MPEG-4.
AVI имеет большое количество разновидностей по внутренней структуре и может воспроизводиться на смартфонах, коммуникаторах и других устройствах. Медиаконтейнер AVI не накладывает никаких ограничений на тип используемого кодека.
WMV
Windows Media Video — цифровой видео формат, созданный и контролируемый компанией Microsoft. WMV файлы могут содержать аудио- и видео данные, упакованные с помощью кодеков Windows Media Audio (WMA) и Windows Media Video (WMV).
MOV и QT
QuickTime File Format — этот формат разработан компанией Apple для QuickTime медиа плеера. Для воспроизведения подобных файлов необходимо иметь QuickTime плеер или плееры с уже установленными кодеками MOV. Формат может содержать видео, анимацию, графику, 3D. Данный формат поддерживает любые аудио- и видеокодеки.
ASF
Advanced Streaming Format — потоковый формат от Microsoft. Основан на MPEG-4 и сипользуется для передачи видео с низким и средним битрейтом в Интернет. ASF представляет собой мультимедиа контейнер, поддерживающий практически все видеокодеки.
MPEG
Moving Pictures Experts Group — видеофайлы, в которых содержится видео, закодированное с помощью стандартов Mpeg1, Mpeg2, Mpeg3, Mpeg4. Технология MPEG использует поточное сжатие видео, при котором обрабатывается не каждый кадр по отдельности, а анализируются изменения видеофрагментов и удаляется избыточная информация. MPEG-1 — представляет собой формат для хранения аудио и видео данных на мультимедиа носителях.
Формат MPEG-4 обычно используется для обмена и передачи видео-файлов в Интернете, видеотелефонии, электронных информационных изданиях и т.п. В этом формате используется раздельное сжатие для аудио и видео дорожек. MPEG-4 рассчитан на очень низкие потоки данных.
Заключение
Мы перечислили лишь самые основные форматы видеофайлов, которые используются на практике. При выборе того или иного формата, исходите из того, где этот файл будет воспроизводится, а для переведения видео из одного формата в другой используйте видео конвертеры.