Что такое форматы файлов и расширения. Как менять и чем открыть
Жесткий диск персонального компьютера наполнен различными данными. Поэтому следует разобраться, какие бывают форматы файлов, и для каких целей они используются. Знание основных расширений существенно облегчает поиск информации на ПК, а также процесс очистки его от ненужной информации. В зависимости от того, какое файл имеет расширение, его можно открыть и отредактировать, либо стандартными средствами ОС Windows, либо сторонними программными продуктами, которые потребуется сперва отыскать и установить. Расширение файла можно сделать видимым, либо скрыть.
Отметим, что расширение файла и формат – это понятия близкие, но не взаимозаменяемые. Их не следует путать. Файлы одинакового формата могут иметь различные расширения.
Изучая форматы файлов, операционная система распознает их содержимое, а также подбирает соответствующее приложение, чтобы обеспечить взаимодействие с выбранным материалом. Существует множество форматов: графические, офисные, установочные, архивные, музыкальные, системные, служебные и другие. Расширение в имени файла находится по правую сторону от точки – это всего несколько латинских букв. Операционная система благодаря этим данным, определяет программу, которой будет открыт выбранный файл.
Немного практики. Один формат — разные расширения
Описанную выше теорию подкрепим простым примером. Часто на практике мы встречаемся с файлами, которые содержат в себе различную документацию, рассказы, схемы и списки. В данном случае, речь идет о текстовом формате, он взаимодействует с различными офисными программами, поэтому его также можно назвать офисным. При этом, мы сами можем создать документы, используя редактор Word либо стандартное приложение «Блокнот». Полученный в результате файл будет обладать различным расширением. Таким образом, мы на практике доказали, что расширение файлов в Windows и форматы – это разные понятия. Не следует их путать в будущем.
Как поменять расширение файла и настройка его видимости
Если вы знаете, какое расширение имеют файлы, при необходимости вы можете его сменить. Иногда недостаточно внести правки в имя файла для такого преобразования, а требуются особые программы – конвертеры.
К примеру, вы решили разместить в Интернете видеоролик, однако он имеет формат .avi и отличается большим объемом. Для сжатия можно применить конвертер. В итоге, мы получим куда более меньший файл, расширение которого изменится, например, на .3gp.
Если ваша операционная система настроена таким образом, что возле каждого файла видно расширение, его можно скрыть. Для этого в настройках системы существует специальный раздел «Параметры папок».
Здесь нам необходимо обратить внимание на вторую вкладку. В ней содержаться различные дополнительные параметры. Среди них есть и функция, которая позволяет выбрать скрывать или отображать расширения файлов в их именах.
Коротко о типах расширений
Список из 10 расширений файлов, которые используются чаще всего выглядит следующим образом:
- exe
- doc
- txt
- bmp
- jpg
- gif
- mp3
- avi
- zip
- rar
Некоторые из них мы обсудим отдельно.
Открываем файл с определенным расширением нужным приложением
Файлы различных форматов обладают расширениями, которые служат указателями для приложений. Но не все так просто, поскольку одинаковое расширение может быть открыто различными программами. К примеру, пользователь может одновременно установить на компьютер целый ряд видеоплееров. AVI – это наиболее распространенное расширение файлов видео, поэтому его откроет любое из этих приложений. Но если просто запустить видеоролик, он будет открыт той программой, которая указана «по умолчанию». Этот параметр можно настроить в ручном режиме. Для этого нажимаем на необходимый нам файл правой кнопкой мыши. В возникшем меню используем пункт «Свойства». Открывается окно, в котором нас интересует строка «Приложение». Именно здесь можно узнать программу, которая взаимодействует с данным типом файлов. При необходимости можно использовать функцию «Изменить», и подобрать более подходящее приложение. Кроме предложенных системой вариантов, программу можно указать самостоятельно, посредством кнопки «Обзор». Если файл отказывается взаимодействовать с выбранным приложением, снова повторяем описанную процедуру и указываем более подходящую программу.
Смена приложений никак не влияет на расширение файла.
Графические форматы и расширения файлов
Существуют следующие форматы растровых файлов: JPEG, PCX, PNG, BMP, CALS, TIFF.
JPEG
Один из наиболее распространенных в настоящее время графических форматов, в котором обычно хранятся фотографии и прочие растровые изображения большого объема.
Формат JPEG может также иметь такие расширения:
- JPE,
- jpg,
- jfif.
Благодаря алгоритму JPEG можно проводить сжатие изображений с потерями качественных показателей, либо с сохранением изначальных данных. Файлы указанного формата можно открыть одной из следующих программ:
- Фотографии Windows
- Roxio Creator
- XnView
- IrfanView
- GIMP
- Google Picasa
- Paint.NET
- FastStone Image Viewer
- Adobe InDesign
- ACDSee
PCX
Это растровый формат, который представляет пользователю графические данные и был создан компанией ZSoft Corporation. Перед нами по сути аналог BMP. Его активно используют приложения для сканирования и работы с факсами. Многостраничным факсовым документам присваивается расширение DCX. Данный формат является аппаратно-зависимым. Используемый данным решением алгоритм сжатия отличается высокой скоростью обработки и небольшим объемом полученных данных, однако он демонстрирует малую эффективность при обработке графических данных с большим количеством деталей, например, фотографий. Сжатие без потерь не предусмотрено. Открыть PCX можно одним из следующих приложений:
- ZSoft PC Paintbrush
- Adobe Photoshop
- Microsoft Windows Picture and Fax Viewer
- Adobe Photoshop Elements
- GIMP
- Adobe Premiere
- Adobe InDesign
- Adobe Illustrator
- Nuance OmniPage
- Inkscape
PNG
Это растровый графический формат, который чаще-всего требует больше пространства на диске по сравнению с jpeg, однако у него есть ряд сильных сторон. К примеру, файлы такого формата хранят данные о прозрачности фона. Данное решение имеет открытый исходный код. PNG наиболее активно применяется в сети Интернет. С ним взаимодействует множество графических и видео редакторов. Данные в этом формате особо востребованы у видеомонтажёров и дизайнеров. Эти специалисты передают в PNG исходные материалы, после чего начинают их обработку. Открыть файлы такого типа можно одним из следующих приложений:
- Фотографии Windows
- Inkscape
- Google Picasa
- Xara Photo&Graphic Designer
- FastStone Image Viewer
- Adobe InDesign
- Adobe Photoshop
- Adobe Acrobat
- XnView
- Paint.NET
BMP
Формат несжатой растровой графики. Заголовок такого файла содержит данные об изображении — количество цветов, глубину пикселей, высоту и ширину рисунка, размер файла. Обычно после заголовка следует палитра. Далее расположена информация, идентифицирующая цвет каждого пикселя и его положение. Файлы такого типа поддерживают несколько вариантов глубины цвета. Открыть помогут программы:
- Фотографии Windows
- Roxio Creator NXT Pro 5
- JPEGView
- Microsoft Paint
- IrfanView
- Adobe Photoshop CC
- GIMP
- Adobe Illustrator CC
- Adobe Photoshop Elements 14
- Nuance OmniPage 18
CALS
Это файл календаря. Его можно открыть одним из следующих приложений:
- American Greetings CreateaCard
- Broderbund Calendar Creator Deluxe 12
- Broderbund PrintMaster v7 Platinum +
- Broderbund The Print Shop
TIFF
Этот формат рассчитан на хранение растровых графических данных. Он применяется для получения текстовой информации со сканера, после чего можно эффективно провести ее распознание. Данное решение активно применяется в полиграфической сфере, а также для пересылки данных по электронной почте. Открыть файл TIFF можно одним из следующих приложений:
- Фотографии Windows
- Artweaver
- CorelDRAW Graphics Suite
- PhotoOnWeb
- Adobe Photoshop
Также следует обсудить векторные форматы файлов графики: DXF, DWG, HP-GL.
DXF
Это векторный формат, который обладает открытым исходным кодом. Посредством данного решения производится обмен информацией между программами САПР. Его создателем является компания Autodesk. Изначально он был задействован для чертежей, изготовленных в приложении AutoCAD. Файлы DXF можно открыть одной из следующих программ:
- SolidWorks
- Inkscape
- Rhinoceros
- IMSI TurboCAD
- IrfanView
DWG
Это графический файл, который чаще всего используется для создание чертежей в приложении AutoCAD. Помимо указанной программы взаимодействие с ним можно обеспечить посредством следующих решений:
- Free DWG Viewer
- ABViewer
- DWG TrueView
- Corel Draw
- Компас
HP-GL
это формат файла, который содержит в себе информацию о настройках принтера Hewlett-Packard. Материалы такого типа можно открыть одним из следующих приложений:
- ideaMK HPGL Viewer
- Corel PaintShop Pro 2018
- CorelDRAW Graphics Suite 2017
- XnViewMP
- ArtSoft Mach
Полиграфия — pdf
Файл формата «ПДФ» — это документ, который создается при помощи приложения Adobe Acrobat. Широкое распространение данного решения обусловлено тем, что с ним могут взаимодействовать почти любые операционные системы и устройства. Благодаря этому очень легко организовать обмен документацией в указанном формате. Формат PDF можно открыть одним из следующих приложений:
- Adobe Reader
- Sumatra PDF
- IrfanView
- Evince
- LibreOffice
Интернет
Далее приведем виды форматов файлов, которые обычно присваиваются веб-страницам – это php, htm и html. Соответствующие расширения также могут иметь скрипты. Взаимодействовать с ними можно различными приложениями, среди них следующие:
- Google Chrome
- Notepad++
- MPSoftware phpDesigner
- Eclipse PHP Development Tools
- Adobe Dreamweaver CC
Архивные форматы файлов
Для сжатия информации используются следующие форматы: jar, gz, gzip, tar, 7z, zip, rar.
JAR
Это формат, который является архивом Java. По сути, это привычный ZIP-пакет, который имеет часть программы, написанной на языке Java. Файл JAR может быть исполняемым, если в нем содержится компонент MANIFEST.MF, он располагается в папке META-INF и содержит информацию о классе программы. JAR можно открыть одним из следующих приложений:
- PowerArchiver
- Java Runtime Environment
- ALZip
- JAR2EXE Converter
- ZipZag
GZ (gzip)
Это архив, который можно сделать при помощи инструмента gzip. Данное приложение применяет в своей работе алгоритм DEFLATE. Наибольшее распространение, это решение получило в системах UNIX, там оно стало стандартом в области сжатия информации. Обеспечить взаимодействие с форматом GZ помогут следующие приложения:
- 7-Zip
- WinACE
- ALZip
- WinMount
- Zipeg
Расширение tar является общепринятым форматом для архивных данных, присутствующих в ОС на базе Unix. Данное решение используется для передачи различного ПО, а также для непосредственного формирования архива. Такой пакет сохраняет множество данных: временные метки, имя владельца, группу файлов, структуру каталогов. Открыть его можно следующими приложениями:
- PicoZIP
- 7-Zip
- WinACE
- AlZip
- WinMount
7z
Это файловый архив для создания которого используется инструмент 7-Zip. Приложение отличается высоким уровнем сжатия информации и распространяется свободно. Оно построено на базе открытого исходного кода. В данном инструменте применяется многопоточность – до восьми одновременных потоков. Формат 7z можно открыть следующими приложениями:
- 7-Zip
- ZipZag
- ZipGenius
- PeaZip
- ALZip
ZIP
Формат файла, который обеспечивает архивацию и сжатие данных. Данное решение было разработано Филом Кацем для приложения PKZIP. Сегодня создано большое количество других программ для взаимодействия с указанным форматом, и среди них следующие:
- WinZip
- TurboSoft AnyZip
- 7-Zip
- WinAce
- WinRAR
RAR
Это файловый архив, в котором могут находиться, как файлы, так и папки, сжатые посредством технологии RAR. Формат обладает более высоким уровнем сжатия информации. Такой результат обеспечивается посредством особого запатентованного алгоритма. Программу WinRAR создал программист Евгений Рошал, также для взаимодействия с форматом можно использовать такие приложения:
- 7-Zip
- Alpha ZIP
- ZipZag
- The Unarchiver
- PeaZip
Аудио форматы файлов
Существуют следующие форматы музыкальных файлов: aac, m4a, wma, ac3, ogg, ape, flac, mp3.
AAC
Это формат аудиофайла, который имеет некоторые преимущества перед MP3. Он обеспечивает меньшие потери качества, при аналогичном размере преобразованного файла. Данное решение создавалось в 1997 году, как альтернатива MP3, оно относится к семье MPEG-2. AAC – это незащищённый файл без контейнера. Открыть его можно такими приложениями:
- Adobe Audition
- Xilisoft Video Converter
- Apple QuickTime Player
- FMJ-Software Awave Studio
- Winamp
Формат m4a
Относится к незащищенным аудиофайлам, кодирование которых осуществлялось посредством AAC. Открыть m4a можно одним из следующих приложений:
- Nullsoft Winamp
- Apple QuickTime Player
- Apple iTunes
- FMJ-Software Awave Studio
- Windows Media Player
Формат WMA
Имеют аудиофайлы, для создания которых применялся кодек Windows Media Audio. Данное решение является собственностью компании Microsoft, оно обладает рядом схожих черт с MP3. WMA нередко применяется для воспроизведения музыкальных файлов в сети Интернет. Открыть файлы такого типа можно одним из следующих приложений:
- AIMP
- Windows Media Player
- Nullsoft Winamp
- Audacity
- Foobar2000
Формат AC3
Имеют аудиофайлы, соответствующие стандарту Dolby Digital. В данном случае звук кодируется, как шесть независимых каналов, которые при воспроизведении на соответствующей системе, создают объем и эффект присутствия. Данное решение нашло широкое применение в киноиндустрии. Воспроизвести файл в формате AC3 помогут такие приложения, как:
- Winamp
- Adobe Premiere
- AIMP
- KMPlayer
- Media Player Classic
Формат Ogg
Является контейнером для хранения субтитров, звука, а также видео в разнообразных форматах. Ogg представляет собой открытый стандарт. Он распространяется свободно и не обладает лицензионными или патентными ограничениями. Ogg может содержать потоки, преобразованные разными кодеками. Открыть Ogg помогут следующие приложения:
- Nullsoft Winamp
- AIMP
- Sound Forge
- VUPlayer
- BSplayer
Формат APE
Имеют аудиофайлы, сжатые кодеком Monkey’s Audio, которые при этом не имеют качественных потерь. Данное решение позволяет исправлять ошибки в записи и добавлять теги. Кодек Monkey’s является бесплатным дополнением. Аудио APE, если сравнивать его с MP3, требует больше пространства, однако и качество у него выше. Открыть помогут следующие приложения:
- AIMP
- NCH WavePad
- VUPlayer
- JMAC
- KMPlayer
Формат FLAC
Имеют аудиофайлы, преобразованные без качественных потерь, при их сжатии применяется специальный кодек с открытым кодом. Данное решение уступает MP3 по показателям сжатия, однако качество звука у него выше. Формат оценят меломаны и любители собирать собственные музыкальные коллекции. Взаимодействовать с FLAC можно посредством следующих приложений:
- AIMP
- jetAudio
- Nullsoft Winamp
- GoldWave
- VUPlayer
Формат MP3 используют сжатые аудиофайлы. Создателем данного решения выступила группа Moving Picture Experts. Формат применяет сжатие аудио Layer 3. В MP3 чаще всего хранят музыку и аудиокниги. Качество звука в данном формате приближается к показателям CD, а объем преобразованного файла в десять раз меньше, чем в случае с AIFF и WAV. Открыть помогут следующие приложения:
- Nullsoft Winamp
- Sound Forge
- AIMP
- Apple iTunes
- VUPlayer
Другие популярные и частые форматы файлов
Далее обсудим форматы файлов данных: exe, msi, txt, dll, ini.
Формат EXE имеют исполняемые файлы в операционных системах Windows и DOS, приложения. Самораспаковывающиеся архивы также могут обладать таким расширением. Любой файл EXE, как правило, можно запустить двойным кликом мыши, если используется ОС Windows. На других платформах обеспечить взаимодействие с указанным форматом помогут эмуляторы. Открыть EXE можно посредством приложений:
- Resource Hacker
- eXeScope
- Resource Tuner
- VMware Fusion
- VMware Workstation
Формат MSI имеют установочные пакеты, используемые операционной системой Windows. Данное решение применяется для обновления самой платформы, либо используется другими разработчиками для инсталляции различного ПО. MSI включает в себя составной документ OLE, содержащий базу данных из связанных таблиц, в которых указаны всевозможные данные о приложении. Открыть помогут:
- Universal Extractor
- The Unarchiver
- 7-Zip
- Microsoft Windows Installer
Формат TXT имеют файлы, которые содержат текстовые данные. Информация в таких документах зачастую организована в форме строк. Также в TXT может иметь, как неформатированный, так и размеченный вид. При необходимости форматирование может быть задано для любого символа: размер, начертание, шрифт. Открыть TXT помогут следующие приложения:
- «Блокнот»
- CoolReader
- PSPad editor
- STDU Viewer
- Notepad++
Формат файла DLL имеет динамическая библиотека, она дает возможность приложениям получать доступ к системным функциям. DLL-элемент может быть составной частью операционной системы Windows, либо сторонних программ, работающих в этой оболочке. Посредством такого решение может быть обеспечена работа с жестким диском либо другими устройствами. Открыть DLL помогут:
- Microsoft Visual Studio
- Windows Resource Hacker
- Visual FoxPro
Формат INI имеют файлы конфигурации, которые задействуют в своей работе различные приложения Windows. В таких документах, как правило, хранятся определенные настройки. Структура материала разделена на секции. Имена секций отмечены квадратными скобками. Каждая из них может включать в себя несколько значений вида: «Параметр=Значение». Открыть INI можно посредством следующих приложений:
- FileAlyzer
- PSPad editor
- «Блокнот»
- Bred 3
- Notepad++
ЗИП
Что такое ZIP-файл?
Файл с расширением .zip — это архив, который может содержать один или несколько файлов или каталогов. Архив может иметь сжатие, примененное к включенным файлам, чтобы уменьшить размер ZIP-файла. Формат файла ZIP был обнародован еще в феврале 1989 года Филом Кацем для архивирования файлов и папок. Формат стал частью утилиты PKZIP, созданной PKWARE, Inc. Сразу после появления [доступных спецификаций](https://pkware.cachefly.net/ webdocs/casestudies/APPNOTE.TXT), многие компании сделали формат файла ZIP частью своих программных утилит, включая Microsoft (начиная с Windows 7), Apple (Mac OS X) и многие другие.
Краткая история формата ZIP-файла
История формата файла ZIP восходит к судебному иску, поданному компанией System Enhancement Associates (SEA) против PKWARE за использование утилиты ARC без разрешений на ее товарный знак и авторских прав на внешний вид продукта и пользовательский интерфейс. До этого Фил Кац переписал исходный код SEA и выпустил PKXARC, экстрактор ARC, и PKARC, компрессор файлов, в качестве бесплатного программного обеспечения для систем на базе MS-DOS. Проиграв судебный процесс, PKWARE больше не могла использовать что-либо, связанное с ARC. Именно здесь появилось новое сжатие файлов, названное ZIP, которое стало частью утилиты PKZIP в PKWARE, Inc.
Кац опубликовал спецификации формата файлов ZIP в общественное достояние, сохранив при этом права собственности на свою утилиту сжатия и извлечения, т.е. PKZIP. Система сжатия ZIP могла (и может) архивировать файлы в папке с помощью 32-битного алгоритма циклической проверки избыточности (CRC) для сжатия файла. размеры. В отличие от ARC, папки .ZIP включали файл каталога, который играл роль кодовой книги криптографа и содержал информацию, необходимую для воспроизведения сжатых файлов.
Поддерживаемые методы сжатия в ZIP
В соответствии со спецификациями формата файла .ZIP поддерживаются следующие методы сжатия.
- Магазин — подразумевает отсутствие сжатия
- Сокращаться, сжиматься
- Сокращение (это подразумевает коэффициенты сжатия в диапазоне от уровня 1 до уровня 4)
- Взрыв
- Выкачать
- Дефлат64
- BZIP2
- ЛЗМА (ЭФС)
- WavPack
- PPMd версия I, ред. 1
DEFLATE — это широко используемый метод сжатия, представляющий собой алгоритм сжатия данных без потерь, использующий комбинацию кодирования LZ77 и Хаффмана и подробно описанный в [RFC 1951] (https://tools.ietf.org/html/rfc1951).
Спецификации формата ZIP-файла
ZIP-файлы имеют возможность хранить несколько файлов с использованием различных методов сжатия, в то же время поддерживая сохранение файла без какого-либо сжатия. Каждый файл хранится/сжимается индивидуально, что помогает извлекать их или добавлять новые без применения сжатия или распаковки ко всему архиву.
Общий формат файла ZIP
Каждый Zip-файл структурирован следующим образом:
Формат ZIP-файла |
---|
Заголовок локального файла 1 |
Данные файла 1 |
Дескриптор данных 1 |
Заголовок локального файла 2 |
Файл данных 2 |
Дескриптор данных 2 |
….![]() |
…. |
Заголовок локального файла N |
Файл данных N |
Дескриптор данных N |
Заголовок расшифровки архива |
Архивировать дополнительную запись данных |
Центральный каталог |
Формат файла ZIP использует 32-битный алгоритм CRC для целей архивирования. Чтобы отобразить сжатые файлы, ZIP-архив содержит каталог в конце, в котором хранится запись о содержащихся файлах и их местоположении в файле архива. Таким образом, он играет роль кодирования для инкапсуляции информации, необходимой для воспроизведения сжатых файлов. Читатели ZIP используют каталог для загрузки списка файлов без чтения всего ZIP-архива. Формат сохраняет двойные копии структуры каталогов для обеспечения большей защиты от потери данных.
Каждый файл в ZIP-архиве представлен как отдельная запись, где каждая запись состоит из заголовка локального файла, за которым следуют сжатые данные файла. Каталог в конце архива содержит ссылки на все эти записи файла. Читатели ZIP-файлов должны избегать чтения заголовков локальных файлов, и весь список файлов следует читать из каталога. Этот каталог является единственным источником допустимых файловых записей в архиве, так как файлы также могут добавляться ближе к концу архива. Поэтому, если читатель читает локальные заголовки ZIP-архива с самого начала, он может прочитать и недействительные (удаленные) записи, а также те, которые не являются частью каталога, удаляемого из архива.
Порядок записей файлов в центральном каталоге не обязательно должен совпадать с порядком записей файлов в архиве.
Записи ZIP-файла
Записи в ZIP-файле расположены друг за другом, где каждая запись состоит из:
- Заголовок локального файла
- Необязательные дополнительные поля данных
- Пользовательские данные (опционально сжатые/опционально зашифрованные)
Заголовок локального файла каждой записи представляет информацию о файле, такую как комментарий, размер файла и имя файла. Дополнительные поля данных (необязательные) могут содержать информацию о параметрах расширения формата ZIP.
Заголовок локального файла
Заголовок локального файла имеет определенную структуру полей, состоящую из многобайтовых значений. Все значения хранятся в порядке байтов с прямым порядком байтов, где длина поля рассчитывается как длина в байтах. Все структуры ZIP-файла используют 4-байтовые подписи для каждой записи файла. Конец подписи центрального каталога — 0x06054b50, и его можно отличить по собственной уникальной подписи. Ниже приведен порядок информации, хранящейся в заголовке локального файла.
Смещение | Байты | Описание |
---|---|---|
0 | 4 | Подпись заголовка локального файла # 0x04034b50 (читается как прямой порядок байтов) |
4 | 2 | Версия, необходимая для извлечения (минимум) |
6 | 2 | Битовый флаг общего назначения |
8 | 2 | Метод сжатия |
10 | 2 | Время последней модификации файла |
12 | 2 | Дата последнего изменения файла |
14 | 4 | CRC-32 |
18 | 4 | Сжатый размер |
22 | 4 | Размер без сжатия |
26 | 2 | Длина имени файла (n) |
28 | 2 | Дополнительная длина поля (м) |
30 | n | Имя файла |
30+n | m | Дополнительное поле |
Заголовок файла центрального каталога
Смещение | Байты | Описание |
---|---|---|
0 | 4 | Подпись заголовка файла центрального каталога # 0x02014b50 |
4 | 2 | Версия сделана |
6 | 2 | Версия, необходимая для извлечения (минимум) |
8 | 2 | Битовый флаг общего назначения |
10 | 2 | Метод сжатия |
12 | 2 | Время последней модификации файла |
14 | 2 | Дата последнего изменения файла |
16 | 4 | CRC-32 |
20 | 4 | Сжатый размер |
24 | 4 | Размер без сжатия |
28 | 2 | Длина имени файла (n) |
30 | 2 | Дополнительная длина поля (м) |
32 | 2 | Длина комментария файла (k) |
34 | 2 | Номер диска, на котором начинается файл |
36 | 2 | Внутренние атрибуты файла |
38 | 4 | Внешние атрибуты файла |
42 | 4 | Относительное смещение заголовка локального файла.![]() |
46 | n | Имя файла |
46+n | m | Дополнительное поле |
46+n+m | k | Комментарий к файлу |
Конец записи центрального каталога
Смещение | Байты | Описание |
---|---|---|
0 | 4 | Конец подписи центрального каталога # 0x06054b50 |
4 | 2 | Номер этого диска |
6 | 2 | Диск, на котором начинается центральный каталог |
8 | 2 | Количество записей центрального каталога на этом диске |
10 | 2 | Общее количество записей центрального каталога |
12 | 4 | Размер центрального каталога (байты) |
16 | 4 | Смещение начала центрального каталога относительно начала архива |
20 | 2 | Длина комментария (n) |
22 | n | Комментарий |
использованная литература
- Спецификации формата ZIP-файла PKWARE
- [Структура файла PKZip] (https://users.
cs.jmu.edu/buchhofp/forensics/formats/pkzip-printable.html)
Как работает сжатие файлов?
Сжатие файлов является основной частью работы Интернета. Это позволяет нам передавать файлы, которые в противном случае потребовали бы слишком много трафика и времени. Всякий раз, когда вы получаете доступ к файлам ZIP или просматриваете изображения JPEG, вы получаете преимущества сжатия файлов.
Итак, в какой-то момент вы наверняка задавались вопросом: как работает сжатие файлов? Вот общий взгляд на то, как работает сжатие.
Что означает сжатие?
Проще говоря, сжатие файла (или сжатие данных) — это действие по уменьшению размера файла при сохранении исходных данных. Это позволяет файлу занимать меньше места на устройстве хранения, а также упрощает его передачу через Интернет или иным образом.
Важно отметить, что сжатие не бесконечно. Хотя сжатие файла в ZIP-файл уменьшает его размер, вы не можете продолжать сжимать файл, чтобы уменьшить его размер до нуля.
Обычно сжатие файлов делится на два основных типа: с потерями и без потерь. Давайте посмотрим, как они работают по очереди.
Как работает сжатие файлов: сжатие с потерями
Сжатие с потерями уменьшает размер файла за счет удаления ненужных битов информации. Это чаще всего встречается в форматах изображений, видео и аудио, где нет необходимости в идеальном представлении исходного мультимедиа. Многие распространенные форматы для этих типов носителей используют сжатие с потерями; MP3 и JPEG — два популярных примера.
MP3 не содержит всю аудиоинформацию из исходной записи — вместо этого он выбрасывает некоторые звуки, которые люди не могут слышать. Вы все равно не заметите их отсутствие, поэтому удаление этой информации приводит к меньшему размеру файла практически без недостатков.
Точно так же файлы JPEG удаляют несущественные части изображений. Например, на изображении, содержащем голубое небо, сжатие JPEG может изменить все пиксели неба на один или два оттенка синего вместо использования десятков различных оттенков.
Однако чем сильнее вы сжимаете файл, тем заметнее становится падение качества. Вы, вероятно, сталкивались с этим при загрузке мутных файлов MP3 на YouTube. Например, сравните этот качественный музыкальный трек:
.С этой сильно сжатой версией той же песни:
Сжатие с потерями подходит, когда файл содержит больше информации, чем вам нужно для ваших целей. Например, допустим, у вас есть огромный файл изображения RAW. Хотя вы, вероятно, хотите сохранить это качество при печати изображения на большом баннере, загружать файл RAW на Facebook бессмысленно.
Изображение содержит так много данных, что они не заметны при просмотре в социальных сетях. Сжатие изображения в высококачественный JPEG выбрасывает некоторую информацию, но невооруженным глазом изображение выглядит почти так же. Посмотрите наше сравнение популярных форматов изображений, чтобы глубже взглянуть на это.
Сжатие с потерями в общем использовании
Как мы уже упоминали, сжатие с потерями отлично подходит для большинства форм носителей. Из-за этого это жизненно важно для таких компаний, как Spotify и Netflix, которые постоянно передают огромные объемы информации. Максимальное уменьшение размера файлов при сохранении качества делает их работу более эффективной. Вы можете себе представить, если бы каждое видео с YouTube сохранялось и передавалось в исходном несжатом формате?
Но сжатие с потерями не так хорошо работает для файлов, где важна вся информация. Например, использование сжатия с потерями в текстовом файле или электронной таблице приведет к искажению вывода. Вы действительно не можете ничего выбросить, не нанеся серьезного вреда конечному продукту.
При сохранении в формате с потерями часто можно установить уровень качества. Например, во многих графических редакторах есть ползунок для выбора качества JPEG от 0 до 100.
Сохранение около 90 или 80 процентов немного уменьшают размер файла, практически без разницы. Но сохранение в плохом качестве или многократное сохранение одного и того же файла в формате с потерями приведет к его ухудшению.
Ниже вы можете увидеть пример этого (нажмите, чтобы увидеть увеличенное изображение). Слева исходное изображение, загруженное с Pixabay в формате JPEG. Среднее изображение — результат сохранения в формате JPEG с качеством 50 процентов. А самое правое изображение показывает исходное изображение, сохраненное в формате JPEG с 10-процентным качеством.
3 изображения
На первый взгляд среднее изображение выглядит не так уж и плохо. Артефакты по краям прямоугольников можно заметить только при увеличении масштаба. Конечно, самое правое изображение сразу выглядит ужасно.
Перед кадрированием для загрузки размеры файлов составляли 874 КБ, 310 КБ и 100 КБ соответственно.
Связанный: Как уменьшить размер JPEG
Как работает сжатие файлов: сжатие без потерь
Сжатие без потерь — это способ уменьшить размер файла, чтобы можно было полностью восстановить исходный файл. В отличие от сжатия с потерями, он не выбрасывает никакой информации. Вместо этого сжатие без потерь, по сути, работает за счет устранения избыточности.
Давайте рассмотрим простой пример, чтобы показать, что это значит. Ниже стопка из 10 кирпичей: два синих, пять желтых и три красных. Этот стек — простой способ проиллюстрировать эти блоки, но есть и другой способ сделать это.
Вместо того, чтобы показывать все 10 блоков, мы можем удалить все блоки каждого цвета, кроме одного. Затем, если мы используем числа, чтобы показать, сколько кирпичиков каждого цвета было, мы представили тот же самый бит информации, используя гораздо меньше кирпичей. Вместо 10 кирпичей нам теперь нужно всего три.
Это простая иллюстрация того, как возможно сжатие без потерь. Он сохраняет ту же информацию более эффективным способом, удаляя избыточность. Рассмотрим реальный файл, в котором приведена следующая строка:
.мммммууууууууууууууу
Может «сжиматься» до следующей, гораздо более короткой формы:
m5u7o12
Это позволяет нам использовать семь символов вместо 24 для представления тех же данных, что является значительной экономией.
Сжатие без потерь в повседневном использовании
Как мы упоминали выше, сжатие без потерь важно в тех случаях, когда вы не можете удалить исходный файл. Если вам интересно, как работают ZIP-файлы, вот ответ.
При создании ZIP-файла из исполняемой программы в Windows используется сжатие без потерь. Сжатие ZIP-файла является более эффективным способом хранения программы, но при распаковке (распаковке) архива сохраняется вся исходная информация. Если вы использовали сжатие с потерями для сжатия исполняемых файлов, разархивированная версия будет повреждена и непригодна для использования.
Распространенные форматы без потерь включают PNG для изображений, FLAC для аудио и ZIP. Форматы видео без потерь встречаются редко, потому что они занимают огромное количество места.
Когда использовать сжатие с потерями или сжатие без потерь
Теперь, когда мы рассмотрели обе формы сжатия файлов, вы можете задаться вопросом, когда следует использовать одну или другую. Как оказалось, «лучшей» формы сжатия не существует — все зависит от того, для чего вы используете файлы.
В общем, вы должны использовать сжатие без потерь, если вам нужна идеальная копия исходного материала, и сжатие с потерями, когда несовершенная копия достаточно хороша. Давайте посмотрим на другой пример, чтобы увидеть, как они могут работать в гармонии.
Допустим, вы только что откопали свою старую коллекцию компакт-дисков и хотите оцифровать ее, чтобы вся ваша музыка была на вашем компьютере. Когда вы копируете свои компакт-диски, имеет смысл использовать такой формат, как FLAC, который не допускает потерь. Это позволяет иметь на компьютере мастер-копию, которая не уступает по качеству оригинальному компакт-диску.
Позже, возможно, вы захотите записать музыку на свой телефон или старый MP3-плеер, чтобы слушать ее на ходу. Вы, вероятно, не заботитесь о том, чтобы ваша музыка была в идеальном качестве для этого, поэтому вы можете конвертировать файлы FLAC в MP3. Это дает вам аудиофайл, который по-прежнему отлично слушается, но не занимает много места на вашем мобильном устройстве. Качество MP3, преобразованного из FLAC, будет таким же хорошим, как если бы вы создали сжатый MP3 прямо с оригинального компакт-диска. Вы даже можете сжать видео прямо на вашем iPhone.
Тип данных, представленных в файле, также может определять, какой тип сжатия лучше. Поскольку изображения PNG используют сжатие без потерь, они предлагают файлы небольшого размера для изображений с большим количеством однородного пространства, например скриншоты компьютера. Однако вы заметите, что PNG занимают гораздо больше места, когда они представляют собой мешанину цветов на реальных фотографиях.
Проблемы во время сжатия файлов
Как мы видели, преобразование форматов без потерь в форматы с потерями — это нормально, как и преобразование одного формата без потерь в другой. Однако вы никогда не должны преобразовывать формат с потерями в формат без потерь и должны остерегаться преобразования одного формата с потерями в другой.
Преобразование форматов с потерями в форматы без потерь просто пустая трата места. Помните, что форматы с потерями выбрасывают данные; восстановить эти данные невозможно.
Допустим, у вас есть файл MP3 размером 3 МБ. Преобразование этого во FLAC может привести к файлу размером 30 МБ, но эти 30 МБ содержат те же звуки, что и MP3 гораздо меньшего размера. Преобразование обратно в формат без потерь не «восстанавливает» информацию, которую выбросило сжатие MP3.
Наконец, как упоминалось ранее, преобразование одного формата с потерями в другой (или многократное сохранение в одном и том же формате) приведет к дальнейшему ухудшению качества. Каждый раз, когда вы применяете сжатие с потерями, вы теряете больше деталей. Это становится все более и более заметным, пока файл не будет по существу испорчен.
Как работает сжатие? Теперь вы знаете
Мы рассмотрели сжатие с потерями и без потерь, чтобы увидеть, как они работают. Теперь вы знаете, как можно сохранить файл меньшего размера, чем его первоначальная форма, и как выбрать лучший метод для ваших нужд.
Конечно, алгоритмы, определяющие, какие данные выбрасываются при использовании методов с потерями и как лучше хранить избыточные данные при сжатии без потерь, намного сложнее, чем мы здесь объясняли. Если вам интересно, по этой теме можно найти еще много интересного.
Пробовали сжатие без потерь и хотите что-то отправить другу? Попробуйте эти быстрые способы передачи больших файлов онлайн. И если вам нужна помощь в сжатии больших аудиофайлов, вот несколько простых и эффективных способов.
Каковы преимущества и недостатки использования сжатия файлов? | Малый бизнес
Сжатие данных имеет широкий спектр вычислительных приложений. Кроме того, сжатие данных играет неотъемлемую роль в рационализации организационных функций и своевременной передаче данных.
Объем памяти компьютера
Файлов со временем становится не только больше, но и их размер. Например, если в какой-то момент отправка 30 страниц текста за несколько минут могла быть невероятным технологическим достижением, то сегодня пользователь компьютера ожидает HD-видео и звука по запросу. Большинство компьютеров имеют достаточно места для хранения, поэтому хранение больших файлов не является большой проблемой, а использование дополнительного хранилища с помощью внешнего жесткого диска или USB-накопителя — это просто и недорого. Тем не менее, при работе с файлами большого размера экономия дискового пространства является разумной практикой. Не говоря уже о том, что многие распространенные программы различными способами ограничивают размер данных.
Ограничения данных Gmail
Как многие из вас знают, Gmail не позволяет отправлять вложения электронной почты, размер которых превышает 25 МБ. Кроме того, Google позволяет пользователям отправлять файлы через Интернет с помощью популярного облачного сервиса Google Drive. Отсутствие сжатия файлов делает процесс отправки массовой информации более трудоемким. Если ваши файлы не будут сжаты, это может вызвать проблемы у ваших получателей при отправке данных через Интернет или по сети.
Преимущества и недостатки сжатия
Имея это в виду, рассмотрим некоторые преимущества и недостатки сжатия и обсудим некоторые распространенные типы сжатия, такие как zip-файлы и сжатие без потерь. Таким образом, вы можете не тратить время на загрузку и передачу огромных файлов и правильно работать с программами, требующими большого объема памяти.
Что такое сжатие данных?
Сжатие данных — это способ изменения или кодирования структурированных данных, чтобы они занимали меньше места на диске при хранении в компьютерной системе. Другими словами, любой случай, когда данные или фрагменты данных подвергаются уменьшению их исходного размера или скорости передачи данных, является сжатием данных.
Сжатие данных или сжатие файлов?
Сравнивая сжатие данных со сжатием файлов, вы должны понимать, что они не всегда являются синонимами. Часто сжатие файлов можно рассматривать как часть сжатия данных, в то время как сжатие данных относится к уменьшению размера любого типа объекта данных — будь то кластер ячеек или отдельные биты данных. Сжатие файлов — это метод сжатия данных, который уменьшает размер файла для повышения эффективности использования дискового пространства. Кроме того, сжатие файлов уменьшает размер файлов при резервном копировании важной информации и обеспечивает более быструю передачу в Интернете или по сети.
В конце концов, как данные, так и сжатие файлов оптимизируют физические ресурсы хранения, используемые вашей технологией.
Как работает сжатие данных?
Суть сжатия данных довольно техническая. Проще говоря, сжатие — это программное решение или вычислительная техника, использующая алгоритмы плотности для сжатия данных. Типичный метод сжатия заменяет повторяющиеся компоненты данных и символы, полагаясь на удаление, чтобы добиться уменьшения размера. Между тем, графические данные могут быть сжаты посредством сжатия без потерь, в результате чего повторяющиеся данные не удаляются.
Независимо от используемого алгоритма сжатия результатом сжатия является файл или файлы меньшего размера, чем их первоначальный размер.
Отличается ли архивирование файлов от сжатия файлов?
Когда дело доходит до архивирования, это форма сжатия файлов. В частности, zip-файлы, хотя и .zip или . zipx, часто содержат несколько сжатых файлов, известных как «архивы». Файлы Zip являются наиболее известным форматом сжатия среди пользователей Windows. Поэтому неудивительно, что WinZip является наиболее широко используемым программным обеспечением для сжатия среди пользователей ПК.
Примечание . К сожалению, macOS не поставляется со встроенной утилитой для работы с zip-файлами. Таким образом, сторонники Apple должны полагаться на сторонние приложения для обработки этого типа сжатых данных.
Что такое Zip-файлы
В любом случае подумайте о том, как работают папки в Windows. Вы можете сгруппировать несколько файлов в папке и перемещать папку. При этом файлы остаются вместе в исходном расположении. Zip-файлы работают аналогичным образом, но содержимое папки сокращается для увеличения производительности хранилища. ZIP-файлы не только упрощают организацию связанных файлов, но и значительно упрощают передачу, загрузку, отправку по электронной почте и хранение данных.
Это определение zip-файла удовлетворяет большинство людей. Тем не менее, знаете ли вы, что у zip-файлов есть много других функций, помимо простого сжатия файлов и создания сжатых архивов? Точно так же WinZip — не единственная программа для управления сжатыми файлами и не самая передовая.
Стороннее программное обеспечение
Бесплатная программа для Windows под названием 7-Zip может делать гораздо больше, чем родной архиватор операционной системы, то есть WinZip. Ниже приведены некоторые преимущества использования стороннего программного обеспечения для сжатия:
Шифрование zip-файлов
Шифрование zip-файлов является бесценным ресурсом, если вы хотите сжать файлы и защитить их от посторонних глаз. Только не забудьте использовать сложный пароль, чтобы атаки по словарю и перебор не помешали вашим усилиям по шифрованию.
Самораспаковывающиеся архивы
Самораспаковывающийся архив представляет собой обычный zip-файл со встроенным исполняемым файлом (.exe) с расширением . Выполнение архива позволит начать процесс извлечения самостоятельно. Для открытия архива не обязательно использовать какие-либо специализированные программы.
Разделить на тома
Во многих случаях сжатый файл слишком велик, чтобы поместиться на любом внешнем устройстве хранения, будь то компакт-диск или флэш-накопитель USB. Итак, хорошо, когда ваша программа позволяет вам разделить архив на несколько томов.
Высококачественное сжатие
Наконец, встроенная утилита сжатия 7-Zip позволяет сжимать файлы более компактно. Хотя это преимущество не является существенным, освобождение места для нескольких дополнительных МБ может быть затруднено при определенных обстоятельствах.
В конце концов, 7-Zip — одна из многих вспомогательных программ, облегчающих сжатие данных. Поэтому рекомендуется выбирать программу с функциями, подходящими для ваших нужд.
Преимущества сжатия файлов
Как вы видели, использование сжатия файлов дает много преимуществ. Вот резюме:
Повышенная эффективность вычислений
Сжатые данные позволяют пользователям быстрее выполнять резервное копирование и хранение данных, особенно при работе с большими файлами. Примечание: Преимущество сжатия цифрового видео становится все более полезным по мере того, как видеорекламные письма (VSL) и персонализированные видео становятся все более распространенными.
Более быстрая передача
Сжатие файлов не только позволяет более эффективно перемещать файлы на локальном устройстве, но и позволяет быстрее отправлять большие документы и данные через Интернет.
Улучшенная целостность файлов
Несжатые файлы часто могут быть повреждены при отправке через Интернет. Заархивированные файлы служат для сохранения целостности ваших файлов и обеспечения сохранности ваших данных.
Доступ к электронной почте/веб-странице
Файлы большего размера легче сжимать при их загрузке на веб-страницу или отправке по электронной почте. Кроме того, как упоминалось ранее, наиболее распространенные системы электронной почты ограничивают размер вложений. Таким образом, сжатие предлагает способ отправки нескольких файлов вместе, а не по одному.
Недостатки сжатия данных
Хотя это обсуждение в основном сосредоточено на преимуществах сжатия файлов , было бы упущением не упомянуть некоторые недостатки, обычно связанные со сжатием.
Сжатые файлы должны быть распакованы
Хотя это может показаться здравым смыслом, не все знакомы со сжатыми файлами. Таким образом, распаковка ваших zip-файлов на стороне получателя иногда может оказаться проблематичной.
Исполняемые файлы имеют плохую репутацию
Избегайте файлов, оканчивающихся на «.exe» , это одна из первых вещей, которую вы узнаете, когда начинаете работать в сети. Поэтому, если вы используете стороннюю программу для создания самораспаковывающихся архивов, не удивляйтесь, если ваш получатель будет сдержанно открывать сжатое вложение.
Может произойти расшифровка
Если вы поместите зашифрованные файлы в уже отформатированную ZIP-папку, есть большая вероятность, что они станут незашифрованными при распаковке. Этот недостаток кодирования может привести к непреднамеренному раскрытию личной информации и конфиденциальных данных.