Форматы текстовых файлов список: Огромный список форматов с подробным описанием – Текстовые данные — Википедия

Текстовые данные — Википедия

Те́кстовые да́нные (также те́кстовый форма́т) — представление информации строкового типа (то есть, последовательности печатных символов) в вычислительной системе. В MIME закодированным таким образом данным соответствует тип text/plain.

Часто текстовые данные понимаются в более узком смысле — как текст на каких-либо языках (формальных или естественных), который может быть прочитан и понят человеком.

Текстовому формату противопоставляются «двоичные данные», информация в которых закодирована произвольным образом, не рассчитанном на восприятие человеком.

Для большей части компьютерного оборудования и программ неважно, являются ли данные текстовыми. Однако многие сетевые протоколы рассчитаны на работу только с текстовыми данными и не могут обрабатывать произвольную последовательность байтов. Также, некоторые программы обрабатывают текстовые и двоичные данные по-разному, а некоторые предназначены для обработки именно текстовых данных. Программы для создания и редактирования текстовых данных называются текстовыми редакторами.

Текстовыми данными как правило называются последовательности из подмножества знаков, включающего только печатные знаки (буквы, цифры, знаки препинания) и некоторые управляющие знаки (пробелы, табуляции, переводы строки). Существуют методы (например, UUENCODE или Base64), позволяющие закодировать в текстовом формате произвольные данные любого формата, что часто используется для кодирования бинарных данных.

Требование к возможности понимания содержимого человеком вносит дополнительную избыточность в представление данных. К примеру, число 123, для кодирования которого достаточно одного 8-битного байта, в текстовом виде кодируется несколькими цифровыми символами — так, в десятичной системе счисления для этого требуется три знака («123»), в двоичной — семь знаков («1111011»), в шестнадцатеричной — два («7B»).

Текстовый формат не позволяет использовать команды форматирования текста, управлять атрибутами шрифтов, размечать содержимое[1].

Разбиение на строки[править | править код]

Текстовые данные могут разделяться на строки. На некоторых платформах (в основном, в операционных системах семейства UNIX) разбиение на строки кодируется одним управляющим знаком с кодом 10 в таблице ASCII (наименование — Line Feed, LF), на других (к примеру, в MS-DOS и Microsoft Windows) — парой управляющих знаков с кодами 13 и 10 (Carriage Return и Line Feed, CR/LF). В Mac OS (но не Mac OS X) разбиение кодируется одним знаком с кодом 13.

Такое разбиение управляющим знаком или знаками продиктовано тем, как работали пишущие машинки, через которые осуществлялся ввод в некоторых первых компьютерах — позиция ввода там указывалась положением валика с бумагой, и для поворота валика и перехода к следующей строке требовалось нажатие одной или двух клавиш или рычажков.

Также, знаки разбиения строк использовались для управления механическими принтерами (в качестве которых могли выступать те же печатные машинки, используемые и для ввода) — знак LF вызывал прокрутку рулона с бумагой, а знак CR вызывал возврат печатной каретки (там, где они были) в начало строки. Отсюда и название знаков — англ. Line Feed (перевод строки) и англ. Carriage Return (возврат каретки).

На некоторых платформах разбиение на строки делалось иначе — текст представлялся в виде последовательности записей фиксированной длины, для чего более короткие строки дополнялись нужным количеством пробелов. Это соответствовало представлению данных на перфокартах, которые служили средством ввода и даже хранения данных, имевших фиксированную ширину (например, 80 позиций - колонок).

Текстовый файл, показанный командой cat в окне xterm

Основная цель применения текстовых данных — «общий знаменатель», независимость от отдельных программ, требующих собственного кодирования или форматирования и несовместимых с другими программами. Текстовые файлы (файлы в текстовом формате) могут быть открыты, прочитаны и отредактированы в любых текстовых редакторах, таких как MS-DOS Editor (англ.) (DOS), Блокнот (Windows), ed, vi и vim (UNIX, Linux), SimpleText (англ.), TextEdit (Mac OS X) и т. п. Другие программы также как правило умеют читать и импортировать текстовые данные. Просмотреть текстовые файлы можно также встроенными командами (type в DOS и Windows) и утилитами (cat в Unix).

Текстовый формат часто используются для представления данных, которые сами не являются чисто текстовыми. В этом случае другие форматы данных «надстраиваются» над простым текстом, для чего их управляющие конструкции выражаются посредством печатных слов и знаков препинания. Это обеспечивает удобство работы с данными на двух уровнях — например, данные HTML и XML можно просматривать и редактировать с показом форматирования в режиме WYSIWYG, а можно их открыть в обычном текстовом редакторе и иметь доступ ко всем тонкостям языка разметки. При хранении данных в «двоичном» виде (как это делается, например, в Microsoft Word ранних версий) с ними нередко нельзя работать в других программах (из-за недоступности информации о структуре формата) или даже в разных версиях одной и той же программы.

В большинстве языков программирования предполагается использование текстового формата для исходного кода программ. Помимо прочего, это позволяет применять к исходным кодам разнообразные утилиты для преобразований, оформления, поиска, статистики, анализа и т. п.

В файлах конфигурации многих программ применяется текстовый формат, даже если там представлены числа и двоичные переключатели (да/нет). Это несколько усложняет программы из-за необходимости преобразования текстовых данных во внутренний формат и обратно, но появляется возможность править конфигурацию вручную, без использования средств настройки самой программы.

Затруднительным является указание на какую-то определенную часть текста, хранящегося в формате текстовых данных. В качестве указателей могут использоваться номера строк или номера символов[2].

Термин открытый текст (англ. plaintext; выглядит очень похоже на термин англ. plain text, используемый для обозначения текстовых данных) широко применяется в криптографии и означает любые незашифрованные данные, в том числе и нетекстовые. Термин чистый текст (англ. cleartext) также применяется в криптографии и означает незашифрованные данные, к тому же понятные человеку и незащищённые от «подслушивания» при передаче.

Текстовые форматы файлов

Текстовые форматы файлов


Самый часто используемый тип данных в компьютерном мире и интернете – текстовый. Видео и графика много красочнее и вообще лучше один раз увидеть, чем сто раз услышать. Ну и услышать тоже неплохо – на этот случай есть аудио-форматы данных. Однако правят компьютерный бал неказистые и скромные буквы и цифры. Без них никуда, даже названия другому файлу не дать. Текстовые данные важны и разнообразны – это и книги, и документы, и программный код. И для каждого назначения существуют собственные варианты форматов. Именно о них и пойдёт речь в этой статье. Правда следует сразу же сделать одну оговорку – в данном обзоре не будут затронуты форматы электронных книг, они заслуживают отдельного разговора. Здесь же говориться будет о форматах именно документов.

Текстовый формат – TXT (PlainText)

Итак – самое простое из возможных, формат TXT. Это текст в его, по сути, чистом и незамутнённом виде. Содержит только содержимое текста и абсолютный минимум служебных данных – символы начала и конца текста, перевода каретки и тому подобные.

Несмотря на практически спартанскую простоту, формат не лишён вариантов и различий. Во-первых, есть некоторые различия между Windows, Unix и MacOS версиями в которых используются разные символы конца строки. Также различия могут быть обусловлены использованием 8-битной (ASCII) либо 16-битной (UNICODE) кодовых страниц.

Однако, несмотря на это, формат TXT отличается крайней универсальностью, за что весьма любим программистами и системными администраторами.

Форматы документов MS Office и аналоги– DOC, DOCX, RTF, ODT

При всей универсальности и простоте TXT абсолютно непригоден для создания собственно документов – текстов предназначенных для печати с соблюдением определённых правил и норм оформления. Поскольку подобные документы кроме самого текста должны содержать ещё массу информации об оформлении и форматировании текста. А также о формате и размере листа бумаги, где они должны размещаться.

Для этих целей были созданы довольно многочисленные форматы различных офисных пакетов. Наиболее популярным и фактически близким к универсальному можно считать форматы MS Word – doc и docx. Первый представляет собой специальный закрытый формат, созданный компанией Microsoft для своего текстового редактора (точнее целую линейку форматов – за время своего существования он несколько раз подвергался усовершенствованию). Наряду с ним ещё на заре развития компании в сотрудничестве с корпорацией Adobe был создан формат RTF (Rich Text Format). В отличие от DOC структура этого формата доступна и он успешно поддерживается практически всеми существующими текстовыми редакторами. Хотя и несколько уступает DOC по набору доступных функций.

Закрытость разработок компании Microsoft привела к созданию открытого офисного пакета Open Office. Для которого был разработан собственный формат ODT (OpenDocument Text Format). Формат не очень хорошо поддерживается коммерческими редакторами, в том числе

MS Word и может открываться ими с ошибками.

Наконец в 2007 году Microsoft решила отказаться от ставки на формат DOC и разработала семейство форматов Office Open XML в которое входит DOCX ставший основным форматов новых версий MS Word.

Формат PDF

Отказавшись от сотрудничества с Microsoft, компания Adobe двинулась своим путём. Ею был разработан формат PDF представлявший собой формат не столько для разработки документов, сколько для их просмотра и печати. В отличие от предыдущей группы, представляющих собой форматированный текст, вид которого тем не менее может изменяться в зависимости от того на какой конкретной машине он отображается или печатается, PDF представляет собой формат документа принципиально неизменного и сохраняющего внешний вид и вёрстку в любых условиях. Также он поддерживает довольно широкий спектр как полиграфических элементов, так и дополнительного сервиса (например защита документа паролем от редактирования либо печати и так далее). Всё это делает PDF скорее форматом для распространения сложных и профессионально выполненных документов и даже книг.

Текстовые форматы.

То есть форматы для хранения текстовых файлов. Сейчас основным средством, практически монополистом в подготовке стандартных текстовых документов является программа MicrosoftWord, поэтому далее основное внимание будет уделено форматам, предназначенным для этой программы.

а) DOC. Форматы, имеющие расширение.docэто обычный способ представления текста вMicrosoftWord. Текст с расширением .docсодержит данные о том, где и какая осуществляется разбивка на строки и абзацы, способы выравнивания текста, отбивка между строками и абзацами, вид и начертания шрифтов и так далее. Все это называетсяформатированием текста. Форматирование текста и формат файла – это совершенно разные понятия, хотя выражены они близкими словами.

Не всегда старая версия MicrosoftWordне может прочитать то, что создано на более современной версии. Или при переходе на более старую версию либо другую программу теряется что-то из форматирования документа. Но более новые версии всегда полностью могут читать то, что создано в более ранних версиях.

Формат DOC позволяет создать самое качественное форматирование текста, но созданный текст не всегда воспроизводим на другом компьютере.

б) RTF. Расширение .rtfрасшифровывается какright text format, что значитправильный текстовый формат. Форматы семействаrtfобладает очень широкой совместимостью, их понимают все текстовые процессоры, старые и новые. Но не все текстовые редакторы, так как редакторы – более примитивные средства работы с текстом. Многие нетекстовые (например, графические) программы значительно лучше работают сrtf, чем сdoc. Совместимость реализуется потому, что вrtfформатирование преобразуется в программные инструкции, которые позволяют открывать и просматривать документ в различными средствами.

Если нужно переписать с помощью дискеты текст на другой компьютер, при этом неизвестно какая на нем стоит программа работы с текстом, то надежнее всего сохранить его в формате rtf. Файл форматаrtfимеет несколько больший объем, чемdoc, но появляется гарантия, что другой компьютер этот текст поймет.

Формат RTF позволяет воспроизвести созданный текст на любой версии Microsoft Word и во многих нетекстовых программах.

в) TXT. Это примитивный текстовый формат, не содержащий сложного форматирования. Из форматирования здесь сохраняется только деление на абзацы, и каждая строка превращается в абзац. Форматtxt, применяется программистами для написания программного кода, т.к. компьютер не нуждается в «красивом» по человеческим понятиям оформлении текста. Еще форматtxtиспользуют тогда, когда текст должны понять пользователи с разным программным обеспечением, когда конечная программа не распознает другие форматы файлов.

В Windowsимеется программное средство для работы с текстами в формате .txt–Notepad (Блокнот), с его помощью удобно просматривать различные программы и электронные документы, не предназначенные для распечатки.

Сообщения электронной почты также не имеют развитого форматирования. Поэтому, если вы отправите документ в виде почтового сообщения, то он потеряет свой внешний вид. Если же требуется передать по почте не только содержание, но и внешний вид текста, то его надо отправлять в виде файла формата doc, прикрепленного к почтовому сообщению.

Существует много других текстовых форматов. 10 и более лет назад кромеWordбыли популярны несколько других текстовых программ, например, отечественная программа «Лексикон». Для программ, вытесненныхMicrosoftWord, были разработаны свои, оригинальные текстовые форматы, которые могут понадобиться при прочтении текстов того времени.

Наконец, текст можно хранить и в той или иной степени редактировать в десятках других форматах, предназначенных не для создания текстовых документов, а для других целей. В качестве примеров можно привести формат .html для созданияWeb-сайтов, .xlx для табличного редактораExcel, популярныйPostScriptформат.pdfи множество других.

Форматы текстовых файлов и программы для работы с ними: история и наши дни

Каждый пользователь ПК постоянно сталкивается с различными форматами текстовых файлов, но вряд ли задумывается о том, насколько богата история этих форматов и программ, подаривших человеку возможность читать книги, работать с текстом и создавать всю необходимую документацию прямо на компьютере.

История текстовых файлов не намного моложе самих персональных компьютеров – уже первыми программистами их шедевры были написаны в первых аналогах современного «блокнота». Так какие же бывают форматы текстовых файлов и программы для работы с ними? Для начала нужно понять, для чего нужны текстовые файлы, какие между ними различия и что у них общего. Объединяет абсолютно все текстовые форматы их основная задача – сохранение текстовой информации. Различаются они возможностями обработки и форматирования текста, а также доступом к хранящейся в файлах информации в плане совместимости с другими программами.

Самым простым текстовым форматом традиционно является формат TXT. Он же самый скромный по возможностям и самый старый текстовый формат. Благодаря своей простоте (возможности TXT ограничиваются набором текста и разбивкой его на абзацы), именно этот формат зачастую используется огромным количеством приложений и программ на самых разных платформах.

С распространением персональных компьютеров и увеличением их продаж компания Microsoft создает еще один популярный формат, получивший название Rich Text Format (или просто RTF). Он представляет собой текст, который размечен с помощью определенных «управляющих слов», позволяющих не только производить, но и сохранять сложные элементы форматирования и вставлять в текст формулы, таблицы, рисунки, колонтитулы и сноски.

Однако RTF довольно сильно уступает в возможностях формату DOC, также созданному компанией Microsoft специально для пакета программ под названием Microsoft Office. Созданный более пятнадцати лет назад DOC включает в себя огромное количество возможностей для форматирования и обработки текста, создания, редактирования и размещения изображений, диаграмм, таблиц и других элементов. Следует заметить, что наиболее корректно эти функции будут работать только в программе MS Word. Это связано в первую очередь с тем, что Microsoft не текущих спецификаций формата DOC и не дает своим конкурентам и независимым разработчикам использовать возможности этого формата в полной мере. Именно этот факт и является одной из основных причин того, что кроме формата DOC в наше время широко используются и другие форматы текстовых файлов.

Главным отличием формата  DOC от текстовых форматов RTF и TXT служит его бинарность, из-за которой он становится нечитабельным в таких простейших текстовых редакторах, как Wordpad, Lexicon, Atlantis. Более того, в некоторых случаях можно наблюдать и несовместимость DOC-файлов, созданных в различных версиях программы MS Word.

Форматы текстовых файлов открывать и редактировать можно в огромном количестве программ. Кроме ранее упомянутого MS Word, самыми распространенными из них являются StarOffice, выпускаемый компанией Sun Microsystems, WordPerfect от Corel и бесплатный пакет OpenOffice.org.

С распространением электронных устройств-читалок популярность набирают и другие форматы текстовых файлов, к примеру, FB2 и LRF.

Для того чтобы получить возможность использования различных текстовых форматов на разных платформах, создано большое количество программ, называемых конверторами. Конверторы текстовых файлов позволяют сохранять исходный текст из одного формата в другой и использовать его в дальнейшем на различных устройствах и платформах.

Конверторы применяются не только для сохранения текста из одного в другой формат, но и для создания файлов, которые, в отличие от их исходников, можно использовать на устройствах, которые не способны «прочитать» оригинальные файлы. К примеру, некоторые электронные книги, которые не поддерживают популярные форматы текстовых файлов, способны запросто распознавать форматы LRF или FB2, полученные из исходных файлов с помощью программ-конверторов.

Форматы текстовых файлов — Мегаобучалка

Набор правил, по которым сохраняются данные в файле, называется форматом файла. Различные типы файлов, такие как текстовые файлы, растровая графика и т.п., используют различные форматы. В общем случае для одного типа файлов может быть определено несколько разных форматов, хотя часто под типом файла и форматом понимают одно и то же. Формат файла определяется по расширению имени файла, которое добавляется к имени файла при его сохранении в определенном формате, например, DOC, GIF и т. д.

Как правило, форматы файлов создаются для использования в строго определенной прикладной программе. Например, графические объекты, создаваемые в известном пакете векторной графики CorelDRAW, сохраняются как файлы с расширением CDR, а изображения, формируемые другим графическим пакетом, CorelXara, записываются на диск как файлы с расширением XAR. Некоторые форматы не связываются с конкретными приложениями, то есть являются универсальными. Одним из наиболее известных универсальных форматов является формат TXT (формат текстовых файлов DOS).

Часто используют сжатие компьютерных файлов для экономии места на носителе. Существует много способов сжатия файлов. Эти способы зависят от исходного формата файлов. Как правило, чем выше степень сжатия, тем медленнее выполняются операции чтения и записи.

Что касается алгоритмов сжатия, то имеются как алгоритмы сжатия без потери данных, так и алгоритмы, при использовании которых потеря данных возможна.

Сжатие без потерь гарантирует, что все данные, которые были в файле до сжатия, будут присутствовать и после распаковки файла. Механизмы сжатия без потерь используются при сохранении текста или числовых данных, например электронных таблиц или файлов документов. Примерами алгоритмов сжатия без потерь могут служить общеизвестные алгоритмы ZIP, ARJ, и другие.

Дадим краткое описание основных используемых форматов:

§ American Standard Code for Information Interchange ASCII (TXT). Формат текстовых файлов, разработанный Американским институтом стандартов (American National Standards Institute). Поддерживается всеми операционными системами и всеми программами. Представляет собой текстовый файл в DOS-кодировке, нет функции вставить рисунок, нет форматирования, работает во всех машинах, возможно создать только файлы малого объема.



§ ANSI (TXT). Формат текстовых файлов в кодировке ANSI (для кодовой страницы Microsoft Windows)

§ MsWord для DOS, Windows (.DOС). Формат документов, разработанный корпорацией Microsoft, поддерживается программами для MS-DOS и большинством текстовых процессоров. Он сохраняет исходное форматирование документов, а также стили начертания символов. Кроме текстовой информации, файлы этого формата могут содержать графические картинки с различными параметрами. Поддерживает 256 цветов. Не поддерживает сжатие. Используется в основном для обмена форматированными текстовыми данными между различными платформами и приложениями.

§ Hypertext Markup Language HTML (HTM, HTML). Язык разметки гипертекстовых документов. Все страницы, расположенные в Internet, созданы с использованием этого специального языка. HTML-документы представляют собой ASCII-файлы, доступные для просмотра и редактирования в любом текстовом редакторе. Отличием от обычного текстового файла является то, что в HTML-документах присутствуют специальные команды-теги, которые определяют правило форматирования документа. Если вам удалось освоить язык HTML, то вы можете создать страницы для Internet. Добавляя теги (метки) к обычному тексту, вы заставляете программу просмотра отображать этот текст определенным образом и размещать на странице изображения. Если вы изучили Java и JavaScript, то знаете, как расширить возможности HTML, помещая внутри тегов команды, написанные на языке сценариев.

§ Portable Document Format PDF (.PDF). Этот формат хранения документов, разработанный фирмой Adobe, претендует на роль открытого типографского стандарта для Web. Он рассматривается как альтернатива HTML. Недостатком HTML является то, что документы, переведенные в HTML, обычно не сохраняют первоначальный формат, причем HTML предлагает при просмотре очень ограниченное число гарнитур. Напротив, пользователи программы Acrobat и PDF-инструментария для создания, распространения и просмотра документов в первоначальном формате, знают, что читатели увидят публикацию именно такой, какой она была сделана. Формат PDF незаменим, если требуется получить точную копию необходимого документа. Как пример успешного применения PDF для документов на русском языке приведем сервер "Московских новостей" в Internet. Представленные на нем в электронном виде материалы полностью повторяют бумажный оригинал, отпечатанный типографским способом.

§ Standard Generalized Markup Language (SGML). Развитие HTML переводится как стандартный язык обобщенной разметки. Представляет собой инструментальный набор механизмов создания структурированных документов, размеченных с помощью дескрипторов (tags). По сравнению с HTML он обеспечивает более гибкие и разносторонние возможности форматирования в Web. Однако SGML отличается и повышенной скоростью, поэтому как более простое средство применяется PDF. Могущество SGML заключается в его межплатформенном структурном подходе к описанию содержания документов. SGML является фактически метаязыком, т.е. предназначен для описания языков разметки, применяемых при создании документов.

Расширение текстового файла — описание популярного формата :: SYL.ru

Файл TXT — это расширение для документа, используемое различными текстовыми редакторами. Текст — это читаемая последовательность символов и слова, которые закодированы в машиночитаемые форматы. Стандартного определения понятия "расширение текстового файла" нет, хотя есть несколько распространенных форматов, включая ASCII (кросс-платформенный формат) и ANSI (используется на платформах DOS и Windows).

Расширение текстового файла

Текстовым редактором является компьютерная программа, которая позволяет пользователю вводить, изменять, хранить и печатать текст (символы и цифры, каждый из которых закодирован компьютером, устройствами ввода и вывода). Как правило, текстовый редактор предоставляет «пустой» экран дисплея (или «прокручиваемую страницу») с фиксированной длиной строки и видимыми номерами строк. Строки можно заполнить текстом. Специальная командная строка позволяет перейти на новую страницу, прокручивать вперед или назад, делать глобальные изменения в документе, сохранять файл и выполнять другие действия. После сохранения документа вы можете распечатать его или отобразить. Перед печатью вы можете отформатировать его для определенного устройства вывода или класса устройства вывода. Текстовые редакторы могут использоваться для ввода инструкций языка программы или для создания таких документов, как технические руководства.

расширение текстового файла

Виды текстовых редакторов

Популярный текстовый редактор на больших или мэйнфреймовых компьютерах IBM называется XEDIT. В системах UNIX двумя наиболее часто используемыми текстовыми редакторами являются Emacs и vi. В системах персональных компьютеров текстовые процессоры более распространены, чем текстовые редакторы. Но существуют вариации мейнфреймов и текстовых редакторов UNIX, которые предоставляются для использования на персональных компьютерах. Примером может служить KEDIT.

ASCII и ANSI

ASCII (стандартный код для обмена цифровыми данными) является одним из самых востребованных форматов txt-файлов на ПК и в Интернете. В ASCII-файле каждый специальный, числовой или алфавитный символ заменяется семибитным двоичным числом (строчка из семи единиц или нулей).

файл txt

Операционные системы UNIX и DOS используют ASCII для текстовых файлов. В Windows NT и 2000 используется новый код Unicode. Системы IBM S/390 используют собственный 8-разрядный код, называемый EBCDIC. Конверсионные программы позволяют различным операционным системам изменять файл с одного кода на другой.

ASCII был разработан Американским национальным институтом стандартов (ANSI). Долгосрочные компьютерные стандарты от ANSI включают ASCII и интерфейс компьютерной системы малого вычислительного оборудования (SCSI).

Текстовый файл Википедия

Пиктограммное описание текстового файла с CSV-данными

Те́кстовый файл — компьютерный файл, содержащий текстовые данные. Текстовым файлам противопоставляются двоичные (бинарные) файлы, в которых содержатся данные, не рассчитанные на интерпретацию в качестве текстовых (например, файлы, хранящие текст в закодированном или сжатом виде, или хранящие не текст, а звук, изображение или иные данные).

В отличие от термина «текстовые данные» (текстовый формат данных), характеризующего содержимое данных, термин «текстовый файл» относится к файлу и характеризует его как контейнер, хранящий такие данные.

Текстовый файл содержит последовательность символов (в основном печатных знаков, принадлежащих тому или иному набору символов). Эти символы обычно сгруппированы в строки (англ. lines, rows). В современных системах строки разделяются разделителями строк, в прошлом же применялось хранение строк в виде записей постоянной или переменной длины (см.: Перфокарта). Иногда конец текстового файла (особенно если в файловой системе не хранится информация о размере файла) также отмечается одним или более специальными знаками, известными как маркеры конца файла.

Преимущества и недостатки

Преимущества:

  • Универсальность — текстовый файл может быть прочитан (так или иначе) на любой системе или ОС, особенно если речь идёт об однобайтных кодировках вроде ASCII, которые не подвержены проблеме, характерной для других форматов файлов — для них не важна разница в порядке байтов или длине машинного слова на разных платформах.
  • Устойчивость — каждое слово и символ в таком файле самодостаточны и, если случится повреждение байтов в таком файле, то обычно можно восстановить данные или продолжить обработку остального содержимого, в то время как у сжатых или двоичных файлов повреждение нескольких байтов может сделать файл совершенно невосстановимым. Многие системы управления версиями рассчитаны на текстовые файлы и с двоичными файлами могут работать только как с единым целым.
  • Формат текстового файла крайне прост и его можно изменять текстовым редактором — программой, входящей в комплект практически любой ОС.

Недостатки:

  • У больших несжатых текстовых файлов низкая информационная энтропия — эти файлы занимают больше места, нежели минимально необходимо. Хотя эта избыточность и определяет повышенную устойчивость к сбоям в каналах передачи данных и при получении данных с

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *