Текстовые форматы: Какие форматы текстовых файлов бывают. Подробный список

Содержание

PDF. Горшочек, не вари! Как обуздать бесконечный поток писем и задач

Текстовые форматы: PDF. Горшочек, не вари! Как обуздать бесконечный поток писем и задач

ВикиЧтение

Горшочек, не вари! Как обуздать бесконечный поток писем и задач
Хёрст Марк

Содержание

Текстовые форматы: PDF

В приведенной выше статье указан еще один вариант текстового формата – PDF от Adobe (название расшифровывается как мобильный формат документа, расширение. pdf). Если документ нужно создать в Word, то PDF может содержать те же данные без сопутствующих проблем со скрытой информацией и несовместимостью. Собственно говоря, преобразовать документы в PDF может любое приложение с функцией печати, а не только Word[29]. Главное преимущество PDF – его совместимость: и на Mac, и на Windows, и на Linux, как и на большинстве цифровых гаджетов, можно открывать и читать файлы PDF, не покупая и не устанавливая специальных программ.

Даже если документ создан в Word, а у получателя Word не установлен, то PDF по-прежнему будет доступен. Более того, документы PDF выглядят так же хорошо, как и документы Word, без какой-то потери качества как на экране, так и на печати. Следовательно, любое приложение может создать совместимый документ, если оно способно сохранять файлы в PDF. Единственный недостаток PDF в том, что эти файлы предназначены только для чтения, получатели не могут их редактировать. (Вообще редактировать файлы PDF можно, но требуются специальные программы – например, PDFpen для Mac.)

Наконец, следует отметить, что PDF – это формат, которым владеет корпорация Adobe, но она не высказывает никакого желания «закрыть» его или каким-то образом брать с покупателей мзду за его использование. (Неудивительно, что PDF так популярен.) Если получателю не требуется редактировать файл, PDF – хорошая альтернатива Word.

Данный текст является ознакомительным фрагментом.

Глава 9 Форматы файлов

Глава 9 Форматы файлов Важность формата файла легко недооценить. Собственно говоря, пока все вышеописанное можно было осуществить без каких-либо познаний в этой области. Например, в главе об организации фотографий не упоминался самый популярный цифровой формат – JPG – и

Форматы файлов изображений

Форматы файлов изображений Один из самых популярных форматов файлов – это JPG, который также называется JPEG, файловое расширение. jpg (произносится «джейпег»). JPG создан для работы с изображениями, на которых есть много цветов и их оттенков. Чтобы сократить количество места,

Форматы аудиофайлов

Форматы аудиофайлов Размер файла – ключевой источник различий и в аудиоформате. Самый популярный аудиоформат – MP3 (произносится «эм-пи-три»), его расширение. mp3. Файл MP3 – это сжатая версия оригинальной аудиозаписи, так что звук в нем не так хорош, как на купленном

Текстовые форматы: электронная почта

Текстовые форматы: электронная почта Знаете вы об этом или нет, но каждый раз, когда вы пишете электронное сообщение, составляете письмо, записку в электронном блокноте или иным образом создаете цифровой текст, вы выбираете для него формат. Как и в случае с изображениями и

Текстовые форматы: Word

Текстовые форматы: Word У многих вызывает справедливое недоумение, почему же Word создает такие большие файлы для простых сообщений. Ответ таков: Microsoft Word не предназначен для создания цифрового текста, он создает бумагу.Когда в середине 1980-х годов появился Word, персональные

Текстовые форматы: ASCII

Текстовые форматы: ASCII ASCII (произносится «аск-и-и») примерно соответствует буквам, цифрам и символам на компьютерной клавиатуре: от A до Z, в верхнем и нижнем регистре, цифры от 0 до 9 и наиболее часто употребляемые знаки препинания. Текст, который создается с помощью таких

Текстовые форматы: заключение

Текстовые форматы: заключение Вот краткое резюме – какие цифровые форматы стоит использовать при создании цифрового текста:• Если документ не нужно распечатывать, используйте текстовый редактор и создайте файл ASCII. Если текст нужно отправить по почте, сделайте это в

Текстовые функции

Текстовые функции Как уже говорилось в главе о форматах файлов, текстовые файлы лучше всего создавать в текстовом редакторе, а не в Microsoft Word, во многом потому, что текстовый редактор предлагает некоторые специальные текстовые функции. Цифровая грамотность предполагает

Текстовые редакторы

Текстовые редакторы Текстовый редактор — это основная прикладная программа компьютера. Она проста для усвоения и не создает трудностей при использовании. Если вы знакомы с клавиатурой и можете использовать кнопки «удалить» и «возврат каретки», а также освоили функции

6.7. Форматы партнерского контекста

6.7. Форматы партнерского контекста Говоря о развитии контекстной рекламы, нельзя не отметить тенденцию увеличения количества форматов, доступных для показа в рекламных сетях. Если изначально партнерам предлагалось транслировать лишь текстовые объявления, то сегодня

Конверсионные действия: кнопки или текстовые ссылки?

Конверсионные действия: кнопки или текстовые ссылки? У большинства сайтов на каждой странице размещается по нескольку ссылок. Если ваш призыв к действию оформлен таким образом, она может затеряться среди множества других ссылок и текстового материала. Кнопка более

Прочие форматы видеообъявлений

Прочие форматы видеообъявлений Google предлагает еще несколько форматов видеообъявлений.

Видеообъявления рассмотренного выше стандартного формата воспроизводятся по клику. В разделе видео редактора медийных объявлений (рис. 8.16) вы найдете другие поддерживаемые Google

Основные форматы визуального конспектирования

Основные форматы визуального конспектирования Помню однажды, анализируя значение различных форм и базовых элементов визуального языка, я осознал, что визуальный язык отличается от языков, на которых мы говорим, тем, что может быть пространственным, идет ли речь о

2.3.1. Форматы торгов

2.3.1. Форматы торгов 2.3.1.1. Закрытые торги Существует множество форм проведения торгов (см. Главы 4–6).Все рассмотренные в исследовании организации (как европейские, так и американские) обычно присуждают контракты на основе закрытых торгов с бумажными (не электронными)

14.

3. Тендерные форматы

14.3. Тендерные форматы Поставщик может выбирать из нескольких тендерных форматов, которые в основном определяются в зависимости от возможности для участников торгов улучшать свои заявки (динамические торги против торгов с «запечатанными» заявками (закрытыми

Другие интернет-форматы

Другие интернет-форматы Многие рекламодатели охотно экспериментируют с новыми формами интернет-рекламы, например в виде игр или организации показа товаров в электронных магазинах или в электронных витринах. Один из сайтов Procter & Gamble поддерживает кампанию «Send-a-Kiss»

Какие форматы файлов поддерживаются в редакторах МойОфис?

Что такое МойОфис?В чем преимущество продуктов МойОфис?Какие форматы файлов поддерживаются в редакторах МойОфис?Возможно ли совместное редактирование документов?Есть ограничение на количество пользователей, которые могут одновременно редактировать документ?Возможно ли сохранение документов в форматах doc, xls, ppt?Реализована ли поддержка .

dot и .xltx?Каковы системные требования к работе с продуктами?Как совместимы документы, созданные в МойОфис, с другими офисными пакетами?

  • Что такое МойОфис?
  • В чем преимущество продуктов МойОфис?
  • Какие форматы файлов поддерживаются в редакторах МойОфис?
  • Возможно ли совместное редактирование документов?
  • Есть ограничение на количество пользователей, которые могут одновременно редактировать документ?
  • Возможно ли сохранение документов в форматах doc, xls, ppt?
  • Реализована ли поддержка .
    dot и .xltx?
  • Каковы системные требования к работе с продуктами?
  • Как совместимы документы, созданные в МойОфис, с другими офисными пакетами?

«МойОфис Текст».

Открытие:
DOCX, DOTX, DOCM, DOC, DOT, ODT, OTT, RTF, TXT, HTML, XHTML, HTM, MHT, MHTML, XODT, XOTT.

Сохранение:
DOCX, ODT, XODT, XOTT, TXT, PDF, PDF/A-1, XODT, XOTT.

«МойОфис Таблица».

Открытие:
XLSX, XLTX, XLSM, XLS, XLT, ODS, OTS, CSV, TSV, TAB, SCSV, TXT, XODS, XOTS.

Сохранение:
XLSX, ODS, XODS, XOTS, CSV, TSV, TAB, SCSV, PDF, PDF/A-1.

«МойОфис Презентация».

 Просмотр:
PPTX, PPT, ODP, POTX, POT, OTP.

Поделиться

Формат Excel для чисел, текста, экспоненциального представления, учета и т. д.

В учебном пособии объясняются основы формата Excel для чисел, текста, валюты, процентов, бухгалтерского числа, экспоненциального представления и т. д. Кроме того, он демонстрирует быстрые способы форматирования ячеек во всех версиях Excel 365, 2021, 2019, 2016, 2013, 2010, 2007 и более ранних версиях.

Когда дело доходит до форматирования ячеек в Excel, большинство пользователей знают, как применять основные текстовые и числовые форматы. Но знаете ли вы, как отобразить необходимое количество знаков после запятой или определенный символ валюты и как применить правильное экспоненциальное представление или формат бухгалтерских чисел? А знаете ли вы ярлыки формата чисел Excel, чтобы применить нужное форматирование одним щелчком мыши?

  • Основы формата Excel
  • Как форматировать ячейки в Excel
  • Диалоговое окно «Формат ячеек»
  • Параметры форматирования на ленте
  • Ярлыки формата Excel
  • Числовой формат Excel не работает

Основы формата Excel

По умолчанию все ячейки на листах Microsoft Excel форматируются в формате Общий . При форматировании по умолчанию все, что вы вводите в ячейку, обычно остается как есть и отображается как напечатано.

В некоторых случаях Excel может не отображать значение ячейки точно так, как вы его ввели, хотя формат ячейки остается «Общий». Например, если вы введете большое число в узкий столбец, Excel может отобразить его в формате научной нотации, например 2,5E+07. Но если вы посмотрите число в строке формул, вы увидите исходное число, которое вы ввели (25000000).

Бывают ситуации, когда Excel может автоматически изменить общий формат на другой в зависимости от значения, введенного в ячейку. Например, если вы введете 04.01.2016 или 01.04, Excel воспримет это как дату и соответствующим образом изменит формат ячейки.

Чтобы быстро проверить формат, применяемый к определенной ячейке, выберите ячейку и посмотрите на поле Формат номера на вкладке Домашняя страница в группе Номер :

Важно помнить, что форматирование ячеек в Excel изменяет только внешний вид или визуальное представление значения ячейки, но не само значение.

Например, если у вас есть число 0,5678 в какой-то ячейке и вы форматируете эту ячейку так, чтобы отображались только 2 десятичных знака, число будет отображаться как 0,57. Но базовое значение не изменится, и Excel будет использовать исходное значение (0,5678) во всех вычислениях.

Точно так же вы можете изменить отображаемое представление значений даты и времени так, как хотите, но Excel сохранит исходное значение (порядковые номера для дат и десятичные дроби для времени) и будет использовать эти значения во всех функциях даты и времени и других функциях. формулы.

Чтобы увидеть лежащее в основе числового формата значение, выберите ячейку и посмотрите на строку формул:

Как форматировать ячейки в Excel

Всякий раз, когда вы хотите изменить внешний вид числа или даты, отобразите границы ячеек, изменить выравнивание и ориентацию текста или внести любые другие изменения форматирования, Формат ячеек Диалоговое окно является основной функцией для использования. И поскольку это наиболее часто используемая функция для форматирования ячеек в Excel, Microsoft сделала ее доступной различными способами.

4 способа открыть диалоговое окно «Формат ячеек»

Чтобы изменить форматирование определенной ячейки или блока ячеек, выберите ячейки, которые вы хотите отформатировать, и выполните любое из следующих действий:

  1. Нажмите Ctrl + 1 ярлык.
  2. Щелкните ячейку правой кнопкой мыши (или нажмите Shift+F10) и выберите Формат ячеек… из всплывающего меню.

  3. Щелкните стрелку Средство запуска диалогового окна в правом нижнем углу группы Number , Alignment или Font , чтобы открыть соответствующую вкладку диалогового окна Format Cells :
  4. На вкладке Главная в группе Ячейки нажмите кнопку Формат , а затем нажмите Формат ячеек…

Ячейки формата 9Появится диалоговое окно 0004, и вы можете начать форматирование выбранных ячеек, используя различные параметры на любой из шести вкладок.

Диалоговое окно «Формат ячеек» в Excel

Диалоговое окно «Формат ячеек» содержит шесть вкладок, предоставляющих различные параметры форматирования для выбранных ячеек. Чтобы узнать больше о каждой вкладке, нажмите на соответствующую ссылку:

  • Номер
  • Выравнивание
  • Шрифт
  • Граница
  • Заполнить
  • Защита

Вкладка «Число» — применение определенного формата к числовым значениям

Используйте эту вкладку, чтобы применить нужный формат с точки зрения числа, даты, валюты, времени, процента, дроби, экспоненциального представления, формата бухгалтерского числа или текста. Доступные параметры форматирования зависят от выбранной категории .

Числовой формат Excel

Для чисел можно изменить следующие параметры:

  • Сколько знаков после запятой отображать.
  • Показать или скрыть разделитель тысяч .
  • Специальный формат для отрицательных чисел .

По умолчанию числовой формат Excel выравнивает значения прямо в ячейках.

Совет. В разделе Образец вы можете просмотреть жизнь предварительный просмотр того, как число будет отформатировано на листе.

Форматы валюты и учета

Формат Валюта позволяет настроить следующие три параметра:

  • Количество десятичных знаков для отображения
  • Используемый символ валюты
  • Формат, применяемый к отрицательным числам

Наконечник. Чтобы быстро применить формат валюты по умолчанию с двумя десятичными знаками, выберите ячейку или диапазон ячеек и нажмите сочетание клавиш Ctrl+Shift+$.

Формат Excel Accounting предоставляет только первые два из указанных выше параметров, отрицательные числа всегда отображаются в скобках:

Для отображения денежных значений используются как денежный, так и бухгалтерский форматы. Разница заключается в следующем:

  • Формат Excel Валюта помещает символ валюты непосредственно перед первой цифрой в ячейке.
  • Числовой формат Excel Accounting выравнивает символ валюты слева и значения справа, нули отображаются в виде тире.

Совет. Некоторые из наиболее часто используемых параметров формата учета также доступны на ленте. Дополнительные сведения см. в разделе Параметры формата учета на ленте.

Форматы даты и времени

Microsoft Excel предоставляет множество предопределенных форматов даты и времени для разных языков:

Для получения дополнительной информации и подробного руководства о том, как создать пользовательский формат даты и времени в Excel , см.:

  • Формат даты Excel
  • Формат времени Excel
Процентный формат

Процентный формат отображает значение ячейки с символом процента. Единственный параметр, который вы можете изменить, — это количество знаков после запятой.

Чтобы быстро применить процентный формат без десятичных знаков, используйте сочетание клавиш Ctrl+Shift+%.

Примечание. Если вы примените формат Процент к существующим числам, числа будут умножены на 100.

Дополнительные сведения см. в разделе Как отображать проценты в Excel.

Формат дроби

Этот формат позволяет выбрать один из множества встроенных стилей дроби:

Примечание. При вводе дроби в ячейку, формат которой не равен Дробь , возможно, вам придется ввести ноль и пробел перед дробной частью. Например, если ввести 1/8 — это ячейка, отформатированная как General , Excel преобразует ее в дату (08 января). Чтобы ввести дробь, введите в ячейку 0 1/8.

Научный формат

Научный формат (также называемый формой Standard или Standard Index ) представляет собой компактный способ отображения очень больших или очень маленьких чисел. Он широко используется математиками, инженерами и учеными. 9на клавиатуре.

Текстовый формат Excel

Если ячейка отформатирована как текст, Excel будет обрабатывать значение ячейки как текстовую строку, даже если вы введете число или дату. По умолчанию текстовый формат Excel выравнивает значения, оставленные в ячейке. При применении текстового формата к выбранным ячейкам через диалоговое окно Формат ячеек параметр для изменения отсутствует.

Имейте в виду, что формат Excel Text применяется к числам или датам запрещает их использование в функциях и вычислениях Excel. Числовые значения, отформатированные как текст, вызывают появление маленького зеленого треугольника в верхнем левом углу ячеек, что указывает на то, что что-то не так с форматом ячейки. И если ваша, казалось бы, правильная формула Excel не работает или возвращает неверный результат, в первую очередь нужно проверить числа, отформатированные как текст.

Чтобы исправить текстовые числа, недостаточно установить формат ячейки «Общий» или «Число». Самый простой способ преобразовать текст в число — выбрать проблемную ячейку (ячейки), щелкнуть появившийся знак предупреждения, а затем нажать 9.0025 Преобразование в число во всплывающем меню. Несколько других методов описаны в разделе Как преобразовать цифры в текстовом формате в числа.

Специальный формат

Специальный формат позволяет отображать числа в формате, обычном для почтовых индексов, телефонных номеров и номеров социального страхования:

Пользовательский формат

Если ни один из встроенных форматов не отображает данные так, Вы можете создать свой собственный формат для чисел, дат и времени. Вы можете сделать это либо изменив один из предопределенных форматов ближе к желаемому результату, либо используя символы форматирования в своих собственных комбинациях. В следующей статье мы предоставим подробное руководство и примеры по созданию пользовательского числового формата в Excel.

Вкладка «Выравнивание» — изменение выравнивания, положения и направления

Как следует из названия, эта вкладка позволяет изменить выравнивание текста в ячейке. Кроме того, он предоставляет ряд других опций, в том числе:

  • Выравнивание содержимого ячейки по горизонтали, вертикали или по центру. Кроме того, вы можете центрировать значение по выделению (отличная альтернатива объединению ячеек!) или сделать отступ от любого края ячейки.
  • Обертка текст в несколько строк в зависимости от ширины столбца и длины содержимого ячейки.
  • Уменьшить до размера — этот параметр автоматически уменьшает видимый размер шрифта, чтобы все данные в ячейке помещались в столбце без переноса. Реальный размер шрифта, примененный к ячейке, не изменяется.
  • Объединить две или более ячеек в одну.
  • Измените направление текста , чтобы определить порядок чтения и выравнивание. Значение по умолчанию — Контекст, но вы можете изменить его на «Справа налево» или «Слева направо».
  • Изменить текст ориентацию . Ввод положительного числа в поле градусов поворачивает содержимое ячейки из левого нижнего угла в правый верхний, а отрицательный градус выполняет поворот из левого верхнего угла в правый нижний. Этот параметр может быть недоступен, если для данной ячейки выбраны другие параметры выравнивания.

На приведенном ниже снимке экрана показаны настройки вкладки «Выравнивание» по умолчанию:

Вкладка «Шрифт» — изменение типа, цвета и стиля шрифта

Используйте параметры вкладки «Шрифт», чтобы изменить тип шрифта, цвет, размер, стиль, эффекты шрифта и другие элементы шрифта:

Вкладка «Граница» — создание границ ячеек различных стилей

Используйте параметры вкладки «Граница», чтобы создать границу вокруг выбранные ячейки цветом и стилем по вашему выбору. Если вы не хотите удалять существующую границу, выберите None .

Совет. Чтобы скрыть линии сетки в определенном диапазоне ячеек, вы можете применить к выделенным ячейкам белые границы (Контур и Внутри), как показано на скриншоте ниже:

Дополнительные сведения см. в разделе Как создать, изменить и удалить границу ячейки Excel.

Вкладка «Заливка» — изменение цвета фона ячейки

Используя параметры этой вкладки, вы можете заполнять ячейки разными цветами, узорами и специальными эффектами заливки.

Вкладка «Защита» — блокировка и скрытие ячеек

Используйте параметры «Защита», чтобы заблокировать или скрыть определенные ячейки при защите листа. Для получения дополнительной информации, пожалуйста, ознакомьтесь со следующими руководствами:

  • Как заблокировать и разблокировать ячейки в Excel
  • Как скрыть и заблокировать формулы в Excel

Опции форматирования ячеек на ленте

Как вы только что видели, диалоговое окно Format Cells предоставляет большое разнообразие опций форматирования. Для нашего удобства наиболее часто используемые функции также доступны на ленте.

Самый быстрый способ применения форматов чисел Excel по умолчанию

Чтобы быстро применить один из форматов Excel по умолчанию с точки зрения числа, даты, времени, валюты, процента и т. д., выполните следующие действия:

  • Выберите ячейку или диапазон ячеек, формат которых вы хотите изменить.
  • Щелкните маленькую стрелку рядом с полем Формат номера на вкладке Домашний в группе Номер и выберите нужный формат:

Параметры формата учета на ленте

Помимо изменения формата ячейки, в группе Число представлены некоторые из наиболее часто используемых параметров формата учета:0025 символ валюты по умолчанию , выберите ячейку (ячейки) и щелкните значок Формат учетных чисел .

  • Чтобы выбрать символ валюты , нажмите стрелку рядом со значком Бухгалтерия Номер и выберите нужную валюту из списка. Если вы хотите использовать какой-либо другой символ валюты, нажмите Дополнительные форматы учета… в конце списка, это откроет диалоговое окно Формат ячеек с дополнительными параметрами.
    • Чтобы использовать разделитель тысяч , щелкните значок с запятой .
    • Чтобы отобразить больше или меньше знаков после запятой , щелкните значок Увеличить десятичный разряд или Уменьшить десятичный разряд соответственно. Этот параметр можно использовать для формата учета Excel, а также для числового, процентного и денежного форматов.

    Другие параметры форматирования на ленте

    На вкладке Главная ленты Excel можно найти гораздо больше параметров форматирования, таких как изменение границ ячеек, цвета заливки и шрифта, выравнивание, ориентация текста и т. д.

    Например, чтобы быстро добавить границы к выделенным ячейкам, нажмите стрелку рядом с кнопкой Граница в группе Шрифт и выберите нужный макет, цвет и стиль:

    Ярлыки форматирования Excel

    Если вы внимательно следили за предыдущими частями этого руководства, вы уже знаете большинство ярлыков форматирования Excel. В таблице ниже представлена ​​сводка.

    9
    Ярлык Формат
    Формат научной записи с двумя десятичными знаками
    Ctrl+Shift+# Формат даты (дд-ммм-гг)
    Ctrl+Shift+@ Формат времени (чч:мм AM/PM)

    Числовой формат Excel не работает

    Если после применения одного из числовых форматов Excel в ячейке появляется несколько символов решетки (######), это обычно происходит по одной из следующих причин:

    • Ширина ячейки недостаточна для отображения данных в выбранном формате. Чтобы исправить это, все, что вам нужно сделать, это увеличить ширину столбца, перетащив правую границу. Или дважды щелкните правую границу, чтобы автоматически изменить размер столбца, чтобы он соответствовал наибольшему значению в столбце.
    • Ячейка содержит отрицательную дату или дату вне поддерживаемого диапазона дат (01.01.1900 — 31.12.9999).

    Чтобы различить два случая, наведите указатель мыши на ячейку с решеткой. Если ячейка содержит допустимое значение, которое слишком велико, чтобы поместиться в ячейке, Excel отобразит всплывающую подсказку со значением. Если ячейка содержит недопустимую дату, вы получите уведомление о проблеме:

    Вот как вы используете основные параметры форматирования чисел в Excel. В следующем уроке мы обсудим самые быстрые способы копирования и очистки форматирования ячеек, а затем рассмотрим расширенные методы проводника для создания пользовательских форматов чисел. Я благодарю вас за чтение и надеюсь увидеть вас снова на следующей неделе!

    Вас также может заинтересовать

    Digital Humanities Workbench








           Site map       
       About this site   

    Домашняя страница > Цифровые данные > Цифровой текст > Форматы файлов

    Термин формат файла (также известный как тип файла) указывает способ хранения информации в компьютерном файле. Формат играет важную роль в том, что вы можете делать с файлом. Существует два основных типа форматов файлов: текстовые и двоичные. Файлы в текстовом формате содержат только читаемые символы и могут быть прочитаны многими компьютерными программами. Одной из их основных характеристик является то, что их также можно читать и редактировать с помощью текстовых редакторов, таких как Блокнот или NoteTab, чего нельзя сказать о двоичных файлах. Файл в текстовом формате может содержать все виды структурных или содержательных аннотаций, но эти теги или коды также будут состоять исключительно из букв, цифр и знаков препинания.

    Двоичные файлы содержат компьютерный код, который может быть интерпретирован только специальным программным обеспечением. Многие форматы двоичных файлов являются так называемыми «закрытыми» форматами (проприетарными форматами), которые защищены патентом или авторским правом. Компания, которая их разработала, обычно не публикует спецификации формата, поэтому с файлами можно работать только с помощью собственного программного обеспечения компании.

    Расширение имени файла обычно указывает на его формат. Расширение файла — это дополнение к концу имени файла; оно состоит из одной или нескольких букв (обычно из трех или четырех) и отделяется от имени файла точкой. Форматов файлов очень много, а значит и расширений файлов тоже великое множество, как видно из обзора в Википедии. Это обзор основных форматов файлов, используемых для цифровых текстовых файлов.
    Примечание. Для электронных книг также используется множество различных форматов. Википедия предлагает исчерпывающий обзор.

    A. Текстовые файлы

    Расширение Описание
    .txt Файл, содержащий только буквы, цифры, знаки препинания, пробелы, символы табуляции и разрывы строк. Эти файлы не содержат никакого текстового форматирования и могут быть прочитаны и отредактированы практически всеми программами на всех платформах. Программное обеспечение для анализа текста хорошо справляется с файлами .txt.
    .htm
    .html
    Файл, закодированный с помощью HTML (язык гипертекстовой разметки). HTML используется для представления веб-страниц (в веб-браузерах). Поскольку это текстовые файлы, HTML-файлы можно открыть в большинстве программ анализа текста. Однако, поскольку эти файлы обычно содержат большое количество HTML-тегов, надлежащий анализ часто бывает затруднен, а это означает, что часто имеет смысл (или даже необходимо) сначала удалить HTML-теги из этих файлов.
    .xml Файл аннотирован с помощью XML (расширяемый язык разметки). XML имеет множество применений, одним из которых является аннотирование текстов, открывающее содержание для научного анализа. Аннотации XML могут быть довольно сложными, а это означает, что иногда может потребоваться специальное программное обеспечение для обработки или анализа этих файлов. Дополнительные сведения см. на страницах, посвященных XML и аннотациям, в этом Workbench.
    .sgm
    .sgml
    Файл снабжен аннотациями SGML (стандартный обобщенный язык разметки). Это предшественник XML, который использует те же функции. Вы по-прежнему найдете этот формат в некоторых текстовых архивах, потому что не каждый файл, аннотированный с помощью SGML, был преобразован в XML.

    B. Двоичные файлы

    Расширение Описание
    .jpg/ .jpeg
    .gif
    .tif/.tiff
    .png
    .bmp
    Это ряд распространенных форматов файлов для хранения изображений в цифровом виде (есть и другие). Для получения дополнительной информации см. страницу о цифровых изображениях в этом Workbench. Обратите внимание, что цифровые изображения (копии) текстов не могут быть найдены на уровне слов. Изображения более поздних текстов могут быть достаточно хорошо преобразованы в текстовые файлы с помощью оптического распознавания символов (OCR), после чего их содержимое может быть проанализировано.
    .doc
    .docx
    Формат документов Microsoft Word. Не все программы для анализа текста могут читать этот формат: в этом случае документы должны быть предварительно сохранены в виде текстовых файлов с помощью Microsoft Word. Формат файла с расширением .docx был представлен в Word 2007.
    .rtf Расширенный текстовый формат. Формат документа, разработанный Microsoft в 1987 году для обмена документами в различных компьютерных системах. Большинство текстовых процессоров могут читать документы в формате RTF. Однако не все программы анализа текста могут работать с этим форматом, и в этом случае эти документы должны быть сначала сохранены в виде текстовых файлов.
    .pdf Переносимый формат документа. Широко распространенный формат файлов, разработанный Adobe для обеспечения одинакового отображения и печати отформатированных файлов на всех компьютерных системах. Для чтения, поиска и печати этих файлов требуется программа Acrobat Reader (или ее клон). Не все программы анализа текста могут обрабатывать файлы PDF. Можно ли и в какой степени эти файлы преобразовать в текстовые файлы, зависит от того, как они были созданы; (дорогая) программа Acrobat Professional подходит для этого намного лучше, чем (бесплатная) Acrobat Reader.
    Примечание: формат pdf также широко используется для электронных книг.
    .xps
    .oxps
    Спецификация бумаги XML (открытая) XPS — это формат печати и документов, разработанный Microsoft в качестве альтернативы (и конкурента) pdf.

    Один технический аспект форматов файлов относится к наборам символов, в частности к тому, как символы кодируются компьютером. Наборы символов ASCII или ANSI традиционно используются для кодирования западного алфавита.

    Добавить комментарий

    Ваш адрес email не будет опубликован. Обязательные поля помечены *

    2026 © Все права защищены.