7 какие функциональные возможности имеют архиваторы. Основные возможности архиватора Winrar. Теоретические сведения к лабораторной работе

Тема: Создание архива данных. Извлечение данных из архива. Атрибуты файла и его объем

Цель: изучение принципов архивации файлов, функций и режимов работы наиболее распространенных архиваторов, приобретение практических навыков работы по созданию архивных файлов и извлечению файлов из архивов.

Теоретические сведения к лабораторной работе

Архивация (упаковка) — помещение (загрузка) исходных файлов в архивный файл в сжатом или несжатом виде.

Архивация предназначена для создания резервных копий используемых файлов, на случай потери или порчи по каким-либо причинам основной копии (невнимательность пользователя, повреждение магнитного диска, заражение вирусом и т.д.).

Для архивации используются специальные программы, архиваторы, осуществляющие упаковку и позволяющие уменьшать размер архива, по сравнению с оригиналом, примерно в два и более раз.

Архиваторы позволяют защищать созданные ими архивы паролем, сохранять и восстанавливать структуру подкаталогов, записывать большой архивный файл на несколько дисков (многотомный архив).

Сжиматься могут как один, так и несколько файлов, которые в сжатом виде помещаются в так называемый архивный файл или архив. Программы большого объема, распространяемые на дискетах, также находятся на них в виде архивов.

Архивный файл — это специальным образом организованный файл, содержащий в себе один или несколько файлов в сжатом или несжатом виде и служебную информацию об именах файлов, дате и времени их создания или модификации.

Выигрыш в размере архива достигается за счет замены часто встречающихся в файле последовательностей кодов на ссылки к первой обнаруженной последовательности и использования алгоритмов сжатия информации.

Степень сжатия зависит от используемой программы, метода сжатия и типа исходного файла. Наиболее хорошо сжимаются файлы графических образов, текстовые файлы и файлы данных, для которых степень сжатия может достигать 5 - 40%, меньше сжимаются файлы исполняемых программ и загрузочных модулей — 60 - 90%. Почти не сжимаются архивные файлы. Программы для архивации отличаются используемыми методами сжатия, что соответственно влияет на степень сжатия.

Для того чтобы воспользоваться информацией, запакованной в архив, необходимо архив раскрыть или распаковать. Это делается либо той же программой-архиватором, либо парной к ней программой-разархиватором.

Разархивация (распаковка) — процесс восстановления файлов из архива в первоначальном виде. При распаковке файлы извлекаются из архива и помещаются на диск или в оперативную память.

Самораспаковывающийся архивный файл — это загрузочный, исполняемый модуль, который способен к самостоятельной разархивации находящихся в нем файлов без использования программы-архиватора.

Самораспаковывающийся архив получил название SFX-архив (SelF-eXtracting). Архивы такого типа в обычно создаются в форме.ЕХЕ-файла.

Архиваторы, служащие для сжатия и хранения информации, обеспечивают представление в едином архивном файле одного или нескольких файлов, каждый из которых может быть при необходимости извлечен в первоначальном виде. В оглавлении архивного файла для каждого содержащегося в нем файла хранится следующая информация:

  1. имя файла;
  2. сведения о каталоге, в котором содержится файл;
  3. дата и время последней модификации файла;
  4. размер файла на диске и в архиве;
  5. код циклического контроля для каждого файла, используемый для проверки целостности архива.

Архиваторы имеют следующие функциональные возможности :

  1. Уменьшение требуемого объема памяти для хранения файлов от 20% до 90% первоначального объема.
  2. Обновление в архиве только тех файлов, которые изменялись со времени их последнего занесения в архив, т.е. программа-упаковщик сама следит за изменениями, внесенными пользователем в архивируемые файлы, и помещает в архив только новые и измененные файлы.
  3. Объединение группы файлов с сохранением в архиве имен директорий с именами файлов, что позволяет при разархивации восстанавливать полную структуру директорий и файлов.
  4. Написания комментариев к архиву и файлам в архиве.
  5. Создание саморазархивируемых архивов, которые для извлечения файлов не требуют наличия самого архиватора.
  6. Создание многотомных архивов– последовательности архивных файлов. Многотомные архивы предназначены для архивации больших комплексов файлов на дискеты.

Задание №1.

  1. В операционной системе Windows создайте папку Archives по адресу С:\ТЕМР . Создайте папки Pictures и Documents по адресу С:\ТЕМР\Archives .
  2. Найдите и скопируйте в папку Pictures по два рисунка с расширением * .jpg и * .bmp .
  3. Сравните размеры файлов *.bmp и *.jpg . и запишите данные в таблицу_1.
  4. В папку Documents поместите файлы *.doc (не менее 3) и запишите их исходные размеры в таблицу_1.


Задание №2. Архивация файлов WinZip

  1. Запустите WinZip 7. (Пуск →Все программы → 7-Zip→7 ZipFileManager ).
  2. С:\ТЕМР\Archives\Pictures. Зима. jpg . Выполните команду Добавить (+) .
  3. Введите имя архива в поле Архив – Зима. zip и убедитесь, что в поле Формат архива установлен тип Zip .
  4. Установите в поле Режим изменения : добавить и заменить.
  5. В раскрывающемся списке ОК .
  6. Сравните размер исходного файла с размером архивного файла. Данные запишите в таблицу_1.
  7. Создайте архив Зима1. zip , защищенный паролем. Для ввода пароля в диалоговом окне Добавит к архиву в поле Введите пароль: ведите пароль, в поле Повторите пароль: подтвердите пароль. Обратите внимание на флажок Показать пароль. Если он не установлен, пароль при вводе не будет отображаться на экране, а его символы будут заменены подстановочным символом "*". Это мера защиты пароля от посторонних. Однако в данном случае пользователь не может быть уверен в том, что он набрал пароль правильно. Поэтому при не установленном флажке система запрашивает повторный (контрольный) ввод пароля. Щелкните на кнопке ОК - начнется процесс создания защищенного архива.
  8. Выделите архив Зима1. zip , выполните команду Извлечь. В появившемся диалоговом окне Извлечь в поле Распаковать в: выберите папку-приемник - С:\ТЕМР\Archives\Pictures\Зима1\.
  9. Щелкните на кнопке ОК . Процесс извлечения данных из архива не запустится, а вместо него откроется диалоговое окно для ввода пароля.
  10. Убедитесь в том, что ввод неправильного пароля не позволяет извлечь файлы из архива.
  11. Убедитесь в том, что ввод правильного пароля действительно запускает процесс.
  12. Удалите созданный вами защищенный архив и извлеченные файлы.
  13. Создайте самораспаковывающийся ZIP-архив. Для этого установите курсор на имя архива Зима. zip , выполните команду Добавить (+).
  14. Введите имя архива в поле Архив – Зима.7 z и убедитесь, что в поле Формат архива установлен тип 7 z .
  15. Установите в поле Режим изменения : добавить и заменить.
  16. Установите флажок Создать SFX -архив .
  17. В раскрывающемся списке Уровень сжатия: выберите пункт Нормальный. Запустите процесс архивации кнопкой ОК .

Задание №3. Архивация файлов WinRar

  1. Запустите WinRar (Пуск →Все программы → WinRar ).
  2. В появившемся диалоговом окне выберите папку, в которой будет создан архив: С:\ТЕМР\Archives\Pictures.
  3. Установите курсор на имя графического файла Зима. jpg .
  4. Выполните команду Добавить . В появившемся диалоговом окне введите имя архива Зима.rar. Выберите формат нового архива - RAR , метод сжатия - Обычный . Убедитесь, что в группе Параметры архивации ни в одном из окошечек нет флажков. Щелкните на кнопке ОК для создания архива. Во время архивации отображается окно со статистикой. По окончании архивации окно статистики исчезнет, а созданный архив станет текущим выделенным файлом.
  5. Аналогичным образом создайте архивы для файлов Рябина. bmp , Документ1. doc , Документ2. doc , Документ3. doc . Сравнительные характеристики исходных файлов и их архивов занести в таблицу_1.
  6. Создайте самораспаковывающийся RAR – архив, включающий в себя текстовые и графические файлы.
  7. Определите процент сжатия файлов и заполните таблицу_1. Процент сжатия определяется по формуле , где S– размер архивных файлов, S o– размер исходных файлов.

Таблица _ 1

Архиваторы

Размер исходных файлов

WinZip

WinRar

Текстовые файлы:

1. Документ1. doc

2. Документ2. doc

3. Документ3. doc

Графические файлы:

1. Зима. jpg

2.Рябина. bmp

Процент сжатия текстовой информации (для всех файлов)

Процент сжатия графической информации (для всех файлов)


Задание №4. Ответить на вопросы:

  1. Что называется архивацией?
  1. Для чего предназначена архивация?
  1. Какой файл называется архивным?
  1. Что называется разархивацией?
  1. Какая информации хранится в оглавлении архивного файла?
  1. Какие функциональные возможности имеют архиваторы?

Задание №5. Сделать вывод о проделанной лабораторной работе:

Создание архивов;

Извлечение файлов из архивов;

Добавление файлов в имеющийся архив;

Создание самораспаковывающихся архивов;

Создание распределённых архивов на носителях малой ёмкости;

Тестирование целостности структуры архивов;

Полное или частичное восстановление повреждённых архивов;

Защита архивов от просмотра и несанкционированной модификации.

Создание самораспаковывающихся архивов используется в тех случаях, когда может не быть средств для извлечения файлов из архива. Самораспаковывающийся архив готовится на базе обычного архива путём присоединения к нему небольшого программного модуля. Сам архив получает расширение.exe, характерное для исполняемых файлов. Для извлечения файлов из архива пользователь просто запускает файл на выполнение, после чего извлечение файлов из архива происходит автоматически.

Распределённые архивы (ещё их называют многотомными архивами) создаются в тех случаях, когда предполагается создание большого архива на носителях малой ёмкости (например, на дискетах). В том случае архив разбивается на фрагменты и записывается на носители.

WinZip выполняет разбиение сразу на гибкие диски. WinRAR и WinArj позволяют выполнить предварительное разбиение архива на фрагменты заданного размера на жёстком диске, затем их можно перенести на внешние носители.

При создании распределенного архива WinZip создает фрагменты архива на гибких дисках с одинаковыми именами, поэтому каждый диск следует маркировать метками на наклейке. В случае необходимости можно узнать номер тома архива по метке на диске (Мой компьютер, КМ для диска А:, Свойства, вкладка Общие – в поле Метка тома можно узнать номер тома распределённого архива).

Архиваторы WinRAR, WinArj маркируют все файлы распределённого архива разными именами.

Защита архивов в большинстве случаев выполняется с помощью пароля. Следует заметить, что пароли на базе символов английского алфавита и цифр путём методов прямого перебора (используемого при взломе пароля) снимаются очень быстро. Поэтому рекомендуется использовать наряду с английским алфавитом русский алфавит и знаки препинания.

Один из наиболее популярных архиваторов для Windows - WinRAR.

Стандартом на сегодняшний день являются архиваторы типа ZIP.

· Антивирусные программы обеспечивают пользователя необходимыми средствами борьбы с упоминавшимися ранее компьютерными вирусами.

Разрабатываются, настраиваются и поддерживаются в рабочем состоянии системные программы специалистами, которых принято называть системными программистами. Они должны обладать высокой квалификацией, в деталях знать аппаратное обеспечение компьютера и способы работы с данными на машинном уровне. Рядовому пользователю приходится постоянно сталкиваться с системными программами, но уже с точки зрения их эксплуатации, использования их возможностей для решения своих задач. С некоторыми программами этой группы мы познакомимся в следующих главах пособия.



Такие программы тоже можно отнести к утилитам. По определению Е.В. Касперского, «компьютерным вирусом называется программа, которая может создавать свои копии (не обязательно полностью совпадающие с оригиналом) и внедрять их в файлы, системные области компьютера, вычислительные сети и т.д. При этом копии сохраняют способность дальнейшего распространения».

Вирус может искажать текст программы, в результате чего она становится совершенно неработоспособной.

Вирус может «заражать» программу, такая программа способна передавать вирус другим программам и ЭВМ, т.е. заражать их, так же как и заражённый, например, гриппом больной обладает способностью передавать свой вирус другим лицам.

Заражению подвергаются в основном программные файлы типа СОМ, ЕХЕ. Текстовые файлы, т.е. файлы, содержащие тексты программ на языке программирования, тексты документов и т.д. вирусом не заражаются, они могут лишь искажаться. А также могут быть и другие такие как Word и Excel,

Заражение вирусами ПК часто приводит к выводу из строя большого числа дорогостоящих пакетов программ, что может обернуться большими материальными затратами. Борьба с вирусами нередко требует очень больших затрат времени. Для эффективной борьбы с многочисленными вирусами создаются антивирусные программы. Вот некоторые из них:



· программы-доктора «лечат» программы, восстанавливая их первоначальный вид и удаляя при этом из них вирус;

· программы-фильтры перехватывают обращения вирусов к операционной системе, используемые для размножения и нанесения вреда, и сообщают о них пользователю.

К наиболее известным антивирусным российским программам относятся Антивирус Касперского (http://www,kav.ru) и Dr.Web (http://www.drweb.ru). Эти программы уверенно проходят все без исключения тесты и обеспечивают надёжный уровень защиты.

В последние годы простые антивирусы постепенно сходят со сцены, уступая место «комбинированным» программам, в состав которых входит и антивирус, и сетевой фильтр-файрволл, позволяющий защититься от сетевых вирусов-«червей» и «троянских» программ. Кроме того, современный антивирус должен уметь обезвреживать «шпионские» программы и рекламные модули - хотя к вирусам они и не относятся, вред от них тоже весьма ощутимый.

Лучшими по функциональности и надёжности среди подобных «комбайнов» являются последние версии Антивируса Касперского иSymantec (Norton) Antivirus. Хорошие результаты демонстрирует также программа Panda Titanium от Panda Software и комплект ZoneAlarm Security Suite . Стоимость всех этих пакетов довольно высока.

Существуют и бесплатные антивирусные программы - например, AVG Antivirus (http://www.grisoft.com) и avast (http://www.avast.com). Возможности у этих программ несколько скоромнее.

Однако от действительно опасных вирусов они защитить способны, к тому же эти программы практически не «тормозят» компьютер.

Наконец, существуют и бесплатные антивирусные «сканеры».. Если полноценные антивирусы все время «висят» в оперативной памяти и сканируют открытый файл или запущенную программу в «теневом» режиме, то сканеры просто проверяют всё содержимое жёсткого диска. Однако обновлять антивирусную базу таких сканеров в автоматическом режиме невозможно - она «зашита» в теле программ, зато новые версии самих сканеров появляются довольно часто. Пожалуй, лучшая программа этого класса Dr.Web Cure.IT! (http://drweb.ru/download/).

В процессе эксплуатации ПК возможна порча или потеря информации на магнитных дисках. Зачастую это происходит из-за физической порчи магнитного диска, случайного уничтожения файлов, а также из-за разрушения информации компьютерными вирусами. Для уменьшения потерь, следует иметь копии используемых файлов. Однако, при копировании пакетов программ и файлов больших объемов могут возникать проблемы нехватки свободного места на дисках. В этом случае целесообразно использовать специальные программы сжатия файлов, так называемые программы архивации. Данные программы используются также в случае наличия на дисках компьютера больших объемов информации, которая понадобится только в будущем, и переноса массивов информации между компьютерами.

Архиватор - программа, осуществляющая упаковку одного и более файлов в архив или серию архивов, для удобства переноса или хранения, а также распаковку архивов. Многие архиваторы используют сжатие без потерь. Архивы предназначены для хранения данных в удобном компактном виде. Данные программы сжимают файлы и объединяют их специальным образом. В результате работы программ архивации создаются архивные файлы (архивы). В качестве данных обычно выступают файлы и папки.

Основными характеристиками программ-архиваторов являются:

1.скорость работы;

2.сервис (набор функций архиватора);

3.степень сжатия - отношение размера исходного файла к размеру упакованного файла.

Степень сжатия файла характеризуется коэффициентом Кс, отражающим процентное отношение объёма сжатого файла Vс к объёму исходного файла Vо: Кс=Vс/Vо*100%

Программами архивации могут создаваться два типа архивов: активные и пассивные . Активные (или саморазархивируемые) оформляются программой как исполняемые и им присваивается расширение.exe. Они содержат в себе средства разархивации и сжатую информацию. Пассивные требуют для извлечения файлов из архива наличия соответствующей программы.

Сжатие данных используется очень широко. Можно сказать, почти везде. Например, документы PDF , как правило, содержат сжатую информацию.

Довольно много исполняемых файлов EXE сжаты специальными упаковщиками. Всевозможные мультимедийные файлы (GIF, JPG, MP3, MPG) являются своеобразными архивами.

Основным недостатком архивов является невозможность прямого доступа к данным. Их сначала необходимо извлечь из архива или распаковать. Операция распаковки, впрочем, как и упаковки, требует некоторых системных ресурсов. Это не мгновенная операция. Поэтому архивы в основном применяют со сравнительно редко используемыми данными. Например, для хранения резервных копий или установочных файлов.

В данный момент существует много архиваторов. Они имеют разную распространенность и эффективность. Некоторые интересные архиваторы не известны широкому кругу потенциальных пользователей. Особый интерес представляют оценка и сравнение эффективности сжатия популярных архиваторов.

Методы сжатия архиваторов

Разработано большое количество разнообразных методов, их модификаций и подвидов для сжатия данных. Современные архиваторы, как правило, одновременно используют несколько методов одновременно. Можно выделить некоторые основные.

Кодирование длин серий (RLE) - сокращение от run - length encoding. Очень простой метод. Последовательная серия одинаковых элементов данных заменяется на два символа: элемент и число его повторений. Широко используется как дополнительный, так и промежуточный метод. В качестве самостоятельного метода применяется, например, в графическом формате BMP .

Словарный метод или метод Лемпела - Зива (LZ) - сокращение от Lempel Ziv - имена авторов. Наиболее распространенный метод. Используется словарь, состоящий из последовательностей данных или слов. При сжатии эти слова заменяются на их коды из словаря. В наиболее распространенном варианте реализации в качестве словаря выступает сам исходный блок данных. Основным параметром словарного метода является размер словаря. Чем больше словарь, тем больше эффективность. Однако для неоднородных данных чрезмерно большой размер может быть вреден, так как при резком изменении типа данных словарь будет заполнен неактуальными словами. Для эффективной работы данного метода при сжатии требуется дополнительная память. Приблизительно на порядок больше, чем нужно для исходных данных словаря. Существенным преимуществом словарного метода является простая и быстрая процедура распаковки. Дополнительная память при этом не требуется. Такая особенность особенно важна, если необходим оперативный доступ к данным.

Энтропийный метод (Huffman - кодирование Хаффмана, Arithmetic coding - арифметическое кодирование) . В этом методе элементы данных, которые встречаются чаще, кодируются при сжатии более коротким кодом, а более редкие элементы данных кодируются более длинным кодом. За счет того, что коротких кодов значительно больше, общий размер получается меньше исходного. Широко используется как дополнительный метод. В качестве самостоятельного метода применяется, например, в графическом формате JPG .

Метод контекстного моделирования (CM) - сокращение от context modeling - контекстное моделирование. В этом методе строится модель исходных данных. При сжатии очередного элемента данных эта модель выдает свое предсказание или вероятность. Согласно этой вероятности, элемент данных кодируется энтропийным методом. Чем точнее модель будет соответствовать исходным данным, тем точнее она будет выдавать предсказания, и тем короче будут кодироваться элементы данных. Для построения эффективной модели требуется много памяти. При распаковке приходится строить точно такую же модель. Поэтому скорость и требования к объему оперативной памяти для упаковки и распаковки почти одинаковы. В данный момент методы контекстного моделирования позволяют получить наилучшую степень сжатия, но отличаются чрезвычайно низкой скоростью.

PPM (Prediction by Partial Matching - предсказание по частичному совпадению). Это особый подвид контекстного моделирования. Предсказание выполняется на основании определенного количества предыдущих элементов данных. Основным параметром является порядок модели, который задает это количество элементов. Чем больше порядок модели, тем выше степень сжатия, но требуется больше оперативной памяти для хранения данных модели. Если оперативной памяти недостаточно, то такая модель с большим порядком показывает низкие результаты. Метод PPM особенно эффективен для сжатия текстовых данных. Предварительные преобразования или фильтрация. Данные методы служат не для сжатия, а для представления информации в удобном для дальнейшего сжатия виде. Например, для несжатых мультимедиа данных характерны плавные изменения уровня сигнала. Поэтому для них применяют дельта-преобразование, когда вместо абсолютного значения берется относительное. Существуют фильтры для текста, исполняемых файлов, баз данных и другие.

Метод сортировки блока данных (BWT) - сокращение от Burrows Wheeler Transform - по имени авторов. Это особый вид или группа преобразований, в основе которых лежит сортировка. Такому преобразованию можно подвергать почти любые данные. Сортировка производится над блоками, поэтому данные предварительно разбиваются на части. Основным параметром является размер блока, который подвергается сортировке. Для распаковки данных необходимо проделать почти те же действия, что и при упаковке. Поэтому скорость и требования к оперативной памяти почти одинаковы. Архиваторы, которые используют данный метод, обычно показывают высокую скорость и степень сжатия для текстовых данных.

Непрерывные блоки или непрерывный режим (Solid mode - непрерывный режим). Во многих методах сжатия начальный участок данных или файла кодируется плохо. Например, в словарном методе словарь пуст. В методе контекстного моделирования модель не построена. Когда количество файлов большое, а их размер маленький, общая степень сжатия значительно ухудшается за счет этих начальных участков. Чтобы этого не происходило при переходе на следующий файл, используется информация, полученная исходя из предыдущих файлов. Аналогичного эффекта можно добиться простым представлением исходных файлов в виде одного непрерывного файла. Этот метод используется во многих архиваторах и имеет существенный недостаток. Для распаковки произвольного файла необходимо распаковать и файлы, которые оказались в начале архива. Это необходимо для правильного заполнения словаря или построения модели. Существует и промежуточный вариант, когда используются непрерывные блоки фиксированного размера. Потери сжатия получаются минимальными, но для извлечения одного файла, который находится в конце большого архива, необходимо распаковать только один непрерывный блок, а не весь архив.

Сегментирование Во всех методах сжатия при изменении типа данных собственно сам переход кодируется очень плохо. Словарь становится не актуальным, модель настроена на другие данные. В этих случаях применяется сегментирование. Это предварительная разбивка на однородные части. Затем эти части кодируются по отдельности или группами. Особо хочется подчеркнуть, что существует большое количество методов сжатия. Каждый метод обычно ориентирован на один вид или группу реальных данных. Хорошие результаты показывает комплексное использование методов.

Особенности данных Степень сжатия в основном зависит от исходных данных. Хорошо сжимаются почти все предварительно несжатые данные, например, исполняемые файлы (EXE), тексты (TXT , DOC), базы данных (DBF), простые несжатые изображения (BMP). Ограниченно сжимаются несжатый звук (WAV), сложные несжатые изображения (BMP). Не сжимаются почти все уже сжатые данные, например, архивы (ZIP ,CAB), сжатые документы (PDF), сжатая графика и видео (JPG, GIF, AVI, MPG), сжатый звук (MP3). Их сжатие находится в пределах пары процентов за счет служебных блоков и небольшой избыточности.

Для сжатия некоторых специфических данных (текст, несжатые изображения, несжатый звук) существуют специальные методы и архиваторы . Такие архиваторы обеспечивают высокую степень сжатия и высокую скорость. Однако так называемые универсальные архиваторы постепенно дополняются подобными методами. В данный момент только для несжатого звука существуют высокоэффективные специальные архиваторы, такие, как OptimFROG, Monkey Audio. Для текстов и изображений лучшие универсальные архиваторы показывают лучшую степень сжатия. Например, архив изображений получится меньше, если использовать формат BMP и архиватор WinRK вместо специализированных графических форматов, таких как JPEG 2000 (LossLess - сжатие без потерь).

Большое количество типов данных уже являются сжатыми . Использование архиваторов дает мизерное уменьшение размера. Тем не менее даже в таких случаях эффективное сжатие теоретически возможно. Это обусловлено тем, что в большинстве распространенных форматов файлов, использующих сжатие, применены не самые эффективные методы. Например, в основе формата JPG лежит энтропийное сжатие, которое используется после преобразований Фурье. Данные кодируются не оптимальными блоками, что обусловлено желанием сделать формат JPG устойчивым к повреждениям и возможности частичного извлечения информации. Перекодировав файлы JPG при помощи высокоэффективных методов, можно добиться сжатия порядка 75% от исходного файла (архиватор StuffIt). Собственно сам исходный файл JPG сжимается обычными архиваторами только до 96%. Однако подобные манипуляции с файлами JPG стали возможны только недавно и еще не получили распространения. В большинстве случаев сжимать уже сжатые данные бесполезно.

Какие существуют архиваторы и чем они отличаются?

Следует различать собственно программу-архиватор, формат архивов и методы сжатия. Даже один и тот же метод сжатия может иметь варианты реализации. Например, существует более десятка программ-архиваторов, которые могут создавать архивы в формате ZIP. В свою очередь данные в формате ZIP могут быть сжаты различными методами: Deflate, Deflate64, BZip2. Метод Deflate имеет несколько реализаций с разной скоростью и степенью сжатия (разница порядка 5%). С помощью этого метода архиватор 7-zip позволяет создавать архивы в формате ZIP и 7Z.

Обычно архиваторы могут создавать архивы в собственном эксклюзивном формате с использованием своих оригинальных методов. Например, архиватор RAR позволяет создавать архивы RAR. В формате архива и методах сжатия заключаются основные преимущества того или иного архиватора.

В простейшем случае архиватор позволяет только упаковать или распаковать один файл. Кроме собственно сжатия данных, современные архиваторы обеспечивают некоторые дополнительные функции.

Функции архиваторов

1.сжатие некоторых файлов и целых директорий;

2.создание самораспаковывающихся (SFX) архивов;

3.изменение содержимого архива;

4.шифрование содержимого архива;

5.информация для восстановления архива при частичном повреждении и возможность восстановления поврежденных архивов;

6.разбивка архива на несколько частей или томов;

7.консольная версия программы для работы из командной строки;

8.графическая (GUI) версия программы.

Стоит отметить, что, несмотря на формальное наличие, реализация каждой дополнительной функции может быть выполнена на совершенно разном уровне.

Классификация архиваторов

1.Файловые архиваторы.

2.Компрессоры.

С файловыми архиваторами многим, наверняка, приходилось сталкиваться. Достаточно перечислить их названия: ZIP, RAR . Такие архиваторы позволяют упаковывать один или несколько файлов в единый архивный файл. Размер архива, как правило, меньше чем суммарный размер исходных файлов.

Компрессоры сжимают за один прием всего один исполняемый файл (типа ЕХЕ) таким образом, что после запуска программа самораспаковывается в оперативной памяти и продолжает свою работу.

Кроме различий в функциональности, можно разбить архиваторы на две группы: асимметричные и симметричные. Асимметричные архиваторы требуют для операции распаковки значительно меньше времени и оперативной памяти, чем для операции упаковки. Это позволяет быстро получать содержимое архива на маломощных компьютерах. Симметричные архиваторы требуют для операций упаковки и распаковки одинаковое время и объем оперативной памяти. Использование таких архиваторов на широком парке компьютеров или для оперативного доступа к содержимому архива ограничено. Известный архиватор RAR в качестве основного использует асимметричный словарный метод сжатия, а для текстов может использовать симметричный PPM-метод. Таким образом, распаковка архивов RAR, сжатых с максимальной степенью сжатия, может быть невозможна на компьютерах с ограниченным объемом оперативной памяти. Все или почти все передовые архиваторы с высокой степенью сжатия являются симметричными.

Точной статистики по распространенности архиваторов нет. Безусловно, самым распространенным архиватором являются ZIP и его модификации. По своей распространенности он значительно превосходит ближайших конкурентов. Следом идут RAR и ACE. В последние годы встречается архиватор 7-zip. Исключение составляют некогда популярные ARJ и LHA. В данный момент они не актуальны из-за очень низкой степени сжатия.

Несмотря на очень скромные данные о распространенности архиваторов, их существует большое множество. Основная масса относится к категории экспериментальных и архиваторов с ограниченной функциональностью. Тем не менее, каждый их них позволяет выполнять собственно процедуру сжатия данных. Меньшая распространенность увеличивает вероятность ошибок в программе. К ним стоит относиться с некоторой осторожностью. Например, при проведении тестирования была найдена ошибка в архиваторе WinRK (PWCM), которую, однако, оперативно исправили.

Лабораторная работа №9

Тема: Создание архива данных. Извлечение данных из архива. Атрибуты файла и его объем

Цель: изучение принципов архивации файлов, функций и режимов работы наиболее распространенных архиваторов, приобретение практических навыков работы по созданию архивных файлов и извлечению файлов из архивов.

Теоретические сведения к лабораторной работе

Архивация предназначена для создания резервных копий используемых файлов, на случай потери или порчи по каким-либо причинам основной копии (невнимательность пользователя, повреждение магнитного диска, заражение вирусом и т.д.).

Для архивации используются специальные программы, архиваторы, осуществляющие упаковку и позволяющие уменьшать размер архива, по сравнению с оригиналом, примерно в два и более раз.

Архиваторы позволяют защищать созданные ими архивы паролем, сохранять и восстанавливать структуру подкаталогов, записывать большой архивный файл на несколько дисков (многотомный архив).

Сжиматься могут как один, так и несколько файлов, которые в сжатом виде помещаются в так называемый архивный файл или архив. Программы большого объема, распространяемые на дискетах, также находятся на них в виде архивов.

Архивный файл - это специальным образом организованный файл, содержащий в себе один или несколько файлов в сжатом или несжатом виде и служебную информацию об именах файлов, дате и времени их создания или модификации.

Выигрыш в размере архива достигается за счет замены часто встречающихся в файле последовательностей кодов на ссылки к первой обнаруженной последовательности и использования алгоритмов сжатия информации.

Степень сжатия зависит от используемой программы, метода сжатия и типа исходного файла. Наиболее хорошо сжимаются файлы графических образов, текстовые файлы и файлы данных, для которых степень сжатия может достигать 5 - 40%, меньше сжимаются файлы исполняемых программ и загрузочных модулей - 60 - 90%. Почти не сжимаются архивные файлы. Программы для архивации отличаются используемыми методами сжатия, что соответственно влияет на степень сжатия.

Для того чтобы воспользоваться информацией, запакованной в архив, необходимо архив раскрыть или распаковать. Это делается либо той же программой-архиватором, либо парной к ней программой-разархиватором.

Разархивация (распаковка) - процесс восстановления файлов из архива в первоначальном виде. При распаковке файлы извлекаются из архива и помещаются на диск или в оперативную память.

Самораспаковывающийся архивный файл - это загрузочный, исполняемый модуль, который способен к самостоятельной разархивации находящихся в нем файлов без использования программы-архиватора.

Самораспаковывающийся архив получил название SFX-архив (SelF-eXtracting). Архивы такого типа в обычно создаются в форме.ЕХЕ-файла.

Архиваторы, служащие для сжатия и хранения информации, обеспечивают представление в едином архивном файле одного или нескольких файлов, каждый из которых может быть при необходимости извлечен в первоначальном виде. В оглавлении архивного файла для каждого содержащегося в нем файла хранится следующая информация:

    • имя файла;

      сведения о каталоге, в котором содержится файл;

      дата и время последней модификации файла;

      размер файла на диске и в архиве;

      код циклического контроля для каждого файла, используемый для проверки целостности архива.

Архиваторы имеют следующие функциональные возможности :

    1. Уменьшение требуемого объема памяти для хранения файлов от 20% до 90% первоначального объема.

      Обновление в архиве только тех файлов, которые изменялись со времени их последнего занесения в архив, т.е. программа-упаковщик сама следит за изменениями, внесенными пользователем в архивируемые файлы, и помещает в архив только новые и измененные файлы.

      Объединение группы файлов с сохранением в архиве имен директорий с именами файлов, что позволяет при разархивации восстанавливать полную структуру директорий и файлов.

      Написания комментариев к архиву и файлам в архиве.

      Создание саморазархивируемых архивов, которые для извлечения файлов не требуют наличия самого архиватора.

      Создание многотомных архивов– последовательности архивных файлов. Многотомные архивы предназначены для архивации больших комплексов файлов на дискеты.

Содержание работы:

Задание №1.

    В операционной системе Windows создайте папку Archives по адресу С:\ТЕМР . Создайте папки Pictures и Documents по адресу С:\ТЕМР\Archives .

    Найдите и скопируйте в папку Pictures по два рисунка с расширением * .jpg и * .bmp .

    Сравните размеры файлов *.bmp и *.jpg . и запишите данные в таблицу_1.

    В папку Documents поместите файлы *.doc (не менее 3) и запишите их исходные размеры в таблицу_1.

Задание №2. Архивация файлов WinZip

    Запустите WinZip 7. ( Пуск →Все программы → 7-Zip→7 Zip File Manager ).

    С:\ТЕМР\Archives\Pictures. Зима. jpg . Выполните команду Добавить (+) .

    Введите имя архива в поле Архив Зима. zip и убедитесь, что в поле Формат архива установлен тип Zip .

    Установите в поле Режим изменения : добавить и заменить.

    В раскрывающемся списке Уровень сжатия: выберите пункт Нормальный. ОК .

    Сравните размер исходного файла с размером архивного файла. Данные запишите в таблицу_1.

    Создайте архив Зима1. zip , защищенный паролем. Для ввода пароля в диалоговом окне Добавит к архиву в поле Введите пароль: ведите пароль, в поле Повторите пароль: подтвердите пароль. Обратите внимание на флажок Показать пароль. Если он не установлен, пароль при вводе не будет отображаться на экране, а его символы будут заменены подстановочным символом "*". Это мера защиты пароля от посторонних. Однако в данном случае пользователь не может быть уверен в том, что он набрал пароль правильно. Поэтому при не установленном флажке система запрашивает повторный (контрольный) ввод пароля. Щелкните на кнопке ОК - начнется процесс создания защищенного архива.

    Выделите архив Зима1. zip , выполните команду Извлечь. В появившемся диалоговом окне Извлечь в поле Распаковать в: выберите папку-приемник - С:\ТЕМР\Archives\Pictures\Зима1\.

    Щелкните на кнопке ОК . Процесс извлечения данных из архива не запустится, а вместо него откроется диалоговое окно для ввода пароля.

    Убедитесь в том, что ввод неправильного пароля не позволяет извлечь файлы из архива.

    Убедитесь в том, что ввод правильного пароля действительно запускает процесс.

    Удалите созданный вами защищенный архив и извлеченные файлы.

    Создайте самораспаковывающийся ZIP-архив. Для этого установите курсор на имя архива Зима. zip , выполните команду Добавить (+).

    Введите имя архива в поле Архив Зима.7 z и убедитесь, что в поле Формат архива установлен тип 7 z .

    Установите в поле Режим изменения : добавить и заменить.

    Установите флажок Создать SFX -архив .

    В раскрывающемся списке Уровень сжатия: выберите пункт Нормальный. Запустите процесс архивации кнопкой ОК .

    bmp , Документ1. doc , Документ2. doc , Документ3. doc

Задание №3. Архивация файлов WinRar

    Запустите WinRar ( Пуск →Все программы → WinRar ).

    В появившемся диалоговом окне выберите папку, в которой будет создан архив: С:\ТЕМР\Archives\Pictures.

    Установите курсор на имя графического файла Зима. jpg .

    Выполните команду Добавить . В появившемся диалоговом окне введите имя архива Зима .rar . Выберите формат нового архива - RAR , метод сжатия - Обычный . Убедитесь, что в группе Параметры архивации ни в одном из окошечек нет флажков. Щелкните на кнопке ОК для создания архива. Во время архивации отображается окно со статистикой. По окончании архивации окно статистики исчезнет, а созданный архив станет текущим выделенным файлом.

    Аналогичным образом создайте архивы для файлов Рябина. bmp , Документ1. doc , Документ2. doc , Документ3. doc . Сравнительные характеристики исходных файлов и их архивов занести в таблицу_1.

    Создайте самораспаковывающийся RAR – архив, включающий в себя текстовые и графические файлы.

    Определите процент сжатия файлов и заполните таблицу_1. Процент сжатия определяется по формуле, где S– размер архивных файлов, So– размер исходных файлов.

Таблица _ 1

Архиваторы

Размер исходных файлов

WinZip

WinRar

Текстовые файлы:

1. Документ1. doc

2. Документ2. doc

3. Документ3. doc

Графические файлы:

1. Зима. jpg

92,5 КБ (94 810 байт)

2. Рябина. bmp

462 КБ (473 704 байт)

Процент сжатия текстовой информации (для всех файлов)

Процент сжатия графической информации (для всех файлов)

Задание №4. Ответить на вопросы:

Что называется архивацией?

    Для чего предназначена архивация ?

    Какой файл называется архивным?

    Что называется разархивацией ?

    Какая информации хранится в оглавлении архивного файла?

    Какие функциональные возможности имеют архиваторы?

Задание №5. Сделать вывод о проделанной лабораторной работе:

компьютерный файл сжатие архив

Следует различать собственно программу-архиватор, формат архивов и методы сжатия. Даже один и тот же метод сжатия может иметь варианты реализации. Например, существует более десятка программ-архиваторов, которые могут создавать архивы в формате ZIP. В свою очередь данные в формате ZIP могут быть сжаты различными методами: Deflate, Deflate64, BZip2. Метод Deflate имеет несколько реализаций с разной скоростью и степенью сжатия. С помощью этого метода архиватор 7-zip позволяет создавать архивы в формате ZIP и 7Z.

Обычно архиваторы могут создавать архивы в собственном эксклюзивном формате с использованием своих оригинальных методов. Например, архиватор RAR позволяет создавать архивы RAR. В формате архива и методах сжатия заключаются основные преимущества того или иного архиватора.

В простейшем случае архиватор позволяет только упаковать или распаковать один файл. Кроме собственно сжатия данных, современные архиваторы обеспечивают некоторые дополнительные функции. Можно выделить несколько основных:

Сжатие некоторых файлов и целых директорий;

Создание самораспаковывающихся (SFX) архивов. То есть для распаковки архива программа-архиватор не требуется;

Изменение содержимого архива;

Шифрование содержимого архива;

Информация для восстановления архива при частичном повреждении и возможность восстановления поврежденных архивов;

Разбивка архива на несколько частей или томов;

Консольная версия программы для работы из командной строки;

Графическая (GUI) версия программы.

Стоит отметить, что, несмотря на формальное наличие, реализация каждой дополнительной функции может быть выполнена на совершенно разном уровне.

Кроме различий в функциональности, можно разбить архиваторы на две группы: асимметричные и симметричные. Асимметричные архиваторы требуют для операции распаковки значительно меньше времени и оперативной памяти, чем для операции упаковки. Это позволяет быстро получать содержимое архива на маломощных компьютерах. Симметричные архиваторы требуют для операций упаковки и распаковки одинаковое время и объем оперативной памяти. Использование таких архиваторов на широком парке компьютеров или для оперативного доступа к содержимому архива ограничено. Известный архиватор RAR в качестве основного использует асимметричный словарный метод сжатия, а для текстов может использовать симметричный PPM-метод. Таким образом, распаковка архивов RAR, сжатых с максимальной степенью сжатия, может быть невозможна на компьютерах с ограниченным объемом оперативной памяти. Все или почти все передовые архиваторы с высокой степенью сжатия являются симметричными.

Несмотря на очень скромные данные о распространенности архиваторов, их существует большое множество. Основная масса относится к категории экспериментальных и архиваторов с ограниченной функциональностью. Тем не менее каждый их них позволяет выполнять собственно процедуру сжатия данных.

Рамотрим наиболее популярные программы-архиваторы:

1. WinRAR

Версия 2.90 Final

Поддерживаемые платформы: Windows, Linux, BeOS and DOS-32

WinRAR - 32-разрядная версия архиватора RAR для Windows. Помимо полной поддержки RAR и ZIP, WinRAR 2.90 может распаковывать UUE, GZ, TAR, ARJ, LZH, ACE, CAB, BZIP2, JAR (Java ARchive) и ACE 2.0 архивов. WinRAR имеет оригинальный алгоритм сжатия, обладающий высокими показателями коэффициента сжатия, особенно на исполняемых файлах, больших текстовых файлах и т.д. При этом количество входящих в архив сжатых файлов не ограничено.

Имеется поддержка ZIP-архивов; графический интерактивный интерфейс наряду с командной строкой. WinRAR предоставляет возможность создания solid-архивов, что дает выигрыш при архивировании большого количества файлов.

Возможно создание самораспаковывающихся (SFX), обычных и многотомных архивов. Доступны блокировка, шифрование, список порядка файлов, метки томов.

Также имеются дополнительные функции, например шифрование, добавление архивных комментариев, протоколирование ошибок и пр.

2. WinZip

Версия v8.1

Одна из самых популярных в Интернете программ. Сам ZIP-алгоритм свободно используется в десятках, если не в сотнях программ, и, тем не менее, для большинства пользователей Windows именно WinZIP служит стандартной программой для работы с архивами. WinZip прост в работе, имеет поддержку длинных имен и оптимизирован для работы в среде Windows.

WinZIP умеет просматривать и извлекать файлы из прочих, менее распространенных форматов архивов, таких как ARJ, LZH, ARC, TAR, TAZ, TGZ, Z, GZ, CAB, UUE, XXE, UU, B64, HQX, BHX. Есть функции инсталляции программ, экранных тем и скрин-сэйверов из архивов, выполнения многих операций через пошаговые Wizard"ы, сжатия и отправки файлов по почте, проверки содержимого архивов внешним антивирусом, управления закладками избранных архивных директорий, поддерживается возможность интеграции с Проводником Windows (добавление команд в контекстные меню). Имеются отдельные утилиты для работы из командной строки, интеграции с популярными Интернет-браузерами, создания самораспаковывающихся архивов.

WinZip имеет весьма удобную функцию автоматической инсталляции для программного продукта, распространяемого в виде Zip-файлов.

Для упрощенного архивирования/разархивирования файлов WinZip предлагает мастер-программу WinZip Wizard. Имеется возможность организации файлов в «любимые» папки (Favorite Zip Folders). WinZip позволяет организовать Zip-файлы в виде одного «листа», который помогает легче объединять и сортировать Zip-файлы независимо от того, где они физически хранятся. Функция поиска позволяет найти любые Zip-файлы, «потерянные» на жестком диске. Имеется возможность создавать саморазархивирующиеся файлы. WinZip можно настроить для работы с большинством современных антивирусных сканеров.

3. WaveZip

Версия 2.0

Программа разрабатывалась как средство для сжатия больших аудио WAV-файлов, которые занимают много места.

WaveZIP прост в работе и позволяет быстро находить, селектировать и конвертировать файлы. Поддерживается функция Drag-and-drop из Windows Explorer.

В программе реализована специальная технология MUSICompress от компании Soundspace Audio. Компрессия происходит абсолютно без потерь, алгоритмы оптимизированы именно под задачи сжатия WAV-формата (средняя степень сжатия в зависимости от типа файла достигает 30-60%).

4. WavPack

Версия 3.92

Поддерживаемые платформы: Win9x, WinNT, Mac

Консольный компрессор, специализирующийся на аудиосжатии. Предоставляет возможность упаковки/распаковки без потерь 16/24-битных моно- и стереофайлов в WAV-формате. WavPack показывает высокую скорость работы, обеспечивает 25-50-процентное сжатие поп-музыки и немного лучшее сжатие для классической музыки и композиций с широким динамическим диапазоном. Максимальный достижимый уровень упаковки - 87% (для периодов тишины). Предоставляется настраиваемый режим сжатия с потерями (до 67% с неслышимыми потерями и до 77% с заметным шумом), возможно сжатие «сырых» аудиофайлов неизвестных форматов, поддерживается быстрый режим упаковки, есть WinAMP-плагин для проигрывания сжатых WavPack"ом файлов.

5. PowerArchiver

Версия v7.02

Поддерживаемые платформы: Win9x, WinNT

Мощная многоформатная Windows GUI-оболочка, позволяющая работать с архивами в форматах ZIP, RAR, CAB, ARJ, LHA, ACE, ARC, TAR, BZIP2, TAR.BZ2, GZ, BH, ZOO, XXE, UUE. Помимо стандартных операций PowerArchiver может производить переименование файлов в архивах, инсталлировать из них программы, проверять содержимое на вирусы, конвертировать архивы из одного формата в другой, защищать их паролем, чинить, создавать многотомные и самораспаковывающиеся (SFX) архивы. Программа также позволяет своими средствами просматривать файлы TXT, RTF, BMP, ICO, GIF, WMF, EMF и JPG, распечатывать списки архивных файлов или экспортировать их в TXT- и HTML-форматах. Имеются средства управления списком быстрого доступа к часто используемым директориям, изменения внешнего вида кнопочной панели с помощью скинов, произведения операций резервирования данных с помощью скриптов, поиска обновлений программы в Интернете, создания отдельного архива для каждого сжимаемого файла.

PowerArchiver имеет удобный переключаемый интерфейс в стиле Office 2000 с подробной справочной системой и интегрируется с Проводником Windows, обеспечивая поддержку операций Drag & Drop и удобных контекстных меню.

6. ZipMagic

Версия 4.0

Поддерживаемые платформы: Win9x, WinNT

Компания Mijenix выпустила обновленную версию своей популярной программы ZipMagic. Цель программы - обеспечить возможность работать с архивами как с обыкновенными дисковыми папками. То есть все zip-файлы, имеющиеся на дисках, магическим образом «превращаются» в обычные директории. При этом ни Проводник, ни Norton Commander, ни любая другая программа не подозревают, что имеют дело с архивами. Пользователь может работать с псевдопапками: переименовывать их, запускать и инсталлировать из них программы, игры, просматривать, редактировать, копировать, переименовывать файлы, создавать и удалять поддиректории и т.д. ZipMagic незаметно будет производить операции сжатия/распаковки, причем значительно быстрее, чем большинство известных zip-упаковщиков.

В новой версии программы добавлена поддержка большинства новых форматов архивов и кодировок. Среди них: RC, ARJ, CAB, GZ, LHA/LZH, RAR, TAR, ZOO, UU/XXEncode и многие другие. При этом для работы с файлами этих форматов вам не понадобятся сами утилиты, создавшие их. Для работы с ними предназначена поставляемая с ZipMagic утилита ZipTools. Все вышеупомянутые типы файлов автоматически ассоциируются в реестре с этой утилитой и, естественно, ею и открываются.

ZipTools представляет собой некое подобие Проводника, с помощью которого можно выполнять все стандартные функции, присущие файл-менеджерам (копирование, перенос, переименование файлов, поддержка Drag&Drop, настройка панелей, сортировка, многооконность и т.п.), а также специфические функции типа UU-кодирования, конвертирования в ZIP, форматирования дисков, поиска файлов/компьютеров и тому подобное. Кроме того, ZipTools позволяет быстро просматривать более 60 форматов файлов/документов, в том числе мультимедийных, не выходя из программы.

В составе ZipMagic также поставляется утилита ZipWizard -- автоматизированное средство создания/конвертирования/распаковки архивов для новичков, предоставляющее для выполнения стандартных операций пошаговый упрощенный интерфейс.

Помимо этого с программой поставляются специальные zip-плагины для браузеров и e-mail. Первый -- ZipSurfer -- предназначен для работы в Netscape Navigator, Netscape Communicator и Internet Explorer и позволяет распаковывать, просматривать свежескачанные из Интернета архивы, инсталлировать из них программы и выполнять прочие операции с архивами, не выходя из браузера (нечто подобное имеется в известном WinZip).

Второй плагин -- ZipMail -- представляет собой дополнение к таким программам, как Eudora Light, Eudora Pro, Microsoft Exchange, Outlook 97 и Outlook 98.

В опциях ZipMagic можно изменить огромное количество параметров, среди которых имеются и специальные параметры Windows NT. Вы можете определить опции автозапуска программы, установить коэффициент сжатия, с которым файлы будут сжиматься при создании архива-папки, установить размер кэша программы, горячие клавиши, выбрать диски, для которых будут работать функции ZipMagic, определить время включения/отключения функций программы. Можно также определить, какие приложения все же будут рассматривать zip-архивы как файлы, а не как директории, например резервные и дисковые утилиты.

Достоинства и недостатки описанных программ можно представить в виде графических рисунков.




  • Сергей Савенков

    какой то “куцый” обзор… как будто спешили куда то