ОБ АВТОРЕ

Окончил факультет журналистики БГУ.

Работал в специализированных изданиях «Отдых и путешествия» и «Мобила», был штатным корреспондентом портала Open.by.

Внештатно сотрудничает с интернет-порталами TUT.by и CityDog.by, газетой «Аргументы и факты» и журналом «OnAir».

Автор и соавтор нескольких энциклопедий и путеводителей.

Активный блогер и краевед. 

Вы здесь

Как сравнить два текста

Бывает так, что у вас есть два почти одинаковых текста, и вам нужно четко видеть, чем именно они отличаются. Распространенный пример: вы «сняли» с диктофона интервью и отправили требовательному собеседнику на вычитку. А тот, вместо того чтобы цветом выделить свои правки, просто вырезал некоторые фразы, дописал новые, поменял местами абзацы.

В результате вы читаете вроде бы свое же интервью, но не узнаете его «в гриме». Сличать вручную два больших текста сложно – можно ли облегчить эту задачу? Mediakritika.by подскажет, как.

Такие задачи достаточно часто встают перед программистами, поэтому программы для сравнения файлов умеют подсвечивать синтаксис при сравнении программных кодов различных языков программирования. Нам же нужно, чтобы такие программы позволяли сравнивать тексты в обычном формате .txt и желательно – в «вордовском».

Для сравнения мы взяли несколько абзацев нашей статьи про диктофоны и заменили некоторые слова, поменяли местами фразы. Сейчас будем сравнивать.

 

Microsoft Word

В программе Microsoft Office начиная с версии 2007 сравнить два файла можно, не выходя из «ворда». Идем в пункт меню Рецензирование – Сравнить – Сравнить… (сравнение двух версий документа). Указываем два файла, жмем кнопку «Больше» и отмечаем параметры, по которым нужно сравнить текст, а также выбираем, где просматривать изменения: в первом файле, во втором или в новом.

 

Удаленный текст программа выделяет красным зачеркнутым текстом, вставленный текст – красным подчеркнутым, перемещенные абзацы – зеленым. В отдельной панели слева (на скриншоте ниже ее нет) можно отследить изменения по каждому слову, а также увидеть резюме: в нашем случае 57 исправлений, из них 26 вставок, 29 удалений, 2 перемещения.

 

WinMerge

WinMerge – это бесплатная кроссплатформенная утилита для сравнения файлов, ее можно использовать на богатом «зоопарке» операционных систем, начиная с Windows 98. Последняя версия – WinMerge 2.14.0 – существует как в виде инсталлятора (6,14 Мб), так и в виде портативной сборки. Программа «из коробки» может сравнивать только обычные текстовые файлы, а если мы хотим работать также с офисными документами (тексты в форматах .doc, .docx, .odt, таблицы в форматах .xls, .xlsx, .sxc, PDF-файлы и другие офисные файлы экзотических форматов), надо скачать плагин Xdocdiff. Подключается плагин следующим образом:

1) Распаковываем архив с плагином

2) Файлы xdoc2txt.exe и zlib.dll копируем в папку с установленной программой WinMerge

3) Папку MergePlugins вместе с файлом amb_xdocdiffPlugin.dll копируем целиком в папку с установленной программой WinMerge

4) Запускаем WinMerge, идем в меню Дополнения – Список, ставим галочку «Включить дополнения»

5) Идем в меню Дополнения – ставим галочку «Распаковка автоматически»

Все, теперь можно открывать два наших файла: хочешь - обычные «тээкстэшные», хочешь – «вордовские».

Программа вас предупредит, что вы сможете также указывать заархивированные файлы, но для этого придется скачать плагин-архиватор. Впрочем, его отсутствие нам не страшно, отказываемся от будущих подобных уведомлений и получаем окно с нашими двумя текстами. В левой части окна – две длинные колонки: это миниатюры наших текстов. Желтым цветом выделены абзацы, в которых нашлись изменения. Поскольку в каждом из трех абзацев нашего исходного текста нашлись такие изменения, то обе колонки закрашены желтым. Конкретные измененные слова подсвечены светло-желтым.

Но у программы есть множество настроек, так что несложно подсветить слова каким-нибудь другим цветом.

Дальше можно переходить на каждое измененное слово или на следующий абзац с изменениями, копировать изменения из одного окна в другое и проводить другую редакторскую работу.

Программ для сравнения файлов, в том числе текстовых, немало, их основной недостаток – цена. Compare it! стоит 29$ за лицензию, Beyond Compare – 30$, Compare Suite - 70$, DiffDoc Professional - аж 399,95$. Посмотрим на примере этой последней, самой дорогой программы, насколько она лучше бесплатной WinMerge.

Скачиваем программу (7 мб), запускаем. Результат очень похож на тот, что нам выдал Microsoft Office 2007, только расположение колонок иное. Красный зачеркнутый – текст, который изменили, красный подчеркнутый – текст, на который был изменен исходный (красный зачеркнутый); синий зачеркнутый – вырезанный текст, зеленый – перемещенный (или добавленный «с нуля») текст.

Получается, что разницы практически нет. Если уж пользователь честно купил дорогой офисный пакет Microsoft, то тратить еще 400 долларов на официальную покупку и регистрацию этой программы смысла нет никакого. Даже «триальной» версией нет нужды пользоваться, если тот же самый функционал обеспечивает стандартный «Ворд», тем более что незарегистрированная версия DiffDoc Professional каждые 15 минут напоминает о необходимости покупки.

Наконец, проверим один из множества онлайн-сервисов для сличения текстов: DiffNow

Сервис вроде бы поддерживает загрузку doc-файлов, «проглотил» их, написал Files compared successfully («сравнение файлов прошло успешно»), но вместо нормального результата выдал бинарный набор нолей и единиц, в котором, правда, подсветил отличия. Поэтому лучше копировать и вставлять текст вручную. Сайт подсвечивает изменения так: коричневый – измененный текст, синий – удаленный, бордовый – добавленный, фиолетовый – измененные слова в измененных предложениях. Сервис поддерживает различные настройки (в том числе можно заменять цвета), но от одного недостатка мы никакими настройками избавиться не смогли: текст по-программистски вытянут в длину, приходится задействовать горизонтальный скроллинг.

Оценить материал:
5
Средняя: 5 (1 оценка)
распечатать Обсудить в: