Удаление метеданных из файлов (WIndows, Linux).

Средний рейтинг
5 из 5 звезд. 2 голосов.
Мой рейтинг:

Всем привет.

Потребовали удалить из файлов метаданные, т.к. конфиденциальность и всё такое.

Метаданные — данные о файле. На примере Word или Excel:

кто создал файл,

когда создал файл,

и прочее…

с метаданнымипосле удаления метаданных

От этой информации надо избавиться. В Интернете есть куча материалов на этот счет, но меня интересует массовое удаление.

Поехали…

Для ОС Windows нашел скрипт на PowerShell.

сам скрипт

[свернуть]

Но у него есть особенность: у меня он стопорился на моменте, когда ему попадались «не составные файлы».

Я не нагуглил решение.

Процесс выполнения выглядит вот так:

Почему этот скрипт? Дело в том, что для Linux я нашел решение (ниже), но, к сожалению, с файлами doc (Word 1997-2003) не работает.

Но тут есть 2 особенности:

1. Версия PowerShell. Должна быть версия 4 и выше.

$PSVersionTable поможет узнать версию

2. Запрет на выполнение скриптов. По умолчанию политики запрещают исполнение скриптов PowerShell,

т.ч. надо их выключить вот такой командой — Set-ExecutionPolicy RemoteSigned, а после исполнения включить обратно (в целях безопасности) — Set-ExecutionPolicy Default.

Для Linux всё попроще.

Есть утилита MATMetadata Anonymisation Toolkit.

Supported formats

The following formats are supported: avi, bmp, css, epub/ncx, flac, gif, jpeg, m4a/mp2/mp3/…, mp4, odc/odf/odg/odi/odp/ods/odt/…, off/opus/oga/spx/…, pdf, png, ppm, pptx/xlsx/docx/…, svg/svgz/…, tar/tar.gz/tar.bz2/tar.xz/…, tiff, torrent, wav, wmv, zip, …

К сожалению, как я писал выше, версия mat2 не поддерживает старые версии word

.doc’s format (application/msword) is not supported

В отличии от mat не имеет GUI, но есть web-ui (я не пробовал устанавливать).

Установка в Linux проста:

или

После этого можно запускать.

Проверить файл на метаданные:

И получите огромный вывод (при наличии метаданных). Можно ограничить вывод:

Портянка будет чуть меньше.

Для удаления метаданных ввести:

После этого рядом появится файл с добавлением «cleaned».  Если копия не нужна, то надо добавить ключ —inplace

А для вывод информации ключ —verbose

Для массового удаления, достаточно просто перейти в каталог и выполнить команду без указания имени файла:

 

Ссылки:

Страница проекта.

Файлы для скачивания. | Версия 0.12.0.

Решение на PowerShell  | Сохраненная копия.

If you found an error, highlight it and press Shift + Enter or to inform us.

Фото аватара

Дмитрий

родился, учился, работаю-учусь

0 0 голоса
Рейтинг статьи
Подписаться
Уведомить о
guest
0 комментариев
Старые
Новые Популярные
Межтекстовые Отзывы
Посмотреть все комментарии