Удаление метеданных из файлов (WIndows, Linux).

Средний рейтинг
Еще нет оценок
Мой рейтинг:

Всем привет.

Потребовали удалить из файлов метаданные, т.к. конфиденциальность и всё такое.

Метаданные – данные о файле. На примере Word или Excel:

кто создал файл,

когда создал файл,

и прочее…

mat,windows,linux,metadata mat,windows,linux,metadata
с метаданными после удаления метаданных

От этой информации надо избавиться. В Интернете есть куча материалов на этот счет, но меня интересует массовое удаление.

Поехали…

Для ОС Windows нашел скрипт на PowerShell.

сам скрипт

[свернуть]

Но у него есть особенность: у меня он стопорился на моменте, когда ему попадались “не составные файлы”.

mat,windows,linux,metadata

Я не нагуглил решение.

Процесс выполнения выглядит вот так:

mat,windows,linux,metadata

Почему этот скрипт? Дело в том, что для Linux я нашел решение (ниже), но, к сожалению, с файлами doc (Word 1997-2003) не работает.

Но тут есть 2 особенности:

1. Версия PowerShell. Должна быть версия 4 и выше.

$PSVersionTable поможет узнать версию

mat,windows,linux,metadata

2. Запрет на выполнение скриптов. По умолчанию политики запрещают исполнение скриптов PowerShell,

mat,windows,linux,metadata

т.ч. надо их выключить вот такой командой – Set-ExecutionPolicy RemoteSigned, а после исполнения включить обратно (в целях безопасности) – Set-ExecutionPolicy Default.

Для Linux всё попроще.

Есть утилита MATMetadata Anonymisation Toolkit.

Supported formats

The following formats are supported: avi, bmp, css, epub/ncx, flac, gif, jpeg, m4a/mp2/mp3/…, mp4, odc/odf/odg/odi/odp/ods/odt/…, off/opus/oga/spx/…, pdf, png, ppm, pptx/xlsx/docx/…, svg/svgz/…, tar/tar.gz/tar.bz2/tar.xz/…, tiff, torrent, wav, wmv, zip, …

К сожалению, как я писал выше, версия mat2 не поддерживает старые версии word

.doc’s format (application/msword) is not supported

В отличии от mat не имеет GUI, но есть web-ui (я не пробовал устанавливать).

Установка в Linux проста:

или

После этого можно запускать.

Проверить файл на метаданные:

И получите огромный вывод (при наличии метаданных). Можно ограничить вывод:

Портянка будет чуть меньше.

Для удаления метаданных ввести:

После этого рядом появится файл с добавлением “cleaned”.  Если копия не нужна, то надо добавить ключ –inplace

А для вывод информации ключ –verbose

Для массового удаления, достаточно просто перейти в каталог и выполнить команду без указания имени файла:

 

Ссылки:

Страница проекта.

Файлы для скачивания. | Версия 0.12.0.

Решение на PowerShell  | Сохраненная копия.

If you found an error, highlight it and press Shift + Enter or to inform us.

Средний рейтинг
Еще нет оценок
Мой рейтинг:

Дмитрий

родился, учился, работаю-учусь

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *

12 − шесть =

Пожалуйста, подтвердите человечность * Лимит времени истёк. Пожалуйста, перезагрузите CAPTCHA.