Разработал процедуру, правда несколько кривую, поиска одинаковых по содержанию файлов, но разных по размеру и с разными названиями.
Может быть кому-то пригодится... Не ругайте за примитивизм. Все делал в Total Commander.
1. Собрал все работы в одну папку.
2. Изменил расширение файлов с *.xlsx на *.rar (для доступа к метаданным).
3. Произвел поиск дубликатов в архивах, по содержанию и с текстом coreProperties
Компьютер после секундного обдумывания выдает сгруппированные файлы core.xml из папок docProps внутри архивов.
Остается скопировать названия архивов.
Получается быстро и эффективно. Обнаружил что уже в проверенных работах (не доглядел) есть шесть групп дубляжей.
Теперь столкнулся с морально-этическими проблемами.
Понятно, что вторая работа - это скопированная работа (но не факт). Ее можно не засчитывать. Но как быть с первой? С одной стороны надо бы поощрять такие качества как взаимовыручка и помощь. С другой стороны... можно дополнительно пристыдить списывающего, пускай несет моральную ответственность за то что подводит не только себя, но и своего товарища...
Что думаете?
Александр