Выбрать дату в календареВыбрать дату в календаре

Страницы: 1
Поиск одинаковых по содержанию, но разных по размеру файлов.
 
Добрый вечер.
Разработал процедуру, правда несколько кривую, поиска одинаковых по содержанию файлов, но разных по размеру и с разными названиями.
Может быть кому-то пригодится... Не ругайте за примитивизм. Все делал в Total Commander.
1. Собрал все работы в одну папку.
2. Изменил расширение файлов с *.xlsx на *.rar (для доступа к метаданным).
3. Произвел поиск дубликатов в архивах, по содержанию и с текстом coreProperties
Компьютер после секундного обдумывания выдает сгруппированные файлы core.xml из папок docProps внутри архивов.
Остается скопировать названия архивов.
Получается быстро и эффективно. Обнаружил что уже в проверенных работах (не доглядел) есть шесть групп дубляжей.
Теперь столкнулся с морально-этическими проблемами.
Понятно, что вторая работа - это скопированная работа (но не факт). Ее можно не засчитывать. Но как быть с первой? С одной стороны надо бы поощрять такие качества как взаимовыручка и помощь. С другой стороны... можно дополнительно пристыдить списывающего, пускай несет моральную ответственность за то что подводит не только себя, но и своего товарища...
Что думаете?
Александр
Поиск одинаковых по содержанию, но разных по размеру файлов.
 
Всем спасибо за участие!
Поиск одинаковых по содержанию, но разных по размеру файлов.
 
Excel используется для объяснения статистических методов анализа биомедицинских данных - их основ. Используется именно он, поскольку специальные программы и стоят дорого и ничему не обучают, кроме как галочки расставлять и получать на выходе нечто. А в Excel они по крайней мере могут проследить канву событий анализа. Стат программы все таки для специалистов, когда человек понимают что к чему. Кроме того Statistica, главным образом используется в России. На R - просто физически времени нет, часы сокращают до минимума.
Поиск одинаковых по содержанию, но разных по размеру файлов.
 
Пускай не правильно, но сами. Вот в чем вопрос. Если будет ошибка, мы с ними разберем этот момент (на каждое решение я пишу комментарии студентам в Moodle). А тут - воровство.
Поиск одинаковых по содержанию, но разных по размеру файлов.
 
Доброе утро, спасибо за столь оперативный ответ.
Попробовал... Да, действительно можно, но с легкостью изменяются свойства документа и исправляется имя на новое.
Кроме того, машины на которых они "работают" расположены в институте, заточены под студентов и имеют ряд ограничений на установки.
Например, каждый раз приходится подключать плагин Data analysis. После перезагрузки удаляются все изменения и машины откатываются в свое базовое состояние.
Честно говоря, я не понимаю их рвение с которым они пытаются обмануть преподавателей. По мне так проще и быстрее сделать это задание, чем тратить время на поиск того же варианта, изменять шрифты, рисовать цветочки (типа внесено свое авторство). Случаи когда присылают пустые документы, в надежде что при большом количестве работ преподаватели поставят зачет автоматом по факту наличия документа без открытия его легко вычислить. Но вот выполненные работы... Вопиющие случаи (когда абсолютная ересь) да... запоминаются и я помню, что-то где то это было... начинаю просматривать предыдущие, а это очень долго.
По поводу размеров... так и не понял почему размер разный. К примеру... 3 файла. (Plag) - я добавил, чтобы им в нос ткнуть. Два файла одинаковых и по размеру и по сожержанию, а третий отличается.
Может быть... как вариант... попробовать сделать сводную таблицу. Туда отправить данные скажем с первой страницы всех книг студентов (более 200) определенный диапазон значений (Sheet1B2:D12). Затем автоматически сравнить и найти дубликаты? А уже потом просматривать эти дубликаты...
PS Поймите меня правильно, это не паскудство с моей стороны завалить студентов и сделать их жизнь сложной. Это дело принципа. Они медики будущие. Да и вообще теряются смыслы в образовании.
Изменено: Sanchovy - 20.02.2022 08:32:43
Поиск одинаковых по содержанию, но разных по размеру файлов.
 

Добрый день уважаемые форумчане.

Столкнулся с проблемой плагиата со стороны учащихся. На практических занятиях ребята должны выполнить элементарные задачи. Обнаружил что многие пристрастились к обману. Сидят уткнувшись в смартфоны, а потом, когда я отвернулся, за минуту выполняют задание и честно (ухмыляясь) глядя в глаза говорят что работа уже отправлена мне на проверку показывая решение (правда не могут объяснить что именно сделано - объяснить что значит тот или иной показатель). Формально да, сделано, но по факту это издевательство. Поймать за руку с флэшкой не удается.

Вычислить одинаковые по размеру файлы - не проблема, я так и делал, не засчитывая их работы. Но неожиданно для себя обнаружил что иногда попадаются файлы разного размера, но совершенно одинаковые по содержанию (вплоть до того что положение выделенной ячейки одинаково).

Кто-то стал хитрить: шрифты менять, рамками что-то выделять при том что основа та же (например генерация случайной выборки).

Есть какой то способ найти подобные дубликаты? (файлов много - порядка 200 по каждому занятию).

Страницы: 1
Наверх