Страницы: 1
RSS
Поиск одинаковых по содержанию, но разных по размеру файлов.
 

Добрый день уважаемые форумчане.

Столкнулся с проблемой плагиата со стороны учащихся. На практических занятиях ребята должны выполнить элементарные задачи. Обнаружил что многие пристрастились к обману. Сидят уткнувшись в смартфоны, а потом, когда я отвернулся, за минуту выполняют задание и честно (ухмыляясь) глядя в глаза говорят что работа уже отправлена мне на проверку показывая решение (правда не могут объяснить что именно сделано - объяснить что значит тот или иной показатель). Формально да, сделано, но по факту это издевательство. Поймать за руку с флэшкой не удается.

Вычислить одинаковые по размеру файлы - не проблема, я так и делал, не засчитывая их работы. Но неожиданно для себя обнаружил что иногда попадаются файлы разного размера, но совершенно одинаковые по содержанию (вплоть до того что положение выделенной ячейки одинаково).

Кто-то стал хитрить: шрифты менять, рамками что-то выделять при том что основа та же (например генерация случайной выборки).

Есть какой то способ найти подобные дубликаты? (файлов много - порядка 200 по каждому занятию).

 
Задание должно содержать  пункт: создать книгу. При проверке  смотреть в свойствах, кто автор.
 
Доброе утро, спасибо за столь оперативный ответ.
Попробовал... Да, действительно можно, но с легкостью изменяются свойства документа и исправляется имя на новое.
Кроме того, машины на которых они "работают" расположены в институте, заточены под студентов и имеют ряд ограничений на установки.
Например, каждый раз приходится подключать плагин Data analysis. После перезагрузки удаляются все изменения и машины откатываются в свое базовое состояние.
Честно говоря, я не понимаю их рвение с которым они пытаются обмануть преподавателей. По мне так проще и быстрее сделать это задание, чем тратить время на поиск того же варианта, изменять шрифты, рисовать цветочки (типа внесено свое авторство). Случаи когда присылают пустые документы, в надежде что при большом количестве работ преподаватели поставят зачет автоматом по факту наличия документа без открытия его легко вычислить. Но вот выполненные работы... Вопиющие случаи (когда абсолютная ересь) да... запоминаются и я помню, что-то где то это было... начинаю просматривать предыдущие, а это очень долго.
По поводу размеров... так и не понял почему размер разный. К примеру... 3 файла. (Plag) - я добавил, чтобы им в нос ткнуть. Два файла одинаковых и по размеру и по сожержанию, а третий отличается.
Может быть... как вариант... попробовать сделать сводную таблицу. Туда отправить данные скажем с первой страницы всех книг студентов (более 200) определенный диапазон значений (Sheet1B2:D12). Затем автоматически сравнить и найти дубликаты? А уже потом просматривать эти дубликаты...
PS Поймите меня правильно, это не паскудство с моей стороны завалить студентов и сделать их жизнь сложной. Это дело принципа. Они медики будущие. Да и вообще теряются смыслы в образовании.
Изменено: Sanchovy - 20.02.2022 08:32:43
 
искать разности в таких файлах неблагодарное дело. способов обмануть ну просто великое множество
много лет назад увидела в сети задачку 2+2 = 5 (в эксель, пятью способами) она меня впечатлила способами обхода всего и вся в эксель. Можно еще белым шрифтом в ячейки ересь поставить. Можно значение ячейке присвоить а его видно не будет
ну и решая задачу в эксель мы часто обращаемся в сеть. Почему студентам нельзя? решение же дают верное? так и по жизни потом живем, со знаниями из интернета
 
Пускай не правильно, но сами. Вот в чем вопрос. Если будет ошибка, мы с ними разберем этот момент (на каждое решение я пишу комментарии студентам в Moodle). А тут - воровство.
 
Цитата
Наталия написал:
ну и решая задачу в эксель мы часто обращаемся в сеть. Почему студентам нельзя? решение же дают верное? так и по жизни потом живем, со знаниями из интернета
Не надо нести вот такую чушь. Я не против справочника из интернет или ..... но тема задача проверить не умение пользоваться поиском в сети, а усвоение материала.

Сам учился в Мат. школе. Методики проверки препода были может не совершенны, но давали результат. Была, так называемая тетрадь отказов, в которой каждый мог отметить что такое то задание домашнее не выполнил (не смог).  Это означало что не вызовут к доске, для разбора на эту задачу. но если начинал кто-то злоупотреблять отказами, то неприкосновенность снималась с него. Не знаю по чему, но у препода было мнение что я часто списываю, по тому что у доски порой запутывался в рассуждениях, хотя по факту списал только один раз, но списывал не тупо. а разобрался что к чему, и как раз меня он вызвал, но я был готов к ответу. Мнение что я списываю у препода не изменилось до самого выпуска, но мне  на это и тогда было наплевать и сейчас я благодарен ему за то, что он научил нас мыслить, работать, искать решения, и вся его система проверок, контрольных , самостоятельных , зачетов .... была направлена на то, чтоб у нас в голове остались знания.

Цитата
Sanchovy написал:
PS Поймите меня правильно, это не паскудство с моей стороны завалить студентов и сделать их жизнь сложной. Это дело принципа. Они медики будущие.
Тут вопрос творческий. Зачем медику Excel??? это из разряда необязательных знаний , которые могут и не быть востребованными никогда. Другое дело пояснить им, что никто не знает что им потребуется завтра.... Другое дело что такие дисциплины б сделать факультативными, но боюсь что большая часть просто забьёт на них, что будет аналогично списыванию, копированию ...

Что касаемо сравнения. Да, даже тут мы демонстрируем разные подходы к решению тех или иных задач, но часто они не отличаются, по этому полное совпадение так же не означает, что сделано не самостоятельно.
По вопросам из тем форума, личку не читаю.
 
Цитата
написал:
Не надо нести вот такую чушь
не уловили Вы сарказма, ну да ладно ;)

а научить думать, если человек не хочет этому учится, ну капец как трудно
Как заставить людей хотеть получать знания, думать? Особенно если привыкли работать и не думать, что сказали то на бумажке записали, эту последовательность и исполняем ;(
тоже интересно, КАК это можно воплотить, причем среди уже взрослых людей
 
Цитата
Наталия написал:
не уловили Вы сарказма,
да, видимо не уловил.
По вопросам из тем форума, личку не читаю.
 
Excel используется для объяснения статистических методов анализа биомедицинских данных - их основ. Используется именно он, поскольку специальные программы и стоят дорого и ничему не обучают, кроме как галочки расставлять и получать на выходе нечто. А в Excel они по крайней мере могут проследить канву событий анализа. Стат программы все таки для специалистов, когда человек понимают что к чему. Кроме того Statistica, главным образом используется в России. На R - просто физически времени нет, часы сокращают до минимума.
 
Макросы разрешены?
После ввода ответа в ячейку фиксируется где-либо номер рабочего места, адрес ячейки, время, сам ответ... При этом нет необходимости проверять каждую книгу - ответы всех собираются в одной таблице.
 
Sanchovy — по-моему всё гораздо проще: если файл есть, а школоло не может объяснить, как он его делал, то это неуд без разбирательств

    Развязывать гонку цифровых "вооружений" со школьниками — заранее проигрышный вариант; если нет возможности однозначно и надёжно устранить копипаст (а он вряд ли есть), то коллективный интеллект (даже из преимущественно недалёких особей) всегда выиграет  :D
    Также, с каждой ИХ победой, ВАШ авторитет будет падать всё ниже и ниже (и довольно быстро) — в итоге вы просто перестанете контролировать класс, пойдут шутки, мемы про "цифрового маньяка-препода", которго только ленивый обмануть не может и так далее

Раньше хоть при списывании что-то могли запомнить, а уж тупой копипаст без реального контроля усваивания — это вообще мрак (привет, ЕГЭ)
Изменено: Jack Famous - 21.02.2022 09:39:31
Во всех делах очень полезно периодически ставить знак вопроса к тому, что вы с давних пор считали не требующим доказательств (Бертран Рассел) ►Благодарности сюда◄
 
Правильнее всего контролировать на уровне ввода данных.
Т.е. человек решает задачу в шаблонном файле. Но.
1. Шаблон может быть запущен только с разрешенными макросами.
2. Шаблон отслеживает решение каждой задачи с фиксированием времени.
3. По окончании решения задачи отправка файла осуществляется кнопкой, которая в свою очередь фиксирует и время, и логин и можно еще какие-то метки придумать, главное, чтобы они были минимально отслеживаемые извне и уж точно не самые распространенные.
4. Должен быть мастер-файл, который будет собираться инфо по всем отправленным файлам. Если что-то не соответствует нужным меткам - повод проверить тщательнее такой файл.
Да, придется постараться, но результат от этого будет больше, чем проверка по размеру.
Даже самый простой вопрос можно превратить в огромную проблему. Достаточно не уметь формулировать вопросы...
 
Цитата
Дмитрий(The_Prist) Щербаков: Да, придется постараться
а школьники создадут тему в платной ветке, скинутся и им местные мастера создадут бота, котрый всё это будет легко обходить и пятёрки за четверть сразу ставить  :D
Не сработает всё это, я тебе точно говорю — только "расскажи, как ты это сделал", только хардкор  8)
Изменено: Jack Famous - 21.02.2022 11:53:42
Во всех делах очень полезно периодически ставить знак вопроса к тому, что вы с давних пор считали не требующим доказательств (Бертран Рассел) ►Благодарности сюда◄
 
Цитата
Jack Famous написал:
скинутся и им местные мастера создадут бота, котрый всё это будет легко обходить
нет, если подойти с умом. Например, в каждом новом задании менять привязку меток. Сегодня одна, завтра другая и т.д. Например делать некую шифровку по имени пользователя, дате, имени файла, именованного диапазона в книге(скрытого), но каждый день менять комбинацию этой привязки + контрольное слово для шифра каждый день новое. Заранее узнать какое слово и связка меток будут именно сегодня будет практически нереально, а следовательно неизвестно что именно делать боту и как пытаться расшифровать. Скидываться каждый день будет невыгодно и к тому же - далеко не всегда удачно(ведь время на выполнение задания тоже дается ограниченное). Да, это замороченно. Но это будет работать, если подойти с фантазией :)
Цитата
Jack Famous написал:
только "расскажи, как ты это сделал",
если подобные задания делаются хотя бы через день - то представь попробуй сколько на это времени должно уйти в группе из 30-ти(хотя бы человек) :) При таком подходе проще уж плюнуть на затею вовсе, чем объяснения по решению от каждого выслушивать.
Изменено: Дмитрий(The_Prist) Щербаков - 21.02.2022 12:19:18
Даже самый простой вопрос можно превратить в огромную проблему. Достаточно не уметь формулировать вопросы...
 
Дмитрий(The_Prist) Щербаков, и снова я с тобой соглашусь  :)  — идея с "плавающим" ключом мне очень понравилась
Можно один раз грамотно разработать интерфейс и админу (преподавателю) останется только обновлять ключ. Один раз ввести в диалоговом окне  :idea:

Цитата
Дмитрий(The_Prist) Щербаков: представь попробуй сколько на это времени должно уйти в группе из 30-ти(хотя бы человек)
[хотя бы человек :D ] ну, как правило, не всех нужно спрашивать (преподаватель знает, кого) и это число слабых уже может быть в разы меньше полного состава
    И даже из этих совсем необязательно спрашивать всех, ведь кого спросят, а кого нет — решать великому рандому (вместе со статистикой преподавателя). Всё также, как и раньше с вызовом к доске, только немного по-новому  ;)

Модераторам (название темы):
Форма-тест для учеников с гарантией ручного заполнения (без копипаста)
Изменено: Jack Famous - 21.02.2022 12:51:43
Во всех делах очень полезно периодически ставить знак вопроса к тому, что вы с давних пор считали не требующим доказательств (Бертран Рассел) ►Благодарности сюда◄
 
Цитата
Jack Famous написал:
Всё также, как и раньше с вызовом к доске
так как я понял этого и хочет избежать ТС, т.к. такая практика ведется у него сейчас и она его не устраивает :)
Цитата
Sanchovy написал:
(правда не могут объяснить что именно сделано - объяснить что значит тот или иной показатель). Формально да, сделано, но по факту это издевательство. Поймать за руку с флэшкой не удается.
Даже самый простой вопрос можно превратить в огромную проблему. Достаточно не уметь формулировать вопросы...
 
Цитата
Дмитрий(The_Prist) Щербаков написал:
Т.е. человек решает задачу в шаблонном файле
А я бы сделал наоборот — каждому свой уникальный файл (без каких-либо макросов), в котором чуть-чуть изменено одно исходное значение.
Соответственно, результат будет тоже несущественно отличаться (например, результат будет не у всех равен 55, а окажется в диапазоне 55,1 ... 55,6)

На компе преподавателя а файле пишем простенький макрос из 10 строк кода, который
- в цикле перебирает список студентов из 200 записей, и для каждого создаёт копию исходного шаблонного файла,
сохраняя этот файл под именем ФИО_студента.xlsx
- в созданной копии увеличивает одно исходное значение на 0,01*индекс студента
(например, меняем 1142 на 1142.005 для пятого студента)

Все эти 200 файлов оказываются в одной общей папке, студент перед началом работы открывает свой файл, делает в нем работу, сохраняет
(даже никуда файл этот студенту высылать не надо по окончании работы)
Ну а проверочный скрипт проверяет:
1. уникальность исходного значения в заданной ячейке (1142.001, 1142.002, 1142.005 и т.д.)
2. уникальность результата (55.116, 55.123 и т.д.)
3. правильность результата - соответствие результата диапазону 55,1 ... 55,6

В этом случае у студентов не получится скопипастить ни исходные данные, ни решение.
 
Игорь, идея хорошая, но не всегда прокатит
    Получается, либо преподу надо все варианты просчитать (потому что изменение исходного значения может ни хрена ни линейно сказаться на ответе, ведь это НЕ Ответ = Дано +4), либо этот уникальный коэффициент влияет на ответ в самом конце и тогда мы понимаем что ответ ученика = ответ + коэфициент ученика

Надо докручивать идею, я думаю  :)
Изменено: Jack Famous - 22.02.2022 11:14:11
Во всех делах очень полезно периодически ставить знак вопроса к тому, что вы с давних пор считали не требующим доказательств (Бертран Рассел) ►Благодарности сюда◄
 
Sanchovy,   Повесьте на каждом файле-задании баннер с надписью о том, что любой вариант ответа созданный не своим умом обманывает не преподавателя, а их будущее.  Можно конечно для медиков расписать до более низменного, мол если у вас самих не получается при занятии сексом, то не лучший выбор звать на помощь друзей на помощь..... результат может вас еще больше расстроить.
По вопросам из тем форума, личку не читаю.
 
Всем спасибо за участие!
 
Добрый вечер.
Разработал процедуру, правда несколько кривую, поиска одинаковых по содержанию файлов, но разных по размеру и с разными названиями.
Может быть кому-то пригодится... Не ругайте за примитивизм. Все делал в Total Commander.
1. Собрал все работы в одну папку.
2. Изменил расширение файлов с *.xlsx на *.rar (для доступа к метаданным).
3. Произвел поиск дубликатов в архивах, по содержанию и с текстом coreProperties
Компьютер после секундного обдумывания выдает сгруппированные файлы core.xml из папок docProps внутри архивов.
Остается скопировать названия архивов.
Получается быстро и эффективно. Обнаружил что уже в проверенных работах (не доглядел) есть шесть групп дубляжей.
Теперь столкнулся с морально-этическими проблемами.
Понятно, что вторая работа - это скопированная работа (но не факт). Ее можно не засчитывать. Но как быть с первой? С одной стороны надо бы поощрять такие качества как взаимовыручка и помощь. С другой стороны... можно дополнительно пристыдить списывающего, пускай несет моральную ответственность за то что подводит не только себя, но и своего товарища...
Что думаете?
Александр
Страницы: 1
Наверх