Удаление дубликатов с условием

Пользователь

Сообщений: 51 Регистрация: 18.02.2013

16.09.2013 15:22:39

Добрый день!
Прошу помочь в следующей задачке. Необходимо удалить дубликаты, вернее необходимо удалить обе строчки, если они задваиваются, но с условием, что в одной из строчек есть фраза неявка. Пример того что есть, и того что должно быть во вложении.
Буду благодарен за помощь.

Прикрепленные файлы

удаление дубликатов.xlsx (11.25 КБ)

Z Пользователь Сообщений: 6111 Регистрация: 21.12.2012 Win 10, MSO 2013 SP1	#2 16.09.2013 15:59:00 А почему сразу в теме не оговариваете условие, что "Необходимо, что бы макрос..." - это в файле?!! *"Ctrl+S" - достойное завершение ваших гениальных мыслей!.. ;)*

nikguard

Пользователь

Сообщений: 51 Регистрация: 18.02.2013

16.09.2013 16:01:23

Прошу прощения

Необходимо, что бы макрос, провел проверку на всем листе и удалил задвоенных сотрудников - дубликаты (по столбцу A:H, но, что бы в строчке I, у одного из дубликатов стояла неявка. т.е. нужно удалить строчки 2 и 7, 3 и 8, 4 и 9 и т.д. Оставить строчки 12 и 13.) Номера групп могут быть совершенно любыми (не стоит привязываться к красивым числам

)

futurama3000 Пользователь Сообщений: 264 Регистрация: 01.01.1970	#4 16.09.2013 16:06:58 см.ПРИЕМЫ - выбор уникальных значений + добавить к выборке проверку по столбцу I

nikguard Пользователь Сообщений: 51 Регистрация: 18.02.2013	#5 23.09.2013 10:10:12 Спасибо за вектор, попробую сделать

nikguard

Пользователь

Сообщений: 51 Регистрация: 18.02.2013

01.10.2013 12:40:34

Файл к которому необходимо сделать выборку - порядка 100 тыс строк, и столбцы от A до J
Решил не заморачиваться над неявкой, и просто удалить идентичные строки. Для этого, в столбце K использовал формулу СЦЕПИТЬ, а в столбце L формулу =ЕСЛИ(СЧЁТЕСЛИ(B$1:B2;B2)=1;МАКС(A$1:A1)+1;"")
Но, т.к. данных много - Ексель уходит в аут.
Могли бы что нибудь порекомендовать?

Юрий М Модератор Сообщений: 61089 Регистрация: 14.09.2012 Контакты см. в профиле	#7 01.10.2013 12:45:08 Поручить эту работу макросу. Подобные темы уже были.

Hugo

Пользователь

Сообщений: 26336 Регистрация: 22.12.2012

01.10.2013 12:59:36

Некогда всё продумывать и делать (да и не интересно), но думаю чтоб сэкономить память, я бы сперва создал два словаря, чтоб создать номера/ID для "Должность" и "Тренинг", а может заодно и для "ГОСБ", если там адреса часто повторяются.
Тогда строку
фамилия имя отчество|06.01.1989|очень длинная должность|очень длинное название|название местоположения|1234567890|2.00|13-88-11111
можно сократить до
фамилия имя отчество|06.01.1989|3|4|5|1234567890|2.00|13-88-11111
что думаю должно сказаться на 100к строк.
По "неявка" детали не понял - какой там критерий отбора...

Изменено: Hugo - 01.10.2013 13:02:24

nikguard

Пользователь

Сообщений: 51 Регистрация: 18.02.2013

01.10.2013 15:00:04

в общем, задача свелась к следующей:
Необходимо из всех данных необходимо оставить только уникальные строки, т.е. если строка повторяется, то нужно удалить не только дубликаты, но и саму строку. Сложность в том, что всего около 100к строк и порядка 10 столбцов.
с айди вряд-ли получится, очень часто делается выгрузка, и из этих данных формируется сводная таблица.

nikguard Пользователь Сообщений: 51 Регистрация: 18.02.2013	#10 01.10.2013 15:01:29 Юрий, ищу, но не могу найти. Вопросов много подобных обсуждалось, но не могу найти про макросы, рабочие.

Юрий М Модератор Сообщений: 61089 Регистрация: 14.09.2012 Контакты см. в профиле	#11 01.10.2013 15:03:04 Странно, что Вам попадаются только нерабочие макросы))

nikguard

Пользователь

Сообщений: 51 Регистрация: 18.02.2013

#12

01.10.2013 15:19:53

Юрий, дело не в работе самих макросов, а в том, что они не совсем подходят к моему варианту. Макросы которые я видел, либо переносят уникальные (сходно с функцией удалить дубликаты) значения на новый лист. Либо работают с одной колонкой. и очень много ссылок на приемы, где подробно рассказывают, как удалить дубликаты, без исходной строки.

Изменено: nikguard - 01.10.2013 15:23:18

Юрий М Модератор Сообщений: 61089 Регистрация: 14.09.2012 Контакты см. в профиле	#13 01.10.2013 15:24:27 Игорь (Hugo) неоднократно показывал варианты для нескольких столбцов. Вкратце суть такова: заносятся в массив сцепленные данные из нужных столбцов, и там уже сравниваются.

Hugo

Пользователь

Сообщений: 26336 Регистрация: 22.12.2012

#14

01.10.2013 16:42:08

Вот как раз нужен тот, который "переносит" на новый лист, но на массиве.
Набрали массив, удалили всё в исходном листе, выгрузили собранное. Если уж так совсем не подходит новая книга с результатом.
Хотя конечно то, что нужны только те строки, которые не повторяются - усложняет алгоритм. Придётся все 100к перебирать по два раза...
Но делал - собираем в словарь ключ с номером строки. Если повтор ключа - номер строки обнуляем.
Чтоб сэкономить память - в конце пробегаемся по ключам и считаем количество оставшихся строк, создаём именно такой массив.
Затем ещё раз пробегаемся по ключам и уже копируем нужные строки.
А про ID вы не поняли - создаём с помощью 3-х других словарей свои ID для этих значений.
Но если памяти хватит для работы и без этого выверта - то и ладно. Не хватит - можно пробовать так подсократить её расход.

nikguard Пользователь Сообщений: 51 Регистрация: 18.02.2013	#15 01.10.2013 17:09:24 Игорь, спасибо за разъяснения. Написал Вам в ЛС, жду ответа. Спасибо.

Читают тему