Доброго всем времени суток.
Сразу скажу, практически впервые пользуюсь пакетом MS Office, поэтому прошу снисходительно отнестись. Опишу задачу: Есть два файла Excel 2010, в каждом порядка 300-500 тысяч строк, нужно сравнить эти два файла по значениям одного из столбцов (скажем по столбцу B, можно заранее привести файлы к одному виду). Теоретически значения в файле 1 и файле 2, этого столбца, должны быть одинаковы, на практике возможны расхождения, которые и требуется обнаружить. Т.е. нужно найти все уникальные значения в файле 1, которых нет в файле 2 и, соответственно, наоборот. (если будет проще или быстрее работать, то можно разместить данные не в разных файлах, а на страницах одной книги).
Пробовал решить данную задачу следующим способом: объединял обе таблицы в один файл одну под другой, потом делал Условное форматирование-Правила выделения ячеек-Повторяющиеся значения и далее в этой колонке фильтр по цвету заливки. На файле в 8Мб данный способ занимает около часа (да даже само открытие окна фильтра в этой колонке занимает около 20 минут, думаю потому что в 500000 строк каждое значение повторяется максимум дважды), на файле более 50Мб у меня комп повесился :(
Данные можно разместить на листах в одной книге, это не принципиально, привести таблицы к одинаковому виду тоже, вся проблема в объеме файлов. Подскажите пожалуйста какой нибудь алгоритм, который не сутки будет работать.
P.S. поиском по форуму воспользовался как смог, опробовал то что нашел, но не смог быстро разобраться с VBA, а решение нужно срочно. Заранее признателен.
Сразу скажу, практически впервые пользуюсь пакетом MS Office, поэтому прошу снисходительно отнестись. Опишу задачу: Есть два файла Excel 2010, в каждом порядка 300-500 тысяч строк, нужно сравнить эти два файла по значениям одного из столбцов (скажем по столбцу B, можно заранее привести файлы к одному виду). Теоретически значения в файле 1 и файле 2, этого столбца, должны быть одинаковы, на практике возможны расхождения, которые и требуется обнаружить. Т.е. нужно найти все уникальные значения в файле 1, которых нет в файле 2 и, соответственно, наоборот. (если будет проще или быстрее работать, то можно разместить данные не в разных файлах, а на страницах одной книги).
Пробовал решить данную задачу следующим способом: объединял обе таблицы в один файл одну под другой, потом делал Условное форматирование-Правила выделения ячеек-Повторяющиеся значения и далее в этой колонке фильтр по цвету заливки. На файле в 8Мб данный способ занимает около часа (да даже само открытие окна фильтра в этой колонке занимает около 20 минут, думаю потому что в 500000 строк каждое значение повторяется максимум дважды), на файле более 50Мб у меня комп повесился :(
Данные можно разместить на листах в одной книге, это не принципиально, привести таблицы к одинаковому виду тоже, вся проблема в объеме файлов. Подскажите пожалуйста какой нибудь алгоритм, который не сутки будет работать.
P.S. поиском по форуму воспользовался как смог, опробовал то что нашел, но не смог быстро разобраться с VBA, а решение нужно срочно. Заранее признателен.