Где интересно верно
или
Цитата |
---|
для первого файла в ячейке B2 слово hospital находиться на 10-й позиции , а у второго файла |
подразумевающего минимум два файла? И, следовательно, пример того, что должно получиться для двух файлов.
Алгоритм становиться двухпроходным. Сначала в словарь собираются по ключу слову Collection номеров строк, а по результатам анализа, возможно с учётом нумерации файлов на неизвестном порядке, какой из них первый, какой второй, принимается решение в каких позициях должны быть исключены повторы слов. Так как-то.
Ну, или, если правильно уловил смысл, то обрабатывать каждый файл на дубликаты по отдельности, потом сливая результаты.