на листе 1 находится 694 строчки с данными, можно сгруппировать их по совпадениям? чтобы от большего к меньшему стало: то есть найти строчки где данные повторяются n количество раз.
к примеру я знаю что две строчки имеют минимум 9 совпадений, но в каких местах не известно, глазами удалось потом найти что это 402 и 436 строка. скрин совпадений во вложении:
DJMC, задача при такой постановке не имеет решения. Сами посудите, то что вы пометили, означает что именно эти строки имеют совпадения, но они могут иметь совпадения и с другими, при этом в большем числе. Следовательно вопрос. Что нужно?
попытаюсь сформулировать простым языком, возможно это станет понятнее, не уверен правда можно ли будет применить это в экселе как то...
В 694 строках, минимум две строки всегда имеют от 8 и больше совпадений между другими строками, нужно сгруппировать их по совпадениям. Один из вариантов который у меня есть, это построчное сравнение каждой строки с другой =СУММПРОИЗВ(--(диапазон=диапазон)) но в ручную это делать наверное не реально, возможно макрос сможет это сделать и на против каждой строки вывести номера. то есть простыми словами: сравнивается строка 1 с 10 строками, и рядом идет вывод строка 1 имеет 7 совпадений со строкой 7 и 9, 6 совпадений со строчками 2,3,4,5 и так далее.
во вложении пример как это работает, но с другими данными. возможно ли сделать не что похожее но с моими данными?
Выводить все, я понимаю что между собой может быть не две строки, а возможно и 100 строк. Мне нужно вывести строки в которых есть от 8 и больше совпадений между собой. Идеально было бы разбить на листы или списки, к примеру 8 раз совпадают строчки и список строк девять раз совпали и список.
DJMC, опять придумали ХЗ что… Вы хоть понимаете количество комбинаций при сопоставлении элементов такой матрицы? 1. Сравните хотя бы ОДНУ строку с ДЕСЯТЬЮ (1*10) 2. полученные ДЕСЯТЬ отчётов по совпадениям придумайте, как и где отобразить 3. прикиньте что у вас будет примерно по скрину (2404*2404 = 5 779 216) отчётов. Минус те, которые СОВСЕМ не совпали (ни один элемент не на своём месте) 4. прикиньте на кой хрен вам вся эта информация и что с ней дальше делать 5. объясните всё это тут
Во всех делах очень полезно периодически ставить знак вопроса к тому, что вы с давних пор считали не требующим доказательств (Бертран Рассел) ►Благодарности сюда◄
Если бы я понимал это, то наверное бы не спрашивал. Но мне очень приятно что есть люди которые не просто помогают, а интересуются у пользователей, зачем им это.
1. Могу дать 10 строк на сравнение, если это облегчит задачу и ресурсы компьютера. 2. на отдельном листе отобразить какие строки совпали между собой больше всего раз 3. тут я понял, что нужно как то сокращать 694 строк, иначе очень много получается вариантов 4. я пытаюсь идти от обратного, практический каждый день две строки между собой имеют от 8 и выше совпадений, но узнаю я об этом уже после того когда известно что же в итоге осталось в каждой из строк ячеек (всего их 15) 5. Хочу понять возможно ли получить эти данные при первоначальном рандоме строк.
Что то я не много не понял, что Вы сделали и почему у нас такая разница получилась?
в примере 10 строк, что я дал там глазами отметил что 1 и 2 строчка похожи между собой 10 значениями, а в Вашем примере нет такого.... или я что то не так понял.
да не поняли верхняя строка это сколько совпадает строк с первой строкой, второй ..... а ниже помечены тем, которые совпадают более чем в семи столбцых. Понятно что строка сама с собой во всех 15 совпадает.
Как то сложно получилось, не понятно для меня, а можно сделать на примере как я руками сделал ? то есть первая строчка и ниже с подсветкой строка где совпало больше всего значений, потом вторая строчка и ниже строка которая совпала больше всего раз..
Еще один из теоретических взглядов решения данной задачи:
Создать слева столбцы фактов совпадений 0 или 1 Ещё левее создать столбец сумм фактов по строкам Выделить нужную область включая тиражи Новая вкладка специальная вставка вставить значения Выделить нужную область и сортировать Тиражи должны расслоиться по угадыванию
Нашел не что подобное для моей задачи в виде решения построчного сравнения, в виде объединения данных в ячейках и поиска общего количества.
Скрытый текст
Проверить каждый символ в ячейке Самое простое, что может сделать для Вас функция EXACT (СОВПАД) – подсказать есть ли точное совпадение между двумя текстовыми строками. Но иногда при несоответствии строк требуется определить, какие именно символы не совпадают. В следующем примере в каждой текстовой строке содержится по 6 символов. Также есть 6 столбцов, заголовки которых пронумерованы от 1 до 6.
Функция СОВПАД в Excel Формула в ячейке C2 составлена из трёх функций, среди которых MID (ПСТР) и EXACT (СОВПАД).
Функция MID (ПСТР) возвращает определённый символ из ячеек A2 и B2. Выбор позиции символа в тексте происходит по номеру столбца, содержащего формулу. Например, формула в ячейке C2, проверяет первые символы каждой текстовой строки, поскольку этот столбец имеет номер 1. Функция EXACT (СОВПАД) сравнивает два символа, извлечённых из текста при помощи двух функций MID (ПСТР). =EXACT(MID($A2,C$1,1),MID($B2,C$1,1))
Можно помочь это внедрить в мой файл, или эти действия не подходят под мои "хотелки"?
т.е. КАЖДУЮ строку нужно сравнить с КАЖДОЙ строкой может такой пример будет вам более нагляден из сорока строк А2 сравнивается с А2, затем А2 с А3, затем А2 с А4 и .......................
Сергей спасибо, да такой пример более наглядный, ушел тренироваться дальше.. лед тронулся, хотя теперь еще больше нужно писать формул сцепить... или искать мастеров по макросам.
Подвожу итоги, то чего удалось достичь, а также с советом как действовать дальше, и так я сделал то что писали выше БМВ и Сергей, затем отфильтровал до 13 совпадений, (во вложении то что получилось) вопрос как теперь их повторно сравнить?
так как взяв две строки где есть по 9 угадано, соединив их получилось между ними 13 общих данных.
То есть нужно провести сравнение только уже этих строк, в виде переноса ТОЛЬКО этих строк на вторую страницу, и сравнение между ними.
DJMC, %ернёй занимаетесь, чесслово — я вам ещё в #3 сказал придумать, КАК выводить результат сравнения (остальные потом в другой форме тоже самое сказали), а вы костыли какие-то колотите
Во всех делах очень полезно периодически ставить знак вопроса к тому, что вы с давних пор считали не требующим доказательств (Бертран Рассел) ►Благодарности сюда◄
в Р16 пишете с какой строкой провести сравнение в колонке Р видите результаты (понятно, что указанная строка даст 15 совпадений сама с собой) и зеленым подсвечены совпадения
Ігор Гончаренко спасибо, за пояснение, теперь понял.
Цитата
Jack Famous написал: а вы костыли какие-то колотите
во вложении, близкое решение к моей хотелки...
Скрытый текст
Если умеете работать с функцыями массива в зксель - ЧАСТОТА(). А строчку найти - Главная - Условное форматирование - БОЛЬШЕ - >8. Здесь это 269 строка.
Решение найдено, за счет PQ получилось очень элегантно, и почти как нужно работает, но есть конечно еще вопросы... как выложить сюда файл весом 7 мегабайт? чтобы уточнить почему происходят ошибки.