Страницы: 1
RSS
Сгруппировать данные от большего к меньшему по количеству одинаковых значений в строчках
 
Добрый день

на листе 1 находится 694 строчки с данными, можно сгруппировать их по совпадениям? чтобы от большего к меньшему стало:
то есть найти строчки где данные повторяются n количество раз.

к примеру я знаю что две строчки имеют минимум 9 совпадений, но в каких местах не известно, глазами удалось потом найти что это 402 и 436 строка.
скрин совпадений во вложении:
Изменено: DJMC - 14.12.2020 13:23:05
 
DJMC, задача при такой постановке не имеет решения. Сами посудите, то что вы пометили, означает что именно эти строки имеют совпадения, но они могут иметь совпадения и с другими, при этом в большем числе. Следовательно вопрос. Что нужно?
По вопросам из тем форума, личку не читаю.
 
Исправил вводные данные, что не отвлекать на лишние страницы
 
попытаюсь сформулировать простым языком, возможно это станет понятнее, не уверен правда можно ли будет применить это в экселе как то...

В  694 строках, минимум две строки всегда имеют от 8 и больше совпадений между другими строками, нужно сгруппировать их по совпадениям.
Один из вариантов который у меня есть, это построчное сравнение каждой строки с другой
=СУММПРОИЗВ(--(диапазон=диапазон)) но в ручную это делать наверное не реально, возможно макрос сможет это сделать и на против каждой строки вывести номера.
то есть простыми словами:
сравнивается строка 1 с 10 строками, и рядом идет вывод строка 1 имеет 7 совпадений со строкой 7 и 9, 6 совпадений со строчками 2,3,4,5 и так далее.

во вложении пример как это работает, но с другими данными. возможно ли сделать не что похожее но с моими данными?
 
что и как выводить при таком сокращенном варианте?

1  2  3  4
1  2        5  6
      3  4  5  6

Каждая строка имеет два совпадения.
Изменено: БМВ - 14.12.2020 13:45:59
По вопросам из тем форума, личку не читаю.
 
Выводить все, я понимаю что между собой может быть не две строки, а возможно и 100 строк.
Мне нужно вывести строки в которых есть от 8 и больше совпадений между собой. Идеально было бы разбить на листы или списки, к примеру 8 раз совпадают строчки и список строк девять раз совпали и список.

Я понимаю что их будет не по две строчки.
 
DJMC, опять придумали ХЗ что… Вы хоть понимаете количество комбинаций при сопоставлении элементов такой матрицы?
  1. Сравните хотя бы ОДНУ строку с ДЕСЯТЬЮ (1*10)
  2. полученные ДЕСЯТЬ отчётов по совпадениям придумайте, как и где отобразить
  3. прикиньте что у вас будет примерно по скрину (2404*2404 = 5 779 216) отчётов. Минус те, которые СОВСЕМ не совпали (ни один элемент не на своём месте)
  4. прикиньте на кой хрен вам вся эта информация и что с ней дальше делать
  5. объясните всё это тут
Во всех делах очень полезно периодически ставить знак вопроса к тому, что вы с давних пор считали не требующим доказательств (Бертран Рассел) ►Благодарности сюда◄
 
Цитата
DJMC написал:
Я понимаю что их будет не по две строчки
нет, не совсем понимаете.

1  2  3  4
1  2        5  6
      3  4  5  6
   2        5  6  7
Изменено: БМВ - 14.12.2020 14:00:00
По вопросам из тем форума, личку не читаю.
 
Если бы я понимал это, то наверное бы не спрашивал. Но мне очень приятно что есть люди которые не просто помогают, а интересуются у пользователей, зачем им это.

1. Могу дать 10 строк на сравнение, если это облегчит задачу и ресурсы компьютера.
2. на отдельном листе отобразить какие строки совпали между собой больше всего раз
3. тут я понял, что нужно как то сокращать 694 строк, иначе очень много получается вариантов
4. я пытаюсь идти от обратного, практический каждый день две строки между собой имеют от 8 и выше совпадений, но узнаю я об этом уже после того когда известно что же в итоге  осталось в каждой из строк ячеек (всего их 15)
5. Хочу понять возможно ли получить эти данные при первоначальном рандоме строк.
 
Цитата
БМВ написал:
1  2  3  41  2        5  6        3  4  5  6     2        5  6  7
Можно на примере 10 строк, что выше дал показать что Вы имеете ввиду?
 
я имею в виду что определить сколько строк совпадает с текущей по 8 и более можно только относительно какой-либо строки. Допустим текущей.
По вопросам из тем форума, личку не читаю.
 
я это понимаю, я думал каждую строчку сверить с каждой и сгруппировать их между  собой по совпадениям.

На примере  10 строк, для начала этого будет достаточно. сделал в ручную сравнив первую строку с 9 оставшимися.
Изменено: DJMC - 14.12.2020 14:35:54
 
у вас будет 694 столбика, по одному для каждой строки.
По вопросам из тем форума, личку не читаю.
 
Что то я не много не понял, что Вы сделали и почему у нас такая разница получилась?

в примере 10 строк, что я дал там глазами отметил что 1 и 2 строчка похожи между собой 10 значениями, а в Вашем примере нет такого.... или я что то не так понял.
 
да не поняли
верхняя строка это сколько совпадает строк с первой строкой, второй  ..... а ниже помечены тем, которые совпадают более чем в семи столбцых. Понятно что строка сама с собой во всех 15 совпадает.
По вопросам из тем форума, личку не читаю.
 
Как то сложно получилось, не понятно для меня, а можно сделать на примере как я руками сделал ?  
то есть первая строчка и ниже с подсветкой строка где совпало больше всего значений, потом вторая строчка и ниже строка которая совпала больше всего раз..

Еще один из теоретических взглядов решения данной задачи:

Создать слева столбцы фактов совпадений 0 или 1
Ещё левее создать столбец сумм фактов по строкам
Выделить нужную область включая тиражи
Новая вкладка специальная вставка вставить значения
Выделить нужную область и сортировать
Тиражи должны расслоиться по угадыванию
Изменено: DJMC - 14.12.2020 15:39:49
 
Нашел не что подобное для моей задачи в виде решения построчного сравнения, в виде объединения данных  в ячейках и поиска  общего количества.

Скрытый текст


Можно помочь это внедрить в мой файл, или эти действия не подходят под мои "хотелки"?
 
вам уже медведь сказал
Цитата
БМВ написал:
у вас будет 694 столбика
т.е. КАЖДУЮ строку нужно сравнить с КАЖДОЙ строкой
может такой пример будет вам более нагляден из сорока строк А2 сравнивается с А2, затем А2 с А3, затем А2 с А4 и .......................
Лень двигатель прогресса, доказано!!!
 
Сергей спасибо, да такой пример более наглядный, ушел тренироваться дальше.. лед тронулся,  хотя теперь еще больше нужно писать формул сцепить... или искать мастеров по макросам.
 
Подвожу итоги, то чего удалось достичь, а также с советом как действовать дальше, и так я сделал то что писали выше БМВ и Сергей, затем отфильтровал до 13 совпадений, (во вложении то что получилось) вопрос как теперь их повторно сравнить?

так как взяв две строки где есть по 9 угадано, соединив их получилось между ними 13 общих данных.

То есть нужно провести сравнение только уже этих строк, в виде переноса ТОЛЬКО этих строк на вторую страницу, и сравнение между ними.
 
DJMC, %ернёй занимаетесь, чесслово — я вам ещё в #3 сказал придумать, КАК выводить результат сравнения (остальные потом в другой форме тоже самое сказали), а вы костыли какие-то колотите  8-0
Во всех делах очень полезно периодически ставить знак вопроса к тому, что вы с давних пор считали не требующим доказательств (Бертран Рассел) ►Благодарности сюда◄
 
в Р16 пишете с какой строкой провести сравнение
в колонке Р видите результаты (понятно, что указанная строка даст 15 совпадений сама с собой)
и зеленым подсвечены совпадения
Программисты - это люди, решающие проблемы, о существовании которых Вы не подозревали, методами, которых Вы не понимаете!
 
Ігор Гончаренко спасибо, за пояснение, теперь понял.

Цитата
Jack Famous написал:
а вы костыли какие-то колотите
во вложении, близкое решение к моей хотелки...
Скрытый текст
 
Решение найдено, за счет PQ  получилось очень элегантно, и почти  как нужно работает, но есть конечно еще вопросы... как выложить сюда файл весом 7 мегабайт?  чтобы уточнить почему происходят ошибки.
Страницы: 1
Наверх