Знатоки, подскажите пожалуйста у меня имеется таблица из 14 ячеек большим количеством столбцов. Мне необходимо сравнить каждый столбец каждом, насколько я понимаю, и в результате грубо говоря в ячейке снизу столбца должна отображаться вероятность уникальности комбинации относительного всего листа каждого столбца .
Вопрос: как внутри таблице найти самый уникальны столбец относительно других , значений ячейки всего 3 : 1 , 2, Х
Поясните, пожалуйста что Вы подразумеваете под "уникальность комбинации "? То есть сколько раз все 14 значений из столбца "А" (с учётом последовательности) повторяются в остальной таблице? В файле-примере все столбцы уникальны.
P.S. В приложении был возможный вариант решения, но раз темы нету... И вообще, а что это тут за флешмоб?! Попробуйте сообразить название на троих.
Wiss написал: Поясните, пожалуйста что Вы подразумеваете под "уникальность комбинации "? То есть сколько раз все 14 значений из столбца "А" (с учётом последовательности) повторяются в остальной таблице? В файле-примере все столбцы уникальны.
Именно внутри таблицы , да в примере они уникальны , но там всего возможно 3 значения 1,Х,2 всего. В примере , в строке проценты я подразумеваю что он будет формироваться относительно того насколько каждый столбец (из 14) "похож" на соседнии
Ещё вариант на Power Query. Сопоставляется количество 1, 2, Х текущего столбца со всеми остальными. Находится минимальная разница и относится к числу строк в столбце (думаю понятно, что сам к себе столбец в этом случае имеет нулевую разницу). Этот подход не учитывает позиционные отличия. Если нужно учитывать и это, до можете рассмотреть редакционное расстояние, Longest Common Subsequence
Так что всё-таки значит "похож"? Вы же понимаете, что мы ЭТО за Вас придумать не сможем. (уже варианта 3 придумали)
В приложенном файле рассчитано сколько раз каждый столбец встречается в таблице.
+Вариант, в котором для каждой строки рассчитана частота(процент) повторяемости для каждого из 3-х символов. На выходе для каждого столбца берётся средняя частота построчно.
я решал такую задачу: Определить столбец для которого среднее значения повторов элементов этого столбца среди соотв. элементов других столбцов минимально.
это столбец 1 =СУММ(МУМНОЖ(--(R1C:R14C=R1C1:R14C15);ТРАНСП(СТОЛБЕЦ(R1C1:R1C15)^0))-1)/ЧСТРОК(R1C1:R14C1)/ЧИСЛСТОЛБ(R1C1:R1C15)
Ігор Гончаренко, Спасибо все верно именно то ! Всем огромное спасибо. Андрей VG, с а Power Query надстройкой к сожалению пока не знаком. Wiss, спасибо не плохое решение!
Ещё вариант. При сравнении двух столбцов вычеркнем совпадающие значения, находящиеся в одних и тех же строках. Количество оставшихся символов, отнесённое к числу строк и будет мерой уникальности. Сравнивая один столбец с другими выберем минимальное значение меры.