Страницы: 1
RSS
Определить столбец для которого среднее значения повторов его элементов в другом диапазоне минимально
 
Всем доброго дня!

Знатоки, подскажите пожалуйста у меня имеется таблица из 14 ячеек большим количеством столбцов. Мне необходимо сравнить каждый столбец каждом, насколько я понимаю, и в результате грубо говоря в ячейке снизу столбца должна отображаться вероятность уникальности комбинации относительного всего листа каждого столбца .

Вопрос: как внутри таблице найти самый уникальны столбец относительно других , значений ячейки всего 3  : 1 , 2, Х
Изменено: xlopik - 27.06.2019 14:06:43
 
А подсчёт при чем?
 
Цитата
vikttur написал:
А подсчёт при чем?
А как правильно укажите пож. я не шару просто может "анализ данных " не знаю =(
 
Название должно отражать суть задачи.  Предложите новое
 
Поясните, пожалуйста что Вы подразумеваете под "уникальность комбинации "? То есть сколько раз все 14 значений из столбца "А" (с учётом последовательности) повторяются в остальной таблице? В файле-примере все столбцы уникальны.

P.S. В приложении был возможный вариант решения, но раз темы нету... И вообще, а что это тут за флешмоб?! Попробуйте сообразить название на троих.
Изменено: Wiss - 27.06.2019 13:26:44
Я не волшебник, я только учусь.
 
igoodmood, к чему Ваше сообщение?
 
Все учётки  спамера  будут забанены
 
Цитата
vikttur написал:
Название должно отражать суть задачи.  Предложите новое
Процент вероятности уникальной комбинации в таблице  
 
Цитата
Wiss написал:
Поясните, пожалуйста что Вы подразумеваете под "уникальность комбинации "? То есть сколько раз все 14 значений из столбца "А" (с учётом последовательности) повторяются в остальной таблице? В файле-примере все столбцы уникальны.
Именно внутри таблицы , да в примере они уникальны , но там всего возможно 3 значения 1,Х,2 всего. В примере , в строке проценты я  подразумеваю что он будет формироваться относительно того насколько
каждый столбец (из 14) "похож" на соседнии
 
Доброе время суток
Цитата
xlopik написал:
вероятность уникальности комбинации
А каков алгоритм расчёта такой вероятности? Как вы получили 12%, 67%? Поделитесь методикой?
 
Андрей VG, Это "рояль в кустах" нет методики , добавил для понимания картины
 
методики расчета нет, но есть уверенность что тут это посчитают
а вот и достойное название темы:
"Рояль в кустах"
Программисты - это люди, решающие проблемы, о существовании которых Вы не подозревали, методами, которых Вы не понимаете!
 
У меня пока два варианта нарисовалось. Первый - сколько раз последовательность данного столбца встречается во всей таблице. Формула массива:
Код
=СУММ(Ч(МУМНОЖ(ТРАНСП(Ч(A1:A14=$A1:$O14));СТРОКА(1:14)^0)=14))
И второй - сколько раз комбинация 1, 2, "X" в любой последовательности из данного столбца встречается во всей таблице. Формула массива:
Код
=СУММ(Ч(СУММ(СЧЁТЕСЛИ(A1:A14;{1:2:"X"})*100^СТРОКА(1:3))=МУМНОЖ(ТРАНСП(СЧЁТЕСЛИ(СМЕЩ($A1:$A14;;СТОЛБЕЦ($A:$O)-1);{1:2:"X"}));100^СТРОКА(1:3))))
Для получения % делим на 14.
Или другой вариант второй формулы:
Код
=СУММ(Ч(СУММ(100^ПОДСТАВИТЬ(A1:A14;"X";3))=МУМНОЖ(ТРАНСП(100^ПОДСТАВИТЬ($A1:$O14;"X";3));СТРОКА(1:14)^0)))
Изменено: Светлый - 27.06.2019 14:35:04
 
Ещё вариант на Power Query. Сопоставляется количество 1, 2, Х текущего столбца со всеми остальными. Находится минимальная разница и относится к числу строк в столбце (думаю понятно, что сам к себе столбец в этом случае имеет нулевую разницу). Этот подход не учитывает позиционные отличия.
Если нужно учитывать и это, до можете рассмотреть редакционное расстояние, Longest Common Subsequence
Изменено: Андрей VG - 27.06.2019 14:30:19
 
Так что всё-таки значит "похож"? Вы же понимаете, что мы ЭТО за Вас придумать не сможем. (уже варианта 3 придумали)

В приложенном файле рассчитано сколько раз каждый столбец встречается в таблице.

+Вариант, в котором для каждой строки рассчитана частота(процент) повторяемости для каждого из 3-х символов. На выходе для каждого столбца берётся средняя частота построчно.
Изменено: Wiss - 27.06.2019 14:41:45
Я не волшебник, я только учусь.
 
Цитата
Wiss написал:
уже варианта 3 придумали
Почему три?! Шесть!  :D   Реализовано в готовом виде - четыре.
 
Смотрю смотрю
 
я решал такую задачу:
Определить столбец для которого среднее значения повторов элементов этого столбца среди соотв. элементов других столбцов минимально.

это столбец 1
=СУММ(МУМНОЖ(--(R1C:R14C=R1C1:R14C15);ТРАНСП(СТОЛБЕЦ(R1C1:R1C15)^0))-1)/ЧСТРОК(R1C1:R14C1)/ЧИСЛСТОЛБ(R1C1:R1C15)
Программисты - это люди, решающие проблемы, о существовании которых Вы не подозревали, методами, которых Вы не понимаете!
 
Или даже так. Третий вариант второй формулы:
Код
=СУММ(Ч(СУММ(100^Ч(+A1:A14))=МУМНОЖ(ТРАНСП(100^Ч(+$A1:$O14));СТРОКА(1:14)^0)))
 
Ігор Гончаренко, Спасибо все верно именно то ! Всем огромное спасибо. Андрей VG, с а Power Query надстройкой к сожалению пока не знаком. Wiss, спасибо не плохое решение!
Цитата
Светлый написал:
=СУММ(Ч(МУМНОЖ(ТРАНСП(Ч(A1:A14=$A1:$O14));СТРОКА(1:14)^0)=14))
плюсую.
 
Ещё вариант. При сравнении двух столбцов вычеркнем совпадающие значения, находящиеся в одних и тех же строках. Количество оставшихся символов, отнесённое к числу строк и будет мерой уникальности. Сравнивая один столбец с другими выберем минимальное значение меры.
 
Как у Ігор Гончаренко,  только немного короче и медленней:
Код
=(СУММ((A1:A14=$A1:$O14)/СТРОКА(O14))-1)/СТОЛБЕЦ($O14)

Или быстрее:

Код
=(СУММ(Ч(A1:A14=$A1:$O14))/СТРОКА(O14)-1)/СТОЛБЕЦ($O14)

Изменено: Светлый - 27.06.2019 21:22:40
Страницы: 1
Наверх