Определить столбец для которого среднее значения повторов его элементов в другом диапазоне минимально

Пользователь

Сообщений: 7 Регистрация: 27.06.2019

27.06.2019 12:44:15

Всем доброго дня!

Знатоки, подскажите пожалуйста у меня имеется таблица из 14 ячеек большим количеством столбцов. Мне необходимо сравнить каждый столбец каждом, насколько я понимаю, и в результате грубо говоря в ячейке снизу столбца должна отображаться вероятность уникальности комбинации относительного всего листа каждого столбца .

Вопрос: как внутри таблице найти самый уникальны столбец относительно других , значений ячейки всего 3 : 1 , 2, Х

Прикрепленные файлы

прмиер.xlsx (10.83 КБ)

Изменено: xlopik - 27.06.2019 14:06:43

vikttur Пользователь Сообщений: 47199 Регистрация: 15.09.2012	#2 27.06.2019 13:04:41 А подсчёт при чем?

xlopik

Пользователь

Сообщений: 7 Регистрация: 27.06.2019

27.06.2019 13:09:29

Цитата
vikttur написал: А подсчёт при чем?

А как правильно укажите пож. я не шару просто может "анализ данных " не знаю =(

vikttur Пользователь Сообщений: 47199 Регистрация: 15.09.2012	#4 27.06.2019 13:18:34 Название должно отражать суть задачи. Предложите новое

Wiss

Пользователь

Сообщений: 1028 Регистрация: 08.11.2016

27.06.2019 13:22:40

Поясните, пожалуйста что Вы подразумеваете под "уникальность комбинации "? То есть сколько раз все 14 значений из столбца "А" (с учётом последовательности) повторяются в остальной таблице? В файле-примере все столбцы уникальны.

P.S. В приложении был возможный вариант решения, но раз темы нету... И вообще, а что это тут за флешмоб?! Попробуйте сообразить название на троих.

Изменено: Wiss - 27.06.2019 13:26:44

Я не волшебник, я только учусь.

vikttur Пользователь Сообщений: 47199 Регистрация: 15.09.2012	#6 27.06.2019 13:29:21 igoodmood, к чему Ваше сообщение?

vikttur Пользователь Сообщений: 47199 Регистрация: 15.09.2012	#7 27.06.2019 13:33:25 Все учётки спамера будут забанены

xlopik

Пользователь

Сообщений: 7 Регистрация: 27.06.2019

27.06.2019 13:42:07

Цитата
vikttur написал: Название должно отражать суть задачи. Предложите новое

Процент вероятности уникальной комбинации в таблице

xlopik

Пользователь

Сообщений: 7 Регистрация: 27.06.2019

27.06.2019 13:48:36

Цитата

Wiss написал:
Поясните, пожалуйста что Вы подразумеваете под "уникальность комбинации "? То есть сколько раз все 14 значений из столбца "А" (с учётом последовательности) повторяются в остальной таблице? В файле-примере все столбцы уникальны.

Именно внутри таблицы , да в примере они уникальны , но там всего возможно 3 значения 1,Х,2 всего. В примере , в строке проценты я подразумеваю что он будет формироваться относительно того насколько
каждый столбец (из 14) "похож" на соседнии

Андрей VG

Пользователь

Сообщений: 11927 Регистрация: 22.12.2012

Excel 2016, 365

#10

27.06.2019 13:52:10

Доброе время суток

Цитата
xlopik написал: вероятность уникальности комбинации

А каков алгоритм расчёта такой вероятности? Как вы получили 12%, 67%? Поделитесь методикой?

xlopik Пользователь Сообщений: 7 Регистрация: 27.06.2019	#11 27.06.2019 13:54:59 Андрей VG, Это "рояль в кустах" нет методики , добавил для понимания картины

Ігор Гончаренко

Пользователь

Сообщений: 14576 Регистрация: 01.01.1970

#12

27.06.2019 14:14:53

методики расчета нет, но есть уверенность что тут это посчитают
а вот и достойное название темы:
"Рояль в кустах"

Программисты - это люди, решающие проблемы, о существовании которых Вы не подозревали, методами, которых Вы не понимаете!

Светлый

Пользователь

Сообщений: 487 Регистрация: 07.03.2019

#13

27.06.2019 14:21:43

У меня пока два варианта нарисовалось. Первый - сколько раз последовательность данного столбца встречается во всей таблице. Формула массива:

Код
=СУММ(Ч(МУМНОЖ(ТРАНСП(Ч(A1:A14=$A1:$O14));СТРОКА(1:14)^0)=14))

И второй - сколько раз комбинация 1, 2, "X" в любой последовательности из данного столбца встречается во всей таблице. Формула массива:

Код

=СУММ(Ч(СУММ(СЧЁТЕСЛИ(A1:A14;{1:2:"X"})*100^СТРОКА(1:3))=МУМНОЖ(ТРАНСП(СЧЁТЕСЛИ(СМЕЩ($A1:$A14;;СТОЛБЕЦ($A:$O)-1);{1:2:"X"}));100^СТРОКА(1:3))))

Для получения % делим на 14.
Или другой вариант второй формулы:

Код
=СУММ(Ч(СУММ(100^ПОДСТАВИТЬ(A1:A14;"X";3))=МУМНОЖ(ТРАНСП(100^ПОДСТАВИТЬ($A1:$O14;"X";3));СТРОКА(1:14)^0)))

Прикрепленные файлы

прмиер-1.xlsx (12.46 КБ)

Изменено: Светлый - 27.06.2019 14:35:04

Андрей VG

Пользователь

Сообщений: 11927 Регистрация: 22.12.2012

Excel 2016, 365

#14

27.06.2019 14:25:25

Ещё вариант на Power Query. Сопоставляется количество 1, 2, Х текущего столбца со всеми остальными. Находится минимальная разница и относится к числу строк в столбце (думаю понятно, что сам к себе столбец в этом случае имеет нулевую разницу). Этот подход не учитывает позиционные отличия.
Если нужно учитывать и это, до можете рассмотреть редакционное расстояние, Longest Common Subsequence

Прикрепленные файлы

прмиер.xlsx (18.97 КБ)

Изменено: Андрей VG - 27.06.2019 14:30:19

Wiss

Пользователь

Сообщений: 1028 Регистрация: 08.11.2016

#15

27.06.2019 14:30:44

Так что всё-таки значит "похож"? Вы же понимаете, что ~~мы ЭТО за Вас придумать не сможем.~~ (уже варианта 3 придумали)

В приложенном файле рассчитано сколько раз каждый столбец встречается в таблице.

+Вариант, в котором для каждой строки рассчитана частота(процент) повторяемости для каждого из 3-х символов. На выходе для каждого столбца берётся средняя частота построчно.

Прикрепленные файлы

прмиер.xlsx (15.41 КБ)

Изменено: Wiss - 27.06.2019 14:41:45

Я не волшебник, я только учусь.

Андрей VG

Пользователь

Сообщений: 11927 Регистрация: 22.12.2012

Excel 2016, 365

#16

27.06.2019 14:43:31

Цитата
Wiss написал: уже варианта 3 придумали

Почему три?! Шесть!

Реализовано в готовом виде - четыре.

xlopik Пользователь Сообщений: 7 Регистрация: 27.06.2019	#17 27.06.2019 14:46:19 Смотрю смотрю

Ігор Гончаренко

Пользователь

Сообщений: 14576 Регистрация: 01.01.1970

#18

27.06.2019 14:48:09

я решал такую задачу:
Определить столбец для которого среднее значения повторов элементов этого столбца среди соотв. элементов других столбцов минимально.

это столбец 1
=СУММ(МУМНОЖ(--(R1C:R14C=R1C1:R14C15);ТРАНСП(СТОЛБЕЦ(R1C1:R1C15)^0))-1)/ЧСТРОК(R1C1:R14C1)/ЧИСЛСТОЛБ(R1C1:R1C15)

Прикрепленные файлы

прмиер.xlsx (11.32 КБ)

Светлый

Пользователь

Сообщений: 487 Регистрация: 07.03.2019

#19

27.06.2019 14:59:52

Или даже так. Третий вариант второй формулы:

Код
=СУММ(Ч(СУММ(100^Ч(+A1:A14))=МУМНОЖ(ТРАНСП(100^Ч(+$A1:$O14));СТРОКА(1:14)^0)))

xlopik

Пользователь

Сообщений: 7 Регистрация: 27.06.2019

#20

27.06.2019 15:20:19

Ігор Гончаренко, Спасибо все верно именно то ! Всем огромное спасибо. Андрей VG, с а Power Query надстройкой к сожалению пока не знаком. Wiss, спасибо не плохое решение!

Цитата
Светлый написал: =СУММ(Ч(МУМНОЖ(ТРАНСП(Ч(A1:A14=$A1:$O14));СТРОКА(1:14)^0)=14))

плюсую.

Андрей VG

Пользователь

Сообщений: 11927 Регистрация: 22.12.2012

Excel 2016, 365

#21

27.06.2019 19:15:36

Ещё вариант. При сравнении двух столбцов вычеркнем совпадающие значения, находящиеся в одних и тех же строках. Количество оставшихся символов, отнесённое к числу строк и будет мерой уникальности. Сравнивая один столбец с другими выберем минимальное значение меры.

Прикрепленные файлы

прмиер.xlsx (20.96 КБ)

Светлый

Пользователь

Сообщений: 487 Регистрация: 07.03.2019

#22

27.06.2019 21:12:31

Как у Ігор Гончаренко, только немного короче и медленней:

Код
=(СУММ((A1:A14=$A1:$O14)/СТРОКА(O14))-1)/СТОЛБЕЦ($O14)

Или быстрее:

Код
=(СУММ(Ч(A1:A14=$A1:$O14))/СТРОКА(O14)-1)/СТОЛБЕЦ($O14)

Изменено: Светлый - 27.06.2019 21:22:40