Страницы: 1
RSS
Составление возможных комбинаций из двух наборов данных
 

Помогите, пожалуйста, всю голову уже сломал. Файл примера прикрепляю.

Задача. Имеем гены А, Б и ДР, каждый может принимать определенное количество значений (скажем, 20, не важно). Каждый человек имеет по два  таких набора, т.е. 2 гена А, два - Б и два – ДР. Но у нас все свалено в кучу, т.е. имеет А1,2; В3,4; ДР5,6. Нужно определить, какие тройки могут быть. В данном случае я вручную составил 4 возможных варианта – все ок. Но если оба гена А представлены в варианте, скажем, 1, то количество комбинаций уже 2. Если А и Б – то только одна, как и если все гены попарно совпадают.

Нужно сделать так, чтобы эксель сам находил повторы в двух возможных наборах и выдавал вариант только с уникальными значениями.

Поиск я провел. Нашел тут на форуме замечательный макрос, который оставляет только уникальные значения, причем подтирает за собой пустые ячейки с формулами. Одно «но»: он сваливает все в один столбец. И потом приходится все делать в ручную, т.к. мне не нужны ВСЕ возможные комбинации, а только те, которые при слиянии дадут тот же общий набор.

Мне кажется, плохо объяснил. Я постарался в примере показать, как есть и как надо.

P.S. Желательно, что бы, что значения (номера) были представлены, как текст. Мне важно, чтобы было, например 07, а не 7.

Изменено: Alex_Z - 02.10.2017 20:22:03
 
Цитата
Alex_Z написал:
Мне кажется, плохо объяснил
Не совсем понятна задача, где исходные данные?
нужно сгенерировать все возможные комбинации или отобрать уникальные из того, что есть?

Если нужны уникальные, то вначале можно использовать формулу, на примере строки 8:
Код
=ЕСЛИ(B8&C8&D8<F8&G8&H8;B8&C8&D8&F8&G8&H8;F8&G8&H8&B8&C8&D8)

а затем уже отбирать уникальные
Изменено: MCH - 02.10.2017 21:20:47
 
Спасибо за ответ!
Т.е., я так понимаю, сначала нужно данные выстроить по величине? Просто не всегда исходно вводят в таком порядке, как я указал (А1,2; В3,4; ДР5,6), могут и вразнобой (А13, 2; Б7, 8; ДР 19,15).

В данном случае нужно выбрать уникальные комбинации в двух столбцах (за исключением ситуации, когда они все одинаковые. Тогда выводим только два одинаковых гаплотипа). Исходные данные выделены цветом (столбцы B, C, D и F, G, H). То, что получается - столбец J, а так, как хотелось бы - M.

С первом случае (строки 8-11) все значения уникальные, имеем 4 варианта, во втором (25-28) - зеленые значения в гаплотипе1 повторяют зеленые в гаплотипе 2.
в 3 и 4 примерах - мы может составить только одну комбинацию (они зеленые). Прошу прощения, немного напутал с цветами. При этом в 4 примере - все три гена попарно совпадают, поэтому гаплотипы одинаковые.

Я сначала думал на счет формулы ЕСЛИ(И(B2=C2;D2=E2;F2=G2... и т.д. Но тогда могут остаться пустые ячейки с формулами.
Изменено: Alex_Z - 02.10.2017 21:39:49
Страницы: 1
Читают тему
Наверх