Страницы: 1
RSS
Поиск схожих комбинаций в массиве данных.
 
Добрый день, уважаемые участники форума! Обращаюсь к адептам VBA и Excel. Имеется прикладная задача из области биологии и генетики. Упрощенно говоря: требуется найти схожие комбинации в массиве однотипных данных. Студент ведет наблюдение в течение нескольких месяцев, данных много, искать похожие комбинации нереально..
Прилагается техническое задание с примером. Очень прошу внимательно ознакомиться.
Бюджет - 2000руб. Если цена не устраивает, не спешите откланяться - всегда можно договориться :)
Имею возможность отвечать после 7 вечера по Москве. Все остальное время подрабатываю.
 
На выходных готов взяться. Если до того времени никто не возьмется/возьмется, но откажется, готов перехватить инициативу.
С уважением,
Федор/Все_просто
 
Версия экселя какая? Также неплохо бы взглянуть на структуру исходных данных и знать примерное количество строк в исходных данных.
Изменено: TheBestOfTheBest - 29.06.2017 07:21:44
Неизлечимых болезней нет, есть неизлечимые люди.
 
Цитата
TheBestOfTheBest написал:
Версия экселя какая? Также неплохо бы взглянуть на структуру исходных данных и знать примерное количество строк в исходных данных
Windows 7, MS Excel 2007. Структура исходных данных представлена на вкладке пример результата, названия столбцов убраны, т.к. они сложные и только запутают. Примерное количество строк в исходных данных - 2-4 тыс.
 
Цитата
Все_просто написал:
На выходных готов взяться. Если до того времени никто не возьмется/возьмется, но откажется, готов перехватить инициативу.
Вы правы, предлагаю дождаться вечера завтрашнего дня и посмотреть активность. Спасибо!
 
Цитата
TheBestOfTheBest написал:
Также неплохо бы взглянуть на структуру исходных данных
Я надеюсь, что верно ответил на Ваш вопрос. Исходная таблица отличается от представленной лишь тем, что имеет рабочие названия столбцов и гораздо большее количество строк (несколько месяцев).
 
А что такое "Лист управления" -  то, что требуется получить?  
Неизлечимых болезней нет, есть неизлечимые люди.
 
Цитата
TheBestOfTheBest написал:
А что такое "Лист управления" -  то, что требуется получить?  
Попробую ответить на Ваш вопрос с помощью технического задания.

"Другие настройки поиска расположены на листе "ЛистУправления"
"Насколько максимально подобные - мне хотелось бы иметь возможность управлять этим на Листе Управления."
"Скажем, если в какой-либо ячейке на Листе Управления мною выставлено число 10 (это % погрешности), то это означает, что погрешность НЕ должна превышать 10% (т.е. изменяется в диапазоне 0-10%)."
"Здесь мне нужно рассказать о погрешностях на листе управления, которые мне необходимо задавать."
"В ЛистеУправления в цветных ячейках должны отображаться расчетные результаты для контроля."

Это все фразы, где упоминается лист управления в задании на одноименной вкладке. Что из них можно почерпнуть? Ответы соответствуют приведенным выше фразам.
- на листе управления располагаются настройки поиска (значит, лист, как минимум, имеет некоторую статичную часть);
- эти настройки позволяют управлять степенью подобия найденных комбинаций и эталонной комбинации (опять же речь идет о настройках на листе, они относятся к статичной части листа);
- я имею возможность задавать значения в ячейках настроек (это уже значит, что Лист Управления содержит в себе предусловия поиска, которые не являются результатом);
- снова упоминание о возможности управлять погрешностью;
- лист должен содержать результаты расчета (значит, лист также имеет некоторую нестатичную часть).

Также в задании есть фраза "Если анализируется последовательность дней, то автоматически должны появляться несколько однотипных блоков "по конкретной дате из выборки".
Она говорит о том, что есть блок, который называется "по конкретной дате из выборки" - он включает в себя три 3 подблока с расчетными данными. Например, в техническом задании есть 3 подблока с обозначениями 31-24, 30-23, 28-21.

Если бы Excel мог говорить, то он сказал бы примерно следующее:
">> Я взял эталонную комбинацию из трех дней - (31-30-28), - данные которой обозначены зеленым цветом в листе "Пример результата", и нашел несколько подобных комбинаций.
>> Так как этих комбинаций несколько, то мне надо расположить их близко друг от друга (образовать некий блок - совокупность блоков "по конкретной дате из выборки") и сравнить с эталонными данными, чтобы было проще анализировать визуально.
>> Я буду делать это на Листе Управления, как сказано, - это позволит оперативно видеть результат, если будут меняться погрешности.
>> Для этих целей мне выделили блок "по конкретной дате из выборки" - отлично, я смогу сравнить каждую дату из комбинации с соответствующей эталонной датой из эталонной комбинации.
>> Я обязательно найду лучшую комбинацию, поэтому ее надо будет расположить первой в блоке "по конкретной дате из выборки" - в примере это 3 подблока 31-24, 30-23, 28-21.
>> Я помню из задания что ("Чем ниже располагается подблок с комбинациями, тем ближе его данные отклоняются к максимальным значениям погрешностей."), поэтому самые несоответствующие комбинации я расположу в самом низу блока "по конкретной дате из выборки".
>> Я знаю, что есть блок "по всем датам в каждой выборке", он предназначен для того, чтобы я вставил туда СУММАРНЫЕ данные эталонной комбинации и лучшей найденной комбинации.
>> Я понял, что Лист Управления имеет как статичную, так и динамическую части (на прикрепленном изображении синим цвет - статичная часть, красный - динамическая).
>> Динамическая часть состоит из одинаковых по структуре, но различных по наполнению данными блоков.
>> Я буду менять только числовые данные в блоке "по всем датам в каждой выборке".
>> Я буду менять числовые данные и количественное содержание по блокам "по конкретной дате из выборки".

Я надеюсь, что смог объяснить. Лист Управления - это и причина, и следствие. Это пульт управления, где есть и управляющая часть (настройки) и управляемая часть (результат)
Изменено: mr.biogen - 01.07.2017 09:37:51
Страницы: 1
Читают тему
Наверх