Страницы: 1
RSS
Гистограмма статистического распределения - нюансы., Как лучше и правильнее организовать?
 
Есть простая таблица с набором чисел (замеры времени) - см. вложение.
Нужно построить простую гистограмму распределения.
При попытке сделать это сразу возникают вопросы.

1. Часть ячеек незаполненная или имеет знак "-". И то, и другое имеет смысл. То есть тупо заполнить пустые ячейки нулями неправильно. Во-первых, там не нулевое время, просто его ещё не замеряли или замеряли, но не работала аппаратура. Во-вторых, как следствие, в этом случае на гистограмме появится пик нулевых значений, превышающий максимум реальных значений. Но на ячейки, в которых нечисловые данные, ругается мастер создания диаграмм.
Можно ли, и как, игнорировать пустые ячейки и/или ячейки с текстом или каким-то образом маскировать их?
2. Можно ли сделать так, чтобы статистическая гистограмма менялась в реальном режиме времени после внесения новых данных в исходную таблицу, чтобы Excel автоматически пересчитывал вспомогательную? Ну, как это происходит с обычной гистограммой?
3. Как грамотнее подобрать данные для "Карманов"? Предполагаю, что горизонтальная шкала имеет логарифмический характер, поэтому ставлю, к примеру, в первую ячейку столбца значение 0:00:4 , а дальнейшие ячейки заполняю геометрической прогрессией с шагом, например, 1.2. Ну или тоже самое делаю формулой. В качестве множителя могу использовать функцию КОРЕНЬ(2), например. Наверное, можно попробовать и регрессивную шкалу? Т.е. брать максимальное значение и делить его?
Есть вариант автоматического выбора масштаба горизонтальной оси, но он работает отвратительно, или я что-то не так делаю. Способов автоматического расчёта логарифмической (степенной) шкалы я не нашёл.
То есть мне бы хотелось получить красивую картинку в виде нормального распределения, хотя и так неплохо.
4. Когда я задаю границы исходных данных для гистограммы, заголовком новой таблицы и, собственно, самой диаграммы, становится первое значение области данных. Если я правильно понимаю, первая строка выпадает из расчётов? Как использовать ВЕСЬ набор данных?
5. Этот вопрос относится ко всем гистограммам. Можно ли и как на гистограмме с горизонтальной осью дат, подкрашивать фоном столбцы выходных? Всегда востребованная задача.

Спасибо!
 
По пунктам 1 и 2 поможет функция ЧАСТОТА с "отбраковкой" обрабатываемых значений, равных нулю и пустых. Нечисловые значения "-" игнорируются самой функцией. Чтобы добавляемые данные учитывались в распределении, диапазон данных взят до последнего столбца. Округление до 6 знаков после запятой в "карманов" связано с тем, что иначе не совсем корректно считается количество, т.к. значение в ячейке карманов изначально не ровно 4 или 5 (и т.д.) секунд.
 
Спасибо за ответ.
Цитата
Wanschh написал:
По пунктам 1 и 2 поможет функция ЧАСТОТА с "отбраковкой" обрабатываемых значений, равных нулю и пустых
Если ЧАСТОТА корректно обрабатывает пустые значения, то может и нет смысла их отбрасывать?
Если модуль ГИСТОГРАММА вообще отработает при наличии нулевых значений, то ЧАСТОТА лишь выложит их в свой "карман", правильно?
Я же могу добавить нулевую строчку в кармане и потом просто не использовать её при построении гистограммы?
И если можно, объясните по поводу необходимости округлений секунд?
Вы же предлагаете округлять "до 6 знака после запятой", стало быть, число секунд в результате всё равно будет дробным? В формате ЕКСЕЛЬ секунды хранятся как ДОЛИ от суток, верно? Т.е. секунда, строго говоря, составляет 0.0000115740740740741. Вот если бы можно было округлять именно до СЕКУНД..
Но в любом случае я не понимаю, почему получается такая разница в суммировании количества измерений особенно в малых значениях времени при использовании округления и без него...  
 
Я, наверно, неточно написал. Функция ЧАСТОТА игнорирует нечисловые значения "-", а нули и пустые ячейки отбрасываются с помощью вот этой части введенной формулы: =ЧАСТОТА(ЕСЛИ($A4:$W104>0;$A4:$W104);ОКРУГЛ($A$108:$A$147;6)). В результате из диапазона $A4:$W104учитываются только значения, которые больше нуля.

Насчет округления. Секунды в Excel - доли от суток. В диапазоне "карманов" значения получены с помощью формул, и мы видим "5 секунд", а на самом деле там немного меньше, из-за чего получается некорректный подсчет количества значений. По идее, функция ЧАСТОТА напротив строки "5 секунд" должна выдавать количество значений меньших или равных 5 секундам и при этом больше 4 секунд. Из-за того, что в "кармане" значение меньше 5 секунд, в этот интервал не попадают значения, которые как мы видим, должны вроде бы туда относиться. Число 6 знаков может быть изменено, как Вам нужнее.
Разница между значением в "кармане" и значением 5 секунд составляет 5,56*10^-5 - 5,79*10^-5 = -2.31*10^-6. Получается, что значения в таблице между 5,56*10^-5 и 5,79*10^-5 в одном случае попадают в интервал 4-5 секунд, а в другом нет. В файле они подсвечены.
Изменено: Wanschh - 09.02.2017 16:20:51
 
Цитата
Wanschh написал:
Я, наверно, неточно написал. Функция ЧАСТОТА игнорирует нечисловые значения "-", а нули и пустые ячейки отбрасываются с помощью вот этой части введенной формулы:
Вы написали предельно ясно, это я неточно спросил ;)
Имелось в виду - зачем их вообще отбрасывать, усложняя формулу?
Пусть бы себе падали в карман 0:00:00? А мы можем просто этот карман не использовать при построении гистограммы.
Цитата
Wanschh написал:
Насчет округления. Секунды в Excel - доли от суток. В диапазоне "карманов" значения получены с помощью формул, и мы видим "5 секунд", а на самом деле там немного меньше, из-за чего получается некорректный подсчет количества значений.
Дык, в случае округления "до 6 знака" в десятичной системе мы всё равно не получим в результате ЦЕЛЫХ секунд! Это всё равно не будет точно 0:00:05, это будет просто другое дробное число! ;)
Т.е. я понял Вашу идею, но чтобы реально округлить до количества секунд, надо исхитряться каким-то другим способом, вроде функции СЕКУНДЫ().
К тому же, для пользы дела непринципиально точное попадание количества замеров в карманы. Главное, понять тенденцию.
ПО СУТИ, в моём случае подсчёт замеров и попадание в карманы - правильное, т.к. карманы рассчитаны по точной формуле геометрической прогрессии.
А вот подписи немного неточны из-за округления. Ну так оно и так достаточно условное.
Вот если бы можно было округлять подпись нижней шкалы до красивых цифр вроде 0:05, 0:10; 015; 0:30 и т.п., но ввиду опять же геометрической прогрессии можно будет голову сломать, придумывая алгоритм шкалы, приближенной к логарифмической, и при этом красивой.
Предпочитаю забить.
Страницы: 1
Читают тему
Наверх