Страницы: 1
RSS
Правило трёх сигм и доверительный интервал
 
Имеется очень много данных. Т.е. Размер выборки не менее 100 значений для 27 разных критериев. Необходимо получить их анализ в виде:
"Значения изменялись с вероятностью 99,7% в пределах 13,99%±3*0,0092%. Т.е. доверительный интервал находится в пределах от 11,2% до 16,7%."
0,0092% - я так понимаю ошибка среднего -  то есть СКО делить на корень из количества измерений.

Статистику вообще не помню. Очень надо понять.... Откуда берётся 99,7%?  И не понимаю что делать с данными числами дальше?
То есть я получил доверительный интервал от 11,2 до 16,7 и что дальше? На этом всё? Или нужно выкинуть значения меньше 11 и больше 16 и опять пересчитать дисперсию, СКО? Заранее спасибо за помощь. Что-то не получается найти пример подобных расчётов....  :oops:
Изменено: МПМ - 16.04.2016 18:58:22
 
А какое отношение это имеет к екселю?)
 
Dima S,делаю я всё в экселе)) только не понимаю, что делаю) И понятия не имею где спросить. Здесь то уж точно есть профессионалы по статистике. :cry: :oops:
Изменено: МПМ - 16.04.2016 19:28:13
 
МПМ, раз делаете в Excel, приложите файл-пример, чтобы мы тут поняли, что есть, что нужно и какие шаги в данном направлении уже проделаны... ;)
Во всех делах очень полезно периодически ставить знак вопроса к тому, что вы с давних пор считали не требующим доказательств (Бертран Рассел) ►Благодарности сюда◄
 
Jack_Famous, таблица огромная. там ничего понятно не будет.
Например, я в ней посчитал данные пункты для одного критерия из 27. Выборка получилась 6 значений.
минмаксразмахсреднеедисперсияСКОошибка среднего
6,67%25,00%18,33%13,02%0,004045730,063606070,01590152
написал анализ от балды:
Значения изменялись с   вероятностью 99,7% в пределах 13,01%±3*0,0159%. Т.е. доверительный интервал   находится в пределах от 8,2% до 17,7%.
Но не понимаю что написал. :oops: :sceptic:
Изменено: МПМ - 16.04.2016 19:52:46
 
Цитата
МПМ написал: Но не понимаю что написал
Здесь точно помогут.
 
Цитата
Doober написал:
Здесь точно помогут.
:D  +++
 
тема то Правило трёх сигм (хотя можно было и загуглить)... сигма - это корень из дисперсии... умножайте на 3...
Цитата
МПМ написал: "Значения изменялись с вероятностью 99,7% в пределах 13,99%±3*0,0092%. "
в чём проблема? - найти среднее +/-  (3*корень из дисперсии)
Цитата
МПМ написал: Т.е. доверительный интервал находится в пределах от 11,2% до 16,7%."
выполните от среднего эти действия (+/-) сколько нашли... будет вам доверительный интервал
p.s.
дальше лирика
Цитата
МПМ написал: ,0092% - я так понимаю ошибка среднего -  то есть СКО делить на корень из количества измерений.
... вы сначала корень из дисперсии извлеките, а потом называйте это, как хотите... делить не надо...
а про сигмы в статистике загуглите само правило 3х сигм... увидите распроцентовку... 3сигма - это вроде и есть 99,7%... возможно, даже всегда... поэтому можно смело заявлять "С вероятностью 99,7%..." - и всё что просчитали выше...
P.S.
логику расчёта сигмы прописала, но ещё она называется ср.квадратичное отклонение... может быть, даже стандартное отклонение (есть функция в xl), если не ошибаюсь, - покрутите цифры (и справку по функции СТАНДОТКЛОН), если не хотите извлекать корень из дисперсии...
Изменено: JeyCi - 17.04.2016 07:57:56
чтобы не гадать на кофейной гуще, кто вам отвечает и после этого не совершать кучу ошибок - обратитесь к собеседнику на ВЫ - ответ на ваш вопрос получите - а остальное вас не касается (п.п.п. на форумах)
 
JeyCi,нашёл статью. Пишут: 68,3% площади под нормальной кривой лежит в пределах +/- величины одного стандартного отклонения от значения средней арифметической. Примерно 95,5% площади находится в пределах +/- 2 стандартных отклонения, а 99,7% площади в пределах +/- 3 стандартных
 отклонения от средней. В равной степени правильно и то, что 95% площади находится в пределах +/- 1,96 стандартных отклонений от средней.
А для подсчёта пределов 99,7% доверительного интервала
при выборке 30 и более значений необходимо: xср +/-3 * стандартная ошибка среднего.
Стандартная ошибка средней зависит от двух составляющих: стандартного    отклонения и объема выборки. Чем больше наблюдения отличаются от средней, тем    больше "неуверенность" в величине средней, и тем больше стандартная ошибка средней.    Чем больше объем выборки, тем больше уверенность в том, что получаемое значение    будет близко к величине генеральной средней и тем меньше, соответственно, стандартная    ошибка средней.
Т.е. получается, что это уже не правило трёх сигм, а что-то другое....
И что меняется, если выборка меньше 30 значений тоже непонятно. Ну и будем считать, что данные данные нормально распределены, так как я в этом ничего не понимаю)))
Изменено: МПМ - 17.04.2016 09:47:57
 
МПМ, с помощью Excel можно решать различные задачи - по статистике, финансовые вычисления, проектирования и прогнозы, матанализ... Но для этого нужно:
а) владеть Excel на уровне, достаточном для решения выбранной задачи;
б) знать предмет адачи.

Если с первым пунктом на этом форуме проблем нет (есть специалисты разного уровня подготовки), то со вторым... Искать иголку в стоге сена? Здесь может не оказаться человека, владеющего статистикой.
Сначала найти специализированный форум и решить задачу в родной среде, а потом уже пытаться решить ее с помощью вспомогательной программы - Excel.
"Правило трех сигм" на форуме по Excel звучит как "оператор безусловного перехода" на форуме по статистике :)
Т.е. пока что Ваш вопрос никакого отношения к Excel не имеет.
 
vikttur,Эх.. Если бы я знал хороший форум по статистике... А этот форум прекрасен и множество умных людей)
 
Цитата
МПМ написал: JeyCi,нашёл статью.
МПМ. мне статью перепечатывать не надо... я вам высказала, что есть что по вопросу ветки и по данному правилу (хоть это и не относится к тематике данного форума - посему переводить вам всю статистику в рамках этой темы на этом форуме не вижу смысла)... и времени
Цитата
МПМ написал: Т.е. получается, что это уже не правило трёх сигм, а что-то другое....
это интерпретация графика дисперсии (сигма квадрат - график парабола - в зависимости от её вида так и читается, как в вашем посте)... вы же ищите там, где читаете, а не мы будем работать гугл-переводчиками  :( ... извините, нет времени на оффтоп для данного форума... успехов вам
Изменено: JeyCi - 17.04.2016 10:10:18
чтобы не гадать на кофейной гуще, кто вам отвечает и после этого не совершать кучу ошибок - обратитесь к собеседнику на ВЫ - ответ на ваш вопрос получите - а остальное вас не касается (п.п.п. на форумах)
 
По Вашей логике, на хорошем форуме по Excel должны решать задачи по теормеханике, досконально знать геометрию, быть крутыми финансистами, здесь должны разбираться в работе двигателя внутреннего сгорания и уметь вязать на спицах. А если нет, то обязательно должны найти специализированный форум и дать Вам ссылку.
Томас Мор, Утопия... Не об этом книга? :)
 
P.S.
мне кстати не хочется вам усложнять жизнь... но некоторые считают и дисперсию от средней и потом ещё дисперсию от ошибки... наверно в некоторых исследованиях это как-то для них логично... не знаю вашу специфику ввобще и как вам делать и интерпретировать стат. обработку... поэтому советую, не усложнять себе жизнь, а выделять главное и делать выводы... про функцию СТАНДОТКЛОН в xl написала...или КВАДРОТКЛ (Справка по функциям в помощь и покрутите на своих цифрах)... (что вам больше подойдёт)... как вы её будете интерпретировать в рамках ваших данных - вам лучше знать... а с какой стороны на это дело смотреть - как нравится - хоть с точки зрения дисперсии (ДИСП), хоть с точки зрения извлечения из неё корня квадратного - просто чтобы обозвать это отклонением (или через соотв.функцию)...
Цитата
vikttur написал: и уметь вязать на спицах.
:D - надо учиться, чтобы связывать частички инфо в общее целое... разные ветки в древо СВОИХ знаний... ТС, ещё раз успехов вам
P.P.S
а вообще да - статистика - это утопия... Закон больших чисел (где же их столько брать, и как потом дождаться попадания в среднюю  8) )
Изменено: JeyCi - 17.04.2016 10:39:19
чтобы не гадать на кофейной гуще, кто вам отвечает и после этого не совершать кучу ошибок - обратитесь к собеседнику на ВЫ - ответ на ваш вопрос получите - а остальное вас не касается (п.п.п. на форумах)
 
vikttur,самое интересное, что время критиковать есть, а сказать по делу что-то нет. Как умею - так и пытаюсь найти решение вопроса. Так что удаляйте эту тему. Спасибо за конструктивную критику. Очень помогло.
 
Цитата
МПМ написал: Так что удаляйте эту тему.
зачем я столько вам писала  8-0 ... это неуважение к ответу  :evil: ... по теме!
Изменено: JeyCi - 17.04.2016 10:43:09
чтобы не гадать на кофейной гуще, кто вам отвечает и после этого не совершать кучу ошибок - обратитесь к собеседнику на ВЫ - ответ на ваш вопрос получите - а остальное вас не касается (п.п.п. на форумах)
 
МПМ, позвольте мне самому распоряжаться своим временем.
По делу я Вам четко сказал - со спецвопросами нужно обращаться на спецфорумы. Прошу учесть - это замечание модератора, а не критика.
Цитата
Как умею - так и пытаюсь найти решение вопроса
...  не важно, что не в тему и есть определенные правила... На форуме по математике не пробовали поискать? По Word? Тоже как бы связано (и считать, и писать нужно)...

По Вашем вопросу сказать нечего, статанализом не владею.
Тема перенесена в Курилку
 
JeyCi, Спасибо) Ваши ответы - да, полезны)
 
Цитата
МПМ написал: И что меняется, если выборка меньше 30 значений тоже непонятно.
достоверность: чем больше выборка, тем с большей уверенностью можно полагаться на стат. анализ

Цитата
МПМ написал:  Ну и будем считать, что данные данные нормально распределены, так как я в этом ничего не понимаю)))
по правильному это надо не считать, а доказать... это отдельное стат. исследование... если поведение ваших данных подчиняется описанию нормального распределения - так его рассматривали во все времена - можете просто сослаться на любой источник (научную статью)...
Тогда просто определить параметры нормального распределения (СРЗНАЧ, Моду, Медиану, СТАНДОТКЛОН, СКОС, ЭКСЦЕСС - функции xl... (если надо)
Цитата
The basic parameters of the normal distribution are as follows:
  • Mean = median = mode = µ (СРЗНАЧ, Моду, Медиану)
  • Standard deviation = σ
  • Skewness = kurtosis = 0 (СКОС, ЭКСЦЕСС)
сайт по статистике: www.real-statistics.com
Изменено: JeyCi - 17.04.2016 11:34:54
чтобы не гадать на кофейной гуще, кто вам отвечает и после этого не совершать кучу ошибок - обратитесь к собеседнику на ВЫ - ответ на ваш вопрос получите - а остальное вас не касается (п.п.п. на форумах)
 
JeyCi, Например,
минмаксразмахср значдисперсияСКОошибка среднего
6,67%25,00%18,33%13,02%0,004045730,063606070,01590152
скос= 0,705205744

эксцесс= -0,417495757
Раз скос и эксцесс не ноль, значит это не нормальное распределение?
 
может быть нормальным ассимитричным и с эксцессом... не пренебрегайте гуглом  ;)
P.S.
кстати, терминология стат. терминов хорошо обозначена здесь (по теме экономической - Статистический анализ данных в Excel - прокрутить страницу ниже) - но смысл стат. показателей одинаков для любых сфер, к которым применяется стат. анализ...
Изменено: JeyCi - 17.05.2016 12:33:39
чтобы не гадать на кофейной гуще, кто вам отвечает и после этого не совершать кучу ошибок - обратитесь к собеседнику на ВЫ - ответ на ваш вопрос получите - а остальное вас не касается (п.п.п. на форумах)
 
Не совсем понятна постановка вопроса. Если нужно найти доверительный интервал - см. Точечные и интервальные оценки, но правило трёх сигм к доверительному интервалу имеет косвенное отношение. Если нужно оценить наличие грубых ошибок по критерию трёх сигм - см. Критерий трёх сигм, но надо иметь в виду, что критерий трёх сигм статистически менее обоснован, чем другие критерии грубых ошибок.
Кроме ого, и в первом, и во втором случае необходимо, чтобы случайная величина, из которой взята выборка, имела нормальное распределение (точнее, достаточно  хорошо моделировалась нормальным распределением). Оценка нормальности распределения проводится при помощи статистических критериев оценки вида распределения- общих критериев согласия или специальных критериев нормальности. Некоторые из них описаны на том же сайте. там есть и примеры с использованием Excel.
Изменено: retros - 20.07.2018 17:22:29
Страницы: 1
Наверх