Имеется очень много данных. Т.е. Размер выборки не менее 100 значений для 27 разных критериев. Необходимо получить их анализ в виде: "Значения изменялись с вероятностью 99,7% в пределах 13,99%±3*0,0092%. Т.е. доверительный интервал находится в пределах от 11,2% до 16,7%." 0,0092% - я так понимаю ошибка среднего - то есть СКО делить на корень из количества измерений.
Статистику вообще не помню. Очень надо понять.... Откуда берётся 99,7%? И не понимаю что делать с данными числами дальше? То есть я получил доверительный интервал от 11,2 до 16,7 и что дальше? На этом всё? Или нужно выкинуть значения меньше 11 и больше 16 и опять пересчитать дисперсию, СКО? Заранее спасибо за помощь. Что-то не получается найти пример подобных расчётов....
МПМ, раз делаете в Excel, приложите файл-пример, чтобы мы тут поняли, что есть, что нужно и какие шаги в данном направлении уже проделаны...
Во всех делах очень полезно периодически ставить знак вопроса к тому, что вы с давних пор считали не требующим доказательств (Бертран Рассел) ►Благодарности сюда◄
Jack_Famous, таблица огромная. там ничего понятно не будет. Например, я в ней посчитал данные пункты для одного критерия из 27. Выборка получилась 6 значений.
мин
макс
размах
среднее
дисперсия
СКО
ошибка среднего
6,67%
25,00%
18,33%
13,02%
0,00404573
0,06360607
0,01590152
написал анализ от балды:
Значения изменялись с вероятностью 99,7% в пределах 13,01%±3*0,0159%. Т.е. доверительный интервал находится в пределах от 8,2% до 17,7%.
тема то Правило трёх сигм (хотя можно было и загуглить)... сигма - это корень из дисперсии... умножайте на 3...
Цитата
МПМ написал: "Значения изменялись с вероятностью 99,7% в пределах 13,99%±3*0,0092%. "
в чём проблема? - найти среднее +/- (3*корень из дисперсии)
Цитата
МПМ написал: Т.е. доверительный интервал находится в пределах от 11,2% до 16,7%."
выполните от среднего эти действия (+/-) сколько нашли... будет вам доверительный интервал p.s. дальше лирика
Цитата
МПМ написал: ,0092% - я так понимаю ошибка среднего - то есть СКО делить на корень из количества измерений.
... вы сначала корень из дисперсии извлеките, а потом называйте это, как хотите... делить не надо... а про сигмы в статистике загуглите само правило 3х сигм... увидите распроцентовку... 3сигма - это вроде и есть 99,7%... возможно, даже всегда... поэтому можно смело заявлять "С вероятностью 99,7%..." - и всё что просчитали выше... P.S. логику расчёта сигмы прописала, но ещё она называется ср.квадратичное отклонение... может быть, даже стандартное отклонение (есть функция в xl), если не ошибаюсь, - покрутите цифры (и справку по функции СТАНДОТКЛОН), если не хотите извлекать корень из дисперсии...
чтобы не гадать на кофейной гуще, кто вам отвечает и после этого не совершать кучу ошибок - обратитесь к собеседнику на ВЫ - ответ на ваш вопрос получите - а остальное вас не касается (п.п.п. на форумах)
JeyCi,нашёл статью. Пишут: 68,3% площади под нормальной кривой лежит в пределах +/- величины одного стандартного отклонения от значения средней арифметической. Примерно 95,5% площади находится в пределах +/- 2 стандартных отклонения, а 99,7% площади в пределах +/- 3 стандартных отклонения от средней. В равной степени правильно и то, что 95% площади находится в пределах +/- 1,96 стандартных отклонений от средней. А для подсчёта пределов 99,7% доверительного интервала при выборке 30 и более значений необходимо: xср +/-3 * стандартная ошибка среднего. Стандартная ошибка средней зависит от двух составляющих: стандартного отклонения и объема выборки. Чем больше наблюдения отличаются от средней, тем больше "неуверенность" в величине средней, и тем больше стандартная ошибка средней. Чем больше объем выборки, тем больше уверенность в том, что получаемое значение будет близко к величине генеральной средней и тем меньше, соответственно, стандартная ошибка средней. Т.е. получается, что это уже не правило трёх сигм, а что-то другое.... И что меняется, если выборка меньше 30 значений тоже непонятно. Ну и будем считать, что данные данные нормально распределены, так как я в этом ничего не понимаю)))
МПМ, с помощью Excel можно решать различные задачи - по статистике, финансовые вычисления, проектирования и прогнозы, матанализ... Но для этого нужно: а) владеть Excel на уровне, достаточном для решения выбранной задачи; б) знать предмет адачи.
Если с первым пунктом на этом форуме проблем нет (есть специалисты разного уровня подготовки), то со вторым... Искать иголку в стоге сена? Здесь может не оказаться человека, владеющего статистикой. Сначала найти специализированный форум и решить задачу в родной среде, а потом уже пытаться решить ее с помощью вспомогательной программы - Excel. "Правило трех сигм" на форуме по Excel звучит как "оператор безусловного перехода" на форуме по статистике Т.е. пока что Ваш вопрос никакого отношения к Excel не имеет.
МПМ. мне статью перепечатывать не надо... я вам высказала, что есть что по вопросу ветки и по данному правилу (хоть это и не относится к тематике данного форума - посему переводить вам всю статистику в рамках этой темы на этом форуме не вижу смысла)... и времени
Цитата
МПМ написал: Т.е. получается, что это уже не правило трёх сигм, а что-то другое....
это интерпретация графика дисперсии (сигма квадрат - график парабола - в зависимости от её вида так и читается, как в вашем посте)... вы же ищите там, где читаете, а не мы будем работать гугл-переводчиками ... извините, нет времени на оффтоп для данного форума... успехов вам
чтобы не гадать на кофейной гуще, кто вам отвечает и после этого не совершать кучу ошибок - обратитесь к собеседнику на ВЫ - ответ на ваш вопрос получите - а остальное вас не касается (п.п.п. на форумах)
По Вашей логике, на хорошем форуме по Excel должны решать задачи по теормеханике, досконально знать геометрию, быть крутыми финансистами, здесь должны разбираться в работе двигателя внутреннего сгорания и уметь вязать на спицах. А если нет, то обязательно должны найти специализированный форум и дать Вам ссылку. Томас Мор, Утопия... Не об этом книга?
P.S. мне кстати не хочется вам усложнять жизнь... но некоторые считают и дисперсию от средней и потом ещё дисперсию от ошибки... наверно в некоторых исследованиях это как-то для них логично... не знаю вашу специфику ввобще и как вам делать и интерпретировать стат. обработку... поэтому советую, не усложнять себе жизнь, а выделять главное и делать выводы... про функцию СТАНДОТКЛОН в xl написала...или КВАДРОТКЛ (Справка по функциям в помощь и покрутите на своих цифрах)... (что вам больше подойдёт)... как вы её будете интерпретировать в рамках ваших данных - вам лучше знать... а с какой стороны на это дело смотреть - как нравится - хоть с точки зрения дисперсии (ДИСП), хоть с точки зрения извлечения из неё корня квадратного - просто чтобы обозвать это отклонением (или через соотв.функцию)...
Цитата
vikttur написал: и уметь вязать на спицах.
- надо учиться, чтобы связывать частички инфо в общее целое... разные ветки в древо СВОИХ знаний... ТС, ещё раз успехов вам P.P.S а вообще да - статистика - это утопия... Закон больших чисел (где же их столько брать, и как потом дождаться попадания в среднюю )
чтобы не гадать на кофейной гуще, кто вам отвечает и после этого не совершать кучу ошибок - обратитесь к собеседнику на ВЫ - ответ на ваш вопрос получите - а остальное вас не касается (п.п.п. на форумах)
vikttur,самое интересное, что время критиковать есть, а сказать по делу что-то нет. Как умею - так и пытаюсь найти решение вопроса. Так что удаляйте эту тему. Спасибо за конструктивную критику. Очень помогло.
чтобы не гадать на кофейной гуще, кто вам отвечает и после этого не совершать кучу ошибок - обратитесь к собеседнику на ВЫ - ответ на ваш вопрос получите - а остальное вас не касается (п.п.п. на форумах)
МПМ, позвольте мне самому распоряжаться своим временем. По делу я Вам четко сказал - со спецвопросами нужно обращаться на спецфорумы. Прошу учесть - это замечание модератора, а не критика.
Цитата
Как умею - так и пытаюсь найти решение вопроса
... не важно, что не в тему и есть определенные правила... На форуме по математике не пробовали поискать? По Word? Тоже как бы связано (и считать, и писать нужно)...
По Вашем вопросу сказать нечего, статанализом не владею. Тема перенесена в Курилку
МПМ написал: И что меняется, если выборка меньше 30 значений тоже непонятно.
достоверность: чем больше выборка, тем с большей уверенностью можно полагаться на стат. анализ
Цитата
МПМ написал: Ну и будем считать, что данные данные нормально распределены, так как я в этом ничего не понимаю)))
по правильному это надо не считать, а доказать... это отдельное стат. исследование... если поведение ваших данных подчиняется описанию нормального распределения - так его рассматривали во все времена - можете просто сослаться на любой источник (научную статью)... Тогда просто определить параметры нормального распределения (СРЗНАЧ, Моду, Медиану, СТАНДОТКЛОН, СКОС, ЭКСЦЕСС - функции xl... (если надо)
Цитата
The basic parameters of the normal distribution are as follows:
чтобы не гадать на кофейной гуще, кто вам отвечает и после этого не совершать кучу ошибок - обратитесь к собеседнику на ВЫ - ответ на ваш вопрос получите - а остальное вас не касается (п.п.п. на форумах)
может быть нормальным ассимитричным и с эксцессом... не пренебрегайте гуглом P.S. кстати, терминология стат. терминов хорошо обозначена здесь (по теме экономической - Статистический анализ данных в Excel - прокрутить страницу ниже) - но смысл стат. показателей одинаков для любых сфер, к которым применяется стат. анализ...
чтобы не гадать на кофейной гуще, кто вам отвечает и после этого не совершать кучу ошибок - обратитесь к собеседнику на ВЫ - ответ на ваш вопрос получите - а остальное вас не касается (п.п.п. на форумах)
Не совсем понятна постановка вопроса. Если нужно найти доверительный интервал - см. Точечные и интервальные оценки, но правило трёх сигм к доверительному интервалу имеет косвенное отношение. Если нужно оценить наличие грубых ошибок по критерию трёх сигм - см. Критерий трёх сигм, но надо иметь в виду, что критерий трёх сигм статистически менее обоснован, чем другие критерии грубых ошибок. Кроме ого, и в первом, и во втором случае необходимо, чтобы случайная величина, из которой взята выборка, имела нормальное распределение (точнее, достаточно хорошо моделировалась нормальным распределением). Оценка нормальности распределения проводится при помощи статистических критериев оценки вида распределения- общих критериев согласия или специальных критериев нормальности. Некоторые из них описаны на том же сайте. там есть и примеры с использованием Excel.