Страницы: 1 2 След.
RSS
Математическая статистика
 
Прошу модераторов меня сильно не "пинать", но у меня вопрос не только по эксель. Хотел для начала обратится на математический форум, но когда почитал соответствующие ветки, то понял, что там помогут только теоретической частью в лучшем случае и пошлют меня в "какой-нибудь" матлаб, а я люблю ексель)))
Поэтому решил все таки обратиться сюда, так как неоднократно видел здесь светлые математические головы, да и еще к тому же на "ты" с эксель. Мне даже задачу проще объяснить на примере в экселе, так как я ни разу не математик)))

Описание задачи в файле эксель.  
 
sir.benoit, если вы хотите, чтобы значения в узлах совпадали с табличными, надо не регрессионные модели строить, а использовать интерполяцию, осталось только понять, какой именно метод интерполяции вас устроит
Соблюдение правил форума не освобождает от модераторского произвола
 
buchlotnik, цель получить достоверные данные, а способ не так важен. Т.е. Вы же понимаете, если подставляя значение из "Данные 2"  мы не получаем соответствующее число из "Данных 1", то как тогда относится к достоверности полученных значений "Данные 1" подставляя произвольные значения из столбца "Данные 2"?! Тут как бы своего рода проверка точности расчета, особенно точность важна на меньшие значения "Данные 2". Я предположил, что может быть можно подправить значения в обоих столбцах, чтобы Rквадраты были единицы. Или эти числа сильно изменятся от текущих, а на сколько сильно? Может я вообще не правильно подошел к подобному расчету, как умею... Предложите пожалуйста свой расчет.
Изменено: sir.benoit - 10.07.2020 16:55:08
 
полиномы 4-й степени скользят строго по вашим точкам (см. вложение)
Программисты - это люди, решающие проблемы, о существовании которых Вы не подозревали, методами, которых Вы не понимаете!
 
Цитата
sir.benoit написал:
как тогда относится к достоверности полученных значений
о какой достоверности вообще может идти речь, когда в исходных данных всего четыре точки, и вы их собрались "подправить".
во вложении простая линейная интерполяция

UPD
Цитата
Ігор Гончаренко написал:
полиномы 4-й степени
для четырех точек достаточно 3-ей  ;)
Изменено: buchlotnik - 10.07.2020 17:21:25
Соблюдение правил форума не освобождает от модераторского произвола
 
согласен)
и... полином точно проходит по заданным точкам, но то, как как функция "петляет" на промежуточных значениях Х - может оказаться неприятным сюрпризом(((
Изменено: Ігор Гончаренко - 10.07.2020 17:37:13
Программисты - это люди, решающие проблемы, о существовании которых Вы не подозревали, методами, которых Вы не понимаете!
 
buchlotnik, а если подставить другое значение, вместо 4511, например 2711, то он выдает #H/Д, что делать?
 
Цитата
sir.benoit написал:
что делать?
нужно описать свою задачу, тогда можно получить ее решение
а пока нет описания задачи - пользуйтесь тем что для вас сделали на основании собственных догадок по мотивам вашей задачи
Изменено: Ігор Гончаренко - 10.07.2020 17:44:19
Программисты - это люди, решающие проблемы, о существовании которых Вы не подозревали, методами, которых Вы не понимаете!
 
Ігор Гончаренко, а если подставить значения в Вашем файле, вместо 4511, например 300000, то расчетное значение получилось 125889166,6, хотя 300000 лежит между числами 148948 и 643185, т.е. по логике, значение "данные 1" должны быть между 200 и 780!

Что то я видимо не правильно объяснил, что мне надо...
 
buchlotnik, вот из Вашего файла, я добавил 2711 какое значение будет в первом столбце:
?2711
84511
5130000
200148948
780643185
 
Цитата
sir.benoit написал:
хотя 300000 лежит между числами 148948 и 643185, т.е. по логике, значение "данные 1" должны быть между 200 и 780!
По какой логике?
Я воткнул вольтметр в обычную электрическую розетку. На 5 миллисекунде зафиксировал напряжение +50 вольт, а на 8 миллисекунде -35 вольт. Означает ли это, что напряжение электрической  цепи в моей квартире лежит между -35 вольт и 50 вольт? Как вы думаете, зачем нужно немного знать математику?
Изменено: Андрей VG - 10.07.2020 17:55:48
 
я об этом писал выше:
Цитата
Ігор Гончаренко написал:
но то, как как функция "петляет" на промежуточных значениях Х - может оказаться неприятным сюрпризом(((
Программисты - это люди, решающие проблемы, о существовании которых Вы не подозревали, методами, которых Вы не понимаете!
 
Цитата
sir.benoit написал:
какое значение будет в первом столбце:
никакое, неужели вам ни о чем не говорит слово
Цитата
buchlotnik написал:
интерполяция
Соблюдение правил форума не освобождает от модераторского произвола
 
Дубль сообщения прошу удалить
Изменено: buchlotnik - 10.07.2020 18:06:11
Соблюдение правил форума не освобождает от модераторского произвола
 
Андрей VG, первый столбец имеет экспоненциальное распределение, второй столбец логнормальное распределение, на основании этих двух распределений необходимо найти значение первого столбца, по произвольному значению второго столбца:
?2711
84511
5130000
200148948
780643185
Это значение я нашел, но меня не удовлетворяет точность, о чем я в примере и указал, так как R квадраты не единицы, вот и возник вопрос, как поднять точность? Есть ли способы, можно ли рассчитать значения столбцов так, что бы R квадрат этих распределений стал равен единице, добавить промежуточных расчетных точек, тогда формула тренда уточнится и появится необходимая точность. Вот и возник вопрос, как рассчитать эти дополнительные точки распределений?
Изменено: sir.benoit - 10.07.2020 18:23:21
 
Цитата
sir.benoit написал:
имеет
Теперь приведите доверительные интервалы для указанных вами значений, раздельно для X и Y. И если результат интерполяции попадает в эти интервалы, то тогда, что ещё вам нужно? Или вы можете утверждать, что указанные вами известные X и Y имеют абсолютную точность?
 
Цитата
sir.benoit написал:
экспоненциальное распределение, второй столбец логнормальное распределение
погодите, так это две независимые случайные величины? Или под распределением подразумевается не математика?
Изменено: buchlotnik - 10.07.2020 18:40:48
Соблюдение правил форума не освобождает от модераторского произвола
 
Уважаемые участники данного форума, прошу меня извинить за не точность поставленной задачи, но благодаря вам я понял сам для себя в чем мой вопрос, поэтому попробую еще раз.
Есть значения:
XYXY
1845111
251300002
32001489483
47806431854
Первые два столбца имеют экспоненциальное распределение, вторые два столбца логнормальное распределение, R квадрат этих значений не имеет единицы. Вопрос, как рассчитать дополнительные точки этих данных, для того что бы R квадрат стал равен единице для каждого распределения?  
 
Цитата
sir.benoit написал:
что бы R квадрат стал равен единице
эээ... никак. от увеличения числа точек модель-то не изменится - вы бы конечную цель мероприятия сообщили, а то пока все несколько бредово выглядит
пы.сы. вы уверены в корректности использования термина распределение?
Изменено: buchlotnik - 10.07.2020 19:01:16
Соблюдение правил форума не освобождает от модераторского произвола
 
Цитата
buchlotnik написал:
от увеличения числа точек модель-то не изменится
Добрый вечер, Михаил.
Это почему? Берём полученную по четырём точкам экспоненту, берём 1000 значений X равномерно распределённых от минимума к максимуму, считаем по 1000 Y,,  и тогда эта тысяча точек легко забъёт те исходные 4 и R^2 будет почти единица. Правда, получится то,  о чём писал Марк Твен: есть ложь, большая ложь и статистика :)  Вот такими людьми и делаются в нашей, да и не только, стране удивительные открытия и закономерности, главное же чтоб костюмчик сидел, а не то, на чём он сидит :)
 
Андрей VG, да совершенно верно! Как это сделать в эксель?
 
Цитата
Андрей VG написал:
будет почти единица
в том-то и дело, а просят
Цитата
sir.benoit написал:
стал равен единице
я уж молчу про то, что смешивается теплое с мягким - функциональная зависимость и распределение

пы.сы.
Цитата
Андрей VG написал:
о чём писал Марк Твен
так это у меня на аватарке  :D  :D  :D
Изменено: buchlotnik - 10.07.2020 19:44:23
Соблюдение правил форума не освобождает от модераторского произвола
 
Цитата
sir.benoit написал:
Как это сделать в эксель?
Вариант. R^2=1
 
Цитата
Андрей VG написал:
R^2=1
не верю!  ;)
Соблюдение правил форума не освобождает от модераторского произвола
 
Цитата
buchlotnik написал:
не верю!  
А я так вижу :D  Могу я себя почувствовать гуманитарием?
Изменено: Андрей VG - 10.07.2020 20:43:49
 

Ахаха такой кликбейт, я ради этого топика даже зарегистрировался. То, что здесь обсуждается, не имеет ничего общего с математической статистикой, но не смотря на это, я жажду помочь вам справиться с полной неразберихой (прошу простить за критику). Начнем с того, что в задачах статистики обычно далеко не 4 наблюдения, по 4 наблюдениям никакой нормальный регрессии не построишь. Но опустим это замечание, тогда у нас есть две пары наблюдений подозрительно похожих на функциональные формы оцениваемых регресий. Наш R-квадрат в обоих случаях 0,99 (почти единица!), что само по себе событие выдающееся, регрессии являются сказочными очень-очень хорошими. Но вас это не устроило, вы хотите еще лучшую регрессию (с R-квадрат ровно равным единице). Судя по вашему запросу, тут требуется дать объяснение: R-квадрат равен отношению дисперсии оцененного Y (значения Y в точках на линии регрессии) и наблюдаемого Y (значения Y в точках наблюдений). Таким образом R-квадрат равен единице только в одном случае, когда все наблюдения лежат на линии регрессии. Получается, вы просто хотите построить функцию через заданные точки (на этом моменте становится понятно, почему ваши наблюдения подозрительно похожи на функциональную форму). Но если вы задавали себе точки сами (специально, чтобы функция в них попала), то регрессия методом наименьших квадратов (ваш случай) должна была в них попасть и вы бы получили долгожданную единицу в R-квадрат, но так не произошло. Почему? Дело в том, что ваши точки не лежат на этой линии. Как так? На этом моменте мы заканчиваем со статистикой и переходим к высшей школьной математике. Вы выбрали функции вида y=a*ln(x)+b и y=a*e^(b*x). Обе эти функции задаются двумя точками, у вас их четыре и при этом ни одна из функций на них не лежит, следовательно, не существует коэффициентов a,b (а значит и функций) удовлетворяющих вашим точкам. Иными словами вам не удастся получить единицу в R-квадрат используя эти точки (даже при добавлении конечного числа дополнительных точек - важное замечание).

Что делать? Перед вами трилемма: либо надевать трусы, либо снимать крестик, либо выходить из бани :D
Вам нужно сменить точки (подогнав их под функцию, тогда вы получите единицу в R-квадрат) ИЛИ сменить функции (число коэффициентов придется увеличить, также придется отказаться от стандартных форм регрессии Excel и прописать МНК ручками) ИЛИ отказаться от R-квадрат равного единице. В вашем случае, я бы надел трусы (сменил точки).

Изменено: Эконометрика - 11.07.2020 08:22:59
 
Цитата
Эконометрика написал:
То, что здесь обсуждается, не имеет ничего общего с математической статистикой
ну куда уж нам, неэконометристам...
Соблюдение правил форума не освобождает от модераторского произвола
 
buchlotnik, ну что вы лукавите, я понимаю, что вы в теме, но человеку не хватит ваших намеков, чтобы разобраться
 
А это курилка, тут можно и пофлудить   :D
Просто задача в #18 про логнормальное распределение, а вы опять про регрессию
Соблюдение правил форума не освобождает от модераторского произвола
 
Цитата
buchlotnik написал:
Просто задача в #18 про логнормальное распределение, а вы опять про регрессию
Ахах, вы шутите? Именно из-за появления словосочетания "логнормальное распределение" в контексте этой задачи я и решил написать свой пост ))) И по той же причине начал с регрессии и закончил пояснением, почему такую задачу нельзя решить, стараясь объяснить достаточно подробно. Я согласен со всем сказанным вами по этому вопросу, но счел нужным сделать пояснения, чтобы популярно донести, в сущности, вашу же мысль  ;)

 
Страницы: 1 2 След.
Наверх