Определение промежуточных данных

Определение промежуточных данных, Апроксимация, интерполяция и тому подобные шалости с табличными данными.

Пользователь

Сообщений: 833 Регистрация: 13.02.2019

25.10.2022 14:25:44

В данной теме попробую подобрать набор информации и ответов на вопросы:
Как найти промежуточные значения между заданными?
Как найти максимум функции заданной таблично?
и т.д.
~~Понятия Аппроксимация, Интерполяция и Экстраполяция гуглятся желающими самостоятельно.~~
Аппроксимация – под аппроксимационной кривой подразумевается некий полином (как правило, но не обязательно), график которого проходит наиболее близко к известным точкам (степень близости определяется по некоторому закону, как правило методу наименьших квадратов). При этом в известных значениях значения функции не обязательно совпадают с заданными значениями (в общем случае f(Xi) ≠ Yi).
Интерполяция – нахождение неизвестных промежуточных значений некоторой функции, по имеющемуся дискретному набору ее известных значений определенным способом. При этом в известных значениях значения функции совпадают с заданными значениями. Под интерполяционной кривой подразумевается некий полином (в нашем случае), график которого проходит через все известные точки.
Две особенности интерполяции:
- для получения полинома степени «n» требуется «n+1» заданная точка (например, полином первой степени f(x)=a·x+b требует две известные точки, или проще – линия строится по двум точкам, парабола по трём и т.д.);
- применение интерполяции методом «ближайшего соседа» в общем случае недопустимо.
Экстраполяция – особый тип аппроксимации, при котором функция аппроксимируется вне заданного интервала, а не между заданными значениями.

Часть 1. Аппроксимация с использованием встроенного функционала
Начнём с аппроксимации без использования макросов
Для начала - самый простой вариант:
1. Построить точечный график по имеющимся точкам;
2. На график добавить линию тренда с отображением уравнения на диаграмме;
3. Подобрать вид уравнения (степень полинома, вид уравнения...) который нравится/наиболее адекватно по субъективному восприятию отражает тенденцию изменения зависимости;
4. Скопировать уравнение линии тренда в ячейку и заменить "х" на "*А1^", где А1 - адрес ячейки в которой содержится значение аргумента, по которому требуется определить значение функции.
5. Пользоваться...
Если лень копировать уравнение с диаграммы, и хочется получить коэфф-ты полиномов, то можно сделать вот так:
Внимание! Не всегда коэфф-ты найденные нижеописанными способами будут соответствовать коэ-там на уравнении. Но об этом в 4-й части..
Аппроксимация полиномом

Код

Определение коэффициентов линейного уравнения
y=ax+b   
b=   1.397235    =ИНДЕКС(ЛИНЕЙН($B$2:$B$7;$A$2:$A$7;1);1;2)
a=   -0.027554    =ИНДЕКС(ЛИНЕЙН($B$2:$B$7;$A$2:$A$7;1);1;1)

Определение коэффициентов квадратичного уравнения
y=ax2+bx+c   
c=   1.662612    =ИНДЕКС(ЛИНЕЙН($B$2:$B$7;$A$2:$A$7^{1;2};);1;3)
b=   -0.071047    =ИНДЕКС(ЛИНЕЙН($B$2:$B$7;$A$2:$A$7^{1;2};);1;2)
a=   0.000849    =ИНДЕКС(ЛИНЕЙН($B$2:$B$7;$A$2:$A$7^{1;2};);1;1)

Определение коэффициентов кубического уравнения
y=ax3+bx²+cx+d   
d=   1.872900    =ИНДЕКС(ЛИНЕЙН($B$2:$B$7;$A$2:$A$7^{1;2;3};);1;4)
c=   -0.132192    =ИНДЕКС(ЛИНЕЙН($B$2:$B$7;$A$2:$A$7^{1;2;3};);1;3)
b=   0.004066    =ИНДЕКС(ЛИНЕЙН($B$2:$B$7;$A$2:$A$7^{1;2;3};);1;2)
a=   -0.000042    =ИНДЕКС(ЛИНЕЙН($B$2:$B$7;$A$2:$A$7^{1;2;3};);1;1)

Поиск коэффициентов для степеней аппроксимирующего полинома бОльших степений аналогичен.
Аппроксимация степенной функцией

Код
Коэф-ты уравнения y = а · Х ^ m m = -0.6320 =ИНДЕКС(ЛИНЕЙН(E3:E8;D3:D8);1) A = 1.1596 =ИНДЕКС(ЛИНЕЙН(E3:E8;D3:D8);2) a = 3.1888 =EXP(H4)

Аппроксимация логарифмической функцией

Код
Коэф-ты уравнения y = а · ln(x) + b a = -0.4676 =ИНДЕКС(ЛИНЕЙН(B3:B8;D3:D8);1) b = 2.0017 =ИНДЕКС(ЛИНЕЙН(B3:B8;D3:D8);2)

Использованием макросов
Преимуществом будет отсутствие необходимости использования ячеек листа. Макросы сохранённые в надстройку позволяют пользоваться ими без импорта в лист ну и т.д...
Недостатком - отсутствие визуализации решения.

Скрытый текст
Листинги макросов по личным причинам убрал. Кто хотел - за пару лет мог скопировать.

За сим первую часть закрываю. Вторая часть будет о кусочной интерполяции ... чуть позже.

Изменено: tutochkin - 29.09.2024 21:31:25 (личное)

Jack Famous

Пользователь

Сообщений: 12274 Регистрация: 07.11.2014

OS: Win 10 Корп. x64 | Excel 2016 x64: | Browser: Chrome

25.10.2022 15:43:43

Родственная тема: Прогноз. Как заполнить пропуски в данных по неизвестной закономерности при имеющихся соседних данных

Во всех делах очень полезно периодически ставить знак вопроса к тому, что вы с давних пор считали не требующим доказательств (Бертран Рассел) ►Благодарности сюда◄

tutochkin

Пользователь

Сообщений: 833 Регистрация: 13.02.2019

25.10.2022 16:32:04

Часть 2. Принятие существования недостоверности определения значений
На практике имеется следующее: есть некая точечно (не путать с «точно») заданная зависимость, и требуется определить значение между заданных точек (для аппроксимации или интерполяции). Например, есть заданные значения при значениях аргумента 0, 1, 2…9, а узнать надо при 0.5 и 8.5.

Как видно, в данном случае ни один из существующих полиномов линии тренда Excel не даёт интерполяционной кривой (проходящей через все точки), а наша цель:
- совпадение значений используемой функции значениям в реперных (заданных изначально) точках;
- совпадение или близость тенденции изменения параметров, т.е. в данном примере между т.1 и 2 функция должна иметь постоянно уменьшающееся значение, а не как для полинома 6-й степени: для значений менее 0,5 - уменьшение, а от 0,5 до 1 - значительное возрастание.
Одним из вариантов решения является применение разбиения известного количества заданных точек на несколько групп с малым количеством таким образом, чтобы:
- искомое значение Х содержалось в выбранном диапазоне;
- для выбранного количества точек можно было найти функцию, график которой будет проходить через все заданные точки.

Для нашего примера для определения значения функции:
- при Х=0,5 при линейной интерполяции для построения полинома используются 1-я и 2-я точки, а для интерполяции полиномом второй степени используются 1-я 2-я и 3-я точки;
- при Х=8,5 при линейной интерполяции для построения полинома используются 9-я и 10-я точки, а для интерполяции полиномом второй степени используются 8-я 9-я и 10-я точки.
Как видно из рисунка ниже, результат зависит от используемого метода интерполяции как внутри заданных значений, так и, в значительной мере, при экстраполяции.

Возможно использование и полиномов более высоких степеней, но как правило, достаточно полинома первого/второго порядка, т.к. зависимости далеко не всегда являются полиномными.
При поиске решения с применением полиномов 3-й и более степеней следует понимать, что в зависимости от выбранных точек результат будет разным. Т.е. если есть 4-ре точки (х1, х2, х3, х4), то результат, полученный по интерполяции по х1, х2, х3, будет отличаться от результата по х2,х3,х4.
Например, при выборе полинома второй степени и поиске значений при Х=1,5 данные, полученные по полиному, построенному точкам х=1 – 2 – 3, будут значительно отличаться от данных, полученных по полиному, построенному по точкам х=0 – 1 – 2. И так для большинства вариантов. В приведённом примере только на участке 4-5 есть совпадение полиномов.

Аналогичные проблемы будут и при использовании полиномов более высоких порядков. Например, для анализируемого случая строятся графики с использованием полиномов 7-го порядка (а·х7 + …), включающие первые и последние заданные точки. Первый интерполяционный график построен по точкам: х1-2-3-4-5-6-7-8 , второй – по х3 4 5 6 7 8 9 10. Наличие сильных расхождений в зоне пересечения (между точками х3-4-5-6-7-8 ) очевидно, но главную проблему представляет собой поведение 1-го инт.графика в зонах х1-2 и х7-8.

В условиях ограниченности исходных полиномы высоких порядков могут принести необоснованную погрешность расчёта. А для некоторых вариантов применение отличного от кусочного метода интерполяции просто невозможно.
Например, есть точки графика функции полинома 9-й степени. Провести интерполяцию данных штатными средствами Excel невозможно (ограничение полинома – 7-я степень). Кусочно-заданная функция потребует разбиение на несколько участков (более 3-х), и всё равно приведёт к значительным погрешностям даже в реперных точках. Либо у полученного графика будут аналогичные проблемы поиска данных в промежуточных точках:

Вывод – Не существует 100% достоверного математического способа определения промежуточных значений точечно заданной функции, за исключением частных вариантов. Любой из способов имеет некоторую погрешность (или допущение), и об этом следует помнить при расчётах.
В качестве ещё одного примера можно обратиться к графику в первом сообщении. На нём представлены 5 интерполяционных кривых, построенных по одним и тем же исходным точкам. Разница определения данных между точками в зависимости от вида интерполяции, очевидна.
Так же стоит отметить наличие ошибки расчётов величин с плавающей запятой (вещественных). Подробнее с действующим стандартом можно ознакомиться по адресу https://www.softelectro.ru/ieee754.html
Отдельным пунктом при кусочной интерполяции лежит понимание того, что имеется возможность управлять поведением функции при экстраполяции. Т.е. например в при кусочном интерполировании по всей функции использовать группы по 4-ре точки (интерполяция полиномом 3-й степени), а последний и первый участки, а так же зоны ДО и ЗА имеющимися данными, определять на основании полиномов первой степени (по парам первых и последних двух точек соответственно)....

Изменено: tutochkin - 29.09.2024 21:27:23 (личное)

tutochkin

Пользователь

Сообщений: 833 Регистрация: 13.02.2019

27.10.2022 15:50:09

Не хочу копипастить данные от ZVI, МатросНаЗебре, MCH и других порядочных форумистов, посему немного вокруг и около

tutochkin

Пользователь

Сообщений: 833 Регистрация: 13.02.2019

14.12.2023 12:43:07

По мотивам задачки из раздела "работа"
Сразу скажу - на 100% я её не решил, а именно было требование:
1. получение массива промежуточных данных между точками графика максимально близко к тому что отрисовывает эксель. Понятие "максимально" размыто. Алгоритм по которому сглаживается соединяющая линия мне не известна. Однако пару методов я покажу ниже, при этом можно сказать"а вот совпадает то не совсем точно! И это будет правдой.
При этом "трассировки перемещения самолёта по небу" не оцифровывал никогда - задач таких нет и не будет. Чисто ради интереса занялся.
Итак, вот что у меня получилось:

Красная линия - исходная.
Синяя - кубический сплайн. В сети много решений, например тут
Зелёная - применение кусочной интерполяции (код выше в постах).
При этом надо для построения зелёной:
1. сделать две интерполяции, отдельно по Х и отдельно по У. введя доп.столбец (в ячейках А) нумерацию исходных данных. Да, можно было и переделать код макроса, но мне лень (я же не исполнитель решения задачи, а так... хобби). А так - реально все доп.столбцы можно убрать в код.
2. просчитать два столбца
3. Строить по данным, новым столбцам.

К неожиданным плюсам построения по кусочному методу могу отнести возможность применения разных законов для интерполяции по данным Х и У, что приводит к интересным результатам.

Упд. А вот это "На выходе таблица с назначаемым шагом по Х." для меня не совсем понятно. Шаг по Х, при том что исходные точки могут в эту сетку не влезть, и наличия трёх У для одного Х (при петлях) для меня не совсем понятно, и не рассматривал. Ну и за решение не брался.
Вот тут что в У писать при Х = 0,0038 ? Там 5 линий на данной вертикали

Изменено: tutochkin - 14.12.2023 13:11:13

Jack Famous

Пользователь

Сообщений: 12274 Регистрация: 07.11.2014

OS: Win 10 Корп. x64 | Excel 2016 x64: | Browser: Chrome

14.12.2023 13:26:08

tutochkin, приветствую!
Большое спасибо! Я думал насчёт интерполяции кусками, но сходу применить кубический сплайн (функция spline в файле от MCh) не вышло.

Цитата
tutochkin: Синяя - кубический сплайн. В сети много решений, например тут

инструмент по ссылке — странный. Сохранил, но пока не разобрался. Использовал spline.

Цитата
tutochkin: "На выходе таблица с назначаемым шагом по Х."

всё просто: пользователь задаёт шаг и между каждой парой X из исходной таблицы добавляются X с заданным шагом. Например, если X1 = 2, X2 = 6, Step = 1.5, то получится ряд: 2, 3.5, 5, 6 — в котором первый и последний X являются исходными.

Разберусь и покажу здесь, что у меня вышло с новыми данными от вас.

tutochkin

Пользователь

Сообщений: 833 Регистрация: 13.02.2019

14.12.2023 14:00:34

Цитата

Jack Famous написал:
всё просто: пользователь задаёт шаг и между каждой парой X из исходной таблицы добавляются X с заданным шагом. Например, если X1 = 2, X2 = 6, Step = 1.5, то получится ряд: 2, 3.5, 5, 6 — в котором первый и последний X являются исходными.

Ну задать Х то вполне можно. И даже в виде ряда. Но при этом как получить значение У ?
Повторюсь, вот тут возможны 5-ть вариантов...

В общем хотелось бы посмотреть как сие сделать. Без сарказма.

Прикрепленные файлы

2023-12-14_145310.jpg (214.63 КБ)

tutochkin Пользователь Сообщений: 833 Регистрация: 13.02.2019	#8 14.12.2023 21:06:34 Выдался свободный часик, налил крепкого чайку и поборол лень. Как то так в общем: Прикрепленные файлы Сплайн_через_кусочную_интерполяцию.xlsm (38.93 КБ)

Jack Famous Пользователь Сообщений: 12274 Регистрация: 07.11.2014 OS: Win 10 Корп. x64 \| Excel 2016 x64: \| Browser: Chrome	#9 15.12.2023 10:02:57 tutochkin, спасибо! Изучу вопрос. Во всех делах очень полезно периодически ставить знак вопроса к тому, что вы с давних пор считали не требующим доказательств (Бертран Рассел) ►Благодарности сюда◄

tutochkin Пользователь Сообщений: 833 Регистрация: 13.02.2019	#10 15.12.2023 10:36:55 Зачем надо не знаю, но залипательно...

tutochkin

Пользователь

Сообщений: 833 Регистрация: 13.02.2019

#11

25.08.2024 22:15:07

В процессе решения задачки из темы о аппроксимации функции двух аргументов глаз зацепился за интересную тему. Возможно она была кем то ранее разобрана, но поиск не дал результатов.
Итак, изначально вопрос стоял о аппроксимации полиномом без свободного члена, то бишь задание пересечения линии тренда оси Y при Х = 0.
Значится есть некие данные, строим линию тренда (зелёную) и находим коэф-ты (есс-но я всё это нахожу в VBA тут чисто ради наглядности)

Затем лезем в свойства тренда и говорим о пересечении в 0 (приравнивании свободного члена 0). Для наглядности рисую вторую линию тренда, синюю.

Замечаем что можно задать пересечение не только в 0, но и в произвольном Y. Делаем. Красную линию тренда. Для примера пересекаем Y в 5.

И вот собственно что меня заинтересовало, а как собственно вытащить коэф-ты уравнения.
В учебнике мелкософта нету про сие инфы.
Там:
LinEst (Arg1, Arg2, Arg3, Arg4)
Arg1 Known_y — набор значений y, которые вы уже знаете в связи y = mx + b.
Arg2 Known_x — необязательный набор значений x, которые, возможно, уже известны в связи y = mx + b.
Arg3 Const — логическое значение, указывающее, следует ли принудительно принудить константу b к 0.
Arg4 Stats — логическое значение, указывающее, следует ли возвращать дополнительную статистику регрессии.

Как то так...
Решение под спойлером

Скрытый текст

Чем обосновано данное поведение и логика я не в теме, но мне было интересно решение, и я с вами им поделился.

Изменено: tutochkin - 25.08.2024 22:45:06

tutochkin

Пользователь

Сообщений: 833 Регистрация: 13.02.2019

#12

09.11.2024 22:46:42

По запросу одного форумчанина - описание методики оцифровки в относительных координатах
https://rutube.ru/video/325a63098a769bed19c600b42ffa83ca/?r=a

Немного скомкано... очень трудно что то записывать когда тебя постоянно отвлекают в выходной.

Изменено: tutochkin - 09.11.2024 22:58:10

tutochkin

Пользователь

Сообщений: 833 Регистрация: 13.02.2019

#13

21.12.2024 20:41:00

Изменено: tutochkin - 08.04.2025 19:13:47

tutochkin Пользователь Сообщений: 833 Регистрация: 13.02.2019	#14 11.05.2025 16:50:10 Интересный, с моей точки зрения, вид номограмм. Номограммы с переломом. Т.е. есть некая функциональная зависимость места резкого изменения характеристики. В качестве примера - простой вариант если искать решение как для обычных номограмм, а именно взять значения до и после и решить через пропорцию, то результат будет ошибочным. Например требуется построить (узнать значение) для Х2 = 3. (изначально заданы кривые при Х2 = 2, 4, 6, . Найдём точку при Х1=10 Х2=3. Искомое между Х2=2 и Х2=4. Здесь и далее для упрощения кусочно линейно интерполирую. Х1=10 Х2=2 => Y = 9 Х1=10 Х2=4 => Y = 6.33 (общий наклонный участок) Через пропорцию Х1=10 Х2=3 => Y = 7.66 Просчитывая другие точки получаем линию Х2 = 3 (красный пунктир) Очевидно что решение не верное-кривая Х2 = 3 должна отходить от общей линии начиная с Х1 = 10.5. Верные значения начинаются для значений с Х1=12, т е. с момента начала отхода кривой Х2=4 от общей линии. Для устранения этого казуса можно разбить номограмму на две: общий участок и отходящие затем для каждой из частей ищем решение (строим две кривые для искомого Х2) И результат будет максимум (в данном случае вогнутого вида номограммы) из двух решений В качестве примера привёл простой вариант. Существуют более сложные зависимости, которые так же нельзя решать простым способом. В частности эта особенность номограмм характеристик эжекторов и не только. Автоматизацию создания макросов для Г-образных номограмм показывал тут https://rutube.ru/video/280dd5afa3efab15d7f6d0ca4f9fef46/?r=wd

Читают тему