Страницы: 1
RSS
Выбор минимальных и максимальных пороговых значений показателя по 5 равным долям выборки (в квинтилях)
 
Добрый день! Помогите пожалуйста создать макрос для следующей задачи.

Есть два столбца.
В первом - номера организаций
Во втором - значения по показателю "Число публикаций учреждения,
индексируемых в информационно-аналитической системе научного цитирования Web of Science" для каждой из организаций.

Нужно создать 5 диапозонов значений показателей, то есть квинтилей, исходя из имеющихся значений показателей по всем организациям по следующему принципу.

в первом диапозоне - пороговые значения значения показателей от min до бесконечности для организаций которые вошли в топ 20% организаций по показателю (именно в топ 20%, а не в топ20 в абсолютных значениях. То есть если организаций например всего  100, это будут значения по 20 организациям, а если организаций всего 150, это будут значения по 30 организациям)

во втором диапозоне - пороговые значения показателей организаций, попавших по величине показателя в группу следующего квинтиля

и так далее до 5 квинтиля. В пятом квинтиле пороги будут от 0 до значения X, которое является максимальным для 20% организаций, набравших самые маленькие значения по показателю.

Таким образом нужно получить пороговые значения показателей для организаций 5 групп разных по результативности групп. Назовем их лидеры, догоняющие ледеров, средние, догоняющие средних и отстающие.

Должно получиться что-то подобное:
лидеры   (20%)400и выше
догоняющие лидеров (20%)350400
средние (20%)200350
догоняющие средних (20%)100200
отстающие (20 % )0100
 
Доброе время суток.
Вариант на Power Query.
P. S. Любопытство победило - а чем вас стандартные формулы не устроили, если хотите макросом?
Изменено: Андрей VG - 25.11.2020 22:36:14
 
Спасибо Вам большое!!!
К сожалению я не вижу как рассчитываются пороговые значения, - требуется подключение к внешним ресурсам.
Конечно можно и по стандартными формулами, если поможите понять какие это формулы???
 
Цитата
Сергей Ребров написал:
если поможите понять какие это формулы???
Обычные статистические формулы.
 
Спасибо Вам большое! Здоровья, благополучия и успехов в Ваших делах! Сократили время работы над задачей в разы.
 
Цитата
Андрей VG написал:
Профиль I_макрос.xlsx  
Андрей, извините, подскажите пожалуйста, как можно делать внутри формулы слова "=ПРОЦЕНТИЛЬ.ВКЛ(число публикаций; 0,8)" как у вас? Я умею посредством выделения нескольких ячеек, ну или прописанием характеристик ячеек буквой-цифрой = ПРОЦЕНТИЛЬ.ВКЛ(E3:E23;0)
 
см.строки 331-335
если количество публикаций разделить на численность сотрудников - получится более обьективный показатель качества работы
понимамаете, если в научной организации работает 1 млн. бездарей - они сделаю больше публикаций, чем 5 талантливых ученых из скромной научной лаборатории и бездари окажутся в лидерах))
Программисты - это люди, решающие проблемы, о существовании которых Вы не подозревали, методами, которых Вы не понимаете!
 
Игорь, добрый день! Спасибо за замечание! На самом деле мы так и считаем на 100 исследователей. В ТЗ я просто привел упрощенный показатель, что не перегружать информацией.
Страницы: 1
Наверх