Чтобы было понятнее записал ТЗ в формате видео ()
Если кратко. Есть столбец С "наименование". К каждой ячейке из данного столбца надо найти до 10 похожих по смыслу ячеек из данного столбца.
Не знаю есть ли какие-то функции в екселе для определения релевантности. Если нет, предлагаю сделать так(думаю так возможно): разбиваем ячейку на отдельные слова (откидываем короткие чтобы убрать предлоги и тп), откидываем последнюю букву, чтобы не учитывались падежи и тп, ищем по всему столбцу по данным словам и выбираем ту ячейку где количество ближе к 10.
Пример: Кредит с досрочным погашением
креди (1943 раз) досрочны (3раза) погашение (6 раз) - ближе всего к 10 "погашение" значит берем ячейки с словом "погашение" . естественно надо убрать та что на себя.
В идеале, если это возможно, если несколько фраз меньше 10, то можно взять и ту и другую, то есть конкретно в этом примере идеально взять и "досрочны" и "погашение".
Если ближе всего к 10 к примеру будет 15 ячеек, то берем любые 10 из них.
На выходе надо получить столбик в последовательности столбика"Последовательность", где в каждой ячейке будут до 10 ссылок в формате html, обрамленные кодом списка (пример лист вспомогательное) и столбик с указанием количества найденных ссылок.
Возможна ручная работа на любом из этапов
Приложенный файл для ознакомления только на 300 позиций, потому что можно приложить только 100кб. Исполнителю вышлю файл с полным списком(около 3000 строк наименований)
Предлагайте вашу сумму и вариант решения, повторюсь, я слабо разбираюсь в екселе. Мне главное чтобы для каждой ячейки нашлись похожие ячейки при том их количество было близко к 10 и чтобы использовались максимально возможные ячейки из списка.
Если кратко. Есть столбец С "наименование". К каждой ячейке из данного столбца надо найти до 10 похожих по смыслу ячеек из данного столбца.
Не знаю есть ли какие-то функции в екселе для определения релевантности. Если нет, предлагаю сделать так(думаю так возможно): разбиваем ячейку на отдельные слова (откидываем короткие чтобы убрать предлоги и тп), откидываем последнюю букву, чтобы не учитывались падежи и тп, ищем по всему столбцу по данным словам и выбираем ту ячейку где количество ближе к 10.
Пример: Кредит с досрочным погашением
креди (1943 раз) досрочны (3раза) погашение (6 раз) - ближе всего к 10 "погашение" значит берем ячейки с словом "погашение" . естественно надо убрать та что на себя.
В идеале, если это возможно, если несколько фраз меньше 10, то можно взять и ту и другую, то есть конкретно в этом примере идеально взять и "досрочны" и "погашение".
Если ближе всего к 10 к примеру будет 15 ячеек, то берем любые 10 из них.
На выходе надо получить столбик в последовательности столбика"Последовательность", где в каждой ячейке будут до 10 ссылок в формате html, обрамленные кодом списка (пример лист вспомогательное) и столбик с указанием количества найденных ссылок.
Возможна ручная работа на любом из этапов
Приложенный файл для ознакомления только на 300 позиций, потому что можно приложить только 100кб. Исполнителю вышлю файл с полным списком(около 3000 строк наименований)
Предлагайте вашу сумму и вариант решения, повторюсь, я слабо разбираюсь в екселе. Мне главное чтобы для каждой ячейки нашлись похожие ячейки при том их количество было близко к 10 и чтобы использовались максимально возможные ячейки из списка.