Добрый день! Необходимо ячейки содержащие текст объединить в группы, т.е. присвоить каждой ячейке имя её группы. Принцип объединения ячеек в одну группу - максимальное количество одинаковых слов. Нижний порог выделения групп - это слово или сочетания слов которое встречается не менее 10 раз. Пример на 76 ячеек прилагается: черным цветом шрифта (колонка A) выделено дано, красным - правильный ответ, серым - как я сам пытался сделать, но пока не достиг правильного результата. С помощью надстройки !SEMTools (макроса удалить-фразы-список своих фраз) я последовательно из данных удалял слова которые не могут составить имена групп (частотность слов которых ниже 10).
И последнее: например выделяется группа с именем A222V, а другая группа с именем S477N, ячейку содержащую слова A222V S477N относим к той из этих двух групп, частотность которой выше.
И последнее: например выделяется группа с именем A222V, а другая группа с именем S477N, ячейку содержащую слова A222V S477N относим к той из этих двух групп, частотность которой выше.