Страницы: 1
RSS
Разделение текста на предложения из одной колонки в разные
 
Здравствуйте. Вопрос про разделение текста на предложения. Да, что есть много похожих тем, но они все немного не те, если я пропустил на форуме тему с решением этого вопроса или это умеет делать надстройка PLEX, то подскажите, пожалуйста, ссылку на ответ.

Более менее понятно, как бы с текстом, который начинается с заглавной буквы и кончается точкой, можно сделать разделение по точке, но вот что делать, когда в одном предложении несколько точек. Может быть, как то можно задать условие разделять предложение по "точке пробел и потом любая заглавная буква" (". А"). Или может есть более продуманное решение, например волнует, что после точки может стоять цифра, цифра может стоять как в предложении и так и после предложения.

Взял текст с вашего сайта.

Например он в колонке описание:
"Функция StaticRandBetween. Выводит в ячейку статическое случайное число в заданном диапазоне. От встроенной функции СЛУЧМЕЖДУ(RANDBETWEEN) отличается тем, что эта функция не пересчитывается каждый раз вместе с остальными функциями листа при изменении любой ячейки, т.е. сохраняет свое первоначальное значение."

Разделить на колонки по количеству предложений.

Колонка 2:
"Функция StaticRandBetween"
Колонка 3:
"Выводит в ячейку статическое случайное число в заданном диапазоне"
Колонка 4:
"От встроенной функции СЛУЧМЕЖДУ(RANDBETWEEN) отличается тем, что эта функция не пересчитывается каждый раз вместе с остальными функциями листа при изменении любой ячейки, т.е. сохраняет свое первоначальное значение"
 
Кросс на Excelworld.ru
 
Анализ может оказаться слишком сложным, так например никакие пробелы после точки и большие буквы не помогут например при появлении такой констркуции
Маша вышла т.е. Маша ушла.  Сколько еще таких?
По вопросам из тем форума, личку не читаю.
 
БМВ, будет таблица может быть из ~100 строк. В каждой строке может попадаться 1-2 предложений "Маша вышла т.е. Маша ушла.", а может и вообще не попадаться.
Цитата
Анализ может оказаться слишком сложным
Это имеется виду процессорные мощности компьютера?
 
тогда и при таком количестве  проще загрузить текст,
заменить ", " на ".<символ почти не встречаемый>", и по нему разбить на столбцы стандартным средством.Это не исключит сбоя с "т.е. " но вопрос сколько их останется. В качестве символа возьмите хоть Ȃ.

Предвариетльно текст можно обработать в ворде, там более богатые возможности замены и там подставить Ȃ поискав ". [A-Y,А-Я]" . Как оставить букву  - я не помню, но точно есть. https://wordmvp.com/FAQs/General/UsingWildcards.htm
По вопросам из тем форума, личку не читаю.
 
БМВ, Верная мысль заменить ", " на незнакомую букву ",Ȃ ". Возможно это решит проблему с "Маша вышла т.е. Маша ушла."
 
Извините, что сразу не прикрепил пример случайного текста.
 
Цитата
atatat111 написал:
Возможно это решит проблему
нет не решит, а вот точки которые без пробела, так и останутся. "Маша вышла т.е. Маша ушла."  = "Маша вышла т.е." /"Маша ушла",  но хотябы не "Маша вышла т."/"е." /"Маша ушла".
Также надо незабывать, что предложенеи может закончится знаками вопроса и восклицания...

upd  как пример если  в ворде искать ([\!\?.] @)([A-ZА-Я]) и менть на .Ȃ\2 то разбило приведеный в файле пример корректно, Но всплыли переводы строк, что также можно описать, заменить, и загрузить в Exceл, для далбнейшего разбиения,
Изменено: БМВ - 04.01.2018 17:33:06
По вопросам из тем форума, личку не читаю.
 
БМВ, Благодарю! Сейчас сам попробую повторить по вашей схеме действий.
Страницы: 1
Читают тему
Наверх