Зачистка текста
Зачастую текст, который достается нам для работы в ячейках листа Microsoft Excel далек от совершенства. Если он был введен другими пользователями (или выгружен из какой-нибудь корпоративной БД или ERP-системы) не совсем корректно, то он легко может содержать:
- лишние пробелы перед, после или между словами (для красоты!)
- ненужные символы ("г." перед названием города)
- невидимые непечатаемые символы (неразрывный пробел, оставшийся после копирования из Word или "кривой" выгрузки из 1С, переносы строк, табуляция)
- апострофы (текстовый префикс – спецсимвол, задающий текстовый формат у ячейки)
Давайте рассмотрим способы избавления от такого "мусора".
Замена
"Старый, но не устаревший" трюк. Выделяем зачищаемый диапазон ячеек и используем инструмент Заменить с вкладки Главная – Найти и выделить (Home – Find & Select – Replace) или жмем сочетание клавиш Ctrl+H.
Изначально это окно было задумано для оптовой замены одного текста на другой по принципу "найди Маша – замени на Петя", но мы его, в данном случае, можем использовать его и для удаления лишнего текста. Например, в первую строку вводим "г." (без кавычек!), а во вторую не вводим ничего и жмем кнопку Заменить все (Replace All). Excel удалит все символы "г." перед названиями городов:
Только не забудьте предварительно выделить нужный диапазон ячеек, иначе замена произойдет на всем листе!
Удаление пробелов
Если из текста нужно удалить вообще все пробелы (например они стоят как тысячные разделители внутри больших чисел), то можно использовать ту же замену: нажать Ctrl+H, в первую строку ввести пробел, во вторую ничего не вводить и нажать кнопку Заменить все (Replace All).
Однако, часто возникает ситуация, когда удалить надо не все подряд пробелы, а только лишние – иначе все слова слипнутся друг с другом. В арсенале Excel есть специальная функция для этого – СЖПРОБЕЛЫ (TRIM) из категории Текстовые. Она удаляет из текста все пробелы, кроме одиночных пробелов между словами, т.е. мы получим на выходе как раз то, что нужно:
Удаление непечатаемых символов
В некоторых случаях, однако, функция СЖПРОБЕЛЫ (TRIM) может не помочь. Иногда то, что выглядит как пробел – на самом деле пробелом не является, а представляет собой невидимый спецсимвол (неразрывный пробел, перенос строки, табуляцию и т.д.). У таких символов внутренний символьный код отличается от кода пробела (32), поэтому функция СЖПРОБЕЛЫ не может их "зачистить".
Вариантов решения два:
- Аккуратно выделить мышью эти спецсимволы в тексте, скопировать их (Ctrl+C) и вставить (Ctrl+V) в первую строку в окне замены (Ctrl+H). Затем нажать кнопку Заменить все (Replace All) для удаления.
- Использовать функцию ПЕЧСИМВ (CLEAN). Эта функция работает аналогично функции СЖПРОБЕЛЫ, но удаляет из текста не пробелы, а непечатаемые знаки. К сожалению, она тоже способна справится не со всеми спецсимволами, но большинство из них с ее помощью можно убрать.
Функция ПОДСТАВИТЬ
Замену одних символов на другие можно реализовать и с помощью формул. Для этого в категории Текстовые в Excel есть функция ПОДСТАВИТЬ (SUBSTITUTE). У нее три обязательных аргумента:
- Текст в котором производим замену
- Старый текст – тот, который заменяем
- Новый текст – тот, на который заменяем
С ее помощью можно легко избавиться от ошибок (замена "а" на "о"), лишних пробелов (замена их на пустую строку ""), убрать из чисел лишние разделители (не забудьте умножить потом результат на 1, чтобы текст стал числом):
Удаление апострофов в начале ячеек
Апостроф (') в начале ячейки на листе Microsoft Excel – это специальный символ, официально называемый текстовым префиксом. Он нужен для того, чтобы дать понять Excel, что все последующее содержимое ячейки нужно воспринимать как текст, а не как число. По сути, он служит удобной альтернативой предварительной установке текстового формата для ячейки (Главная – Число – Текстовый) и для ввода длинных последовательностей цифр (номеров банковских счетов, кредитных карт, инвентарных номеров и т.д.) он просто незаменим. Но иногда он оказывается в ячейках против нашей воли (после выгрузок из корпоративных баз данных, например) и начинает мешать расчетам. Чтобы его удалить, придется использовать небольшой макрос. Откройте редактор Visual Basic сочетанием клавиш Alt+F11, вставьте новый модуль (меню Insert - Module) и введите туда его текст:
Sub Apostrophe_Remove() For Each cell In Selection If Not cell.HasFormula Then v = cell.Value cell.Clear cell.Formula = v End If Next End Sub
Теперь, если выделить на листе диапазон и запустить наш макрос (Alt+F8 или вкладка Разработчик – кнопка Макросы), то апострофы перед содержимым выделенных ячеек исчезнут.
Английские буквы вместо русских
Это уже, как правило, чисто человеческий фактор. При вводе текстовых данных в ячейку вместо русских букв случайно вводятся похожие английские ("це" вместо русской "эс", "игрек" вместо русской "у" и т.д.) Причем снаружи все прилично, ибо начертание у этих символов иногда абсолютно одинаковое, но Excel воспринимает их, конечно же, как разные значения и выдает ошибки в формулах, дубликаты в фильтрах и т.д.
Можно, конечно, вручную заменять символы латинцы на соответствующую им кириллицу, но гораздо быстрее будет сделать это с помощью макроса. Откройте редактор Visual Basic сочетанием клавиш Alt+F11, вставьте новый модуль (меню Insert - Module) и введите туда его текст:
Sub Replace_Latin_to_Russian() Rus = "асекорхуАСЕНКМОРТХ" Eng = "acekopxyACEHKMOPTX" For Each cell In Selection For i = 1 To Len(cell) c1 = Mid(cell, i, 1) If c1 Like "[" & Eng & "]" Then c2 = Mid(Rus, InStr(1, Eng, c1), 1) cell.Value = Replace(cell, c1, c2) End If Next i Next cell End Sub
Теперь, если выделить на листе диапазон и запустить наш макрос (Alt+F8 или вкладка Разработчик – кнопка Макросы), то все английские буквы, найденные в выделенных ячейках, будут заменены на равноценные им русские. Только будьте осторожны, чтобы не заменить случайно нужную вам латиницу :)
Ссылки по теме
- Поиск символов латиницы в русском тексте
- Проверка текста на соответствие заданному шаблону (маске)
- Деление "слипшегося" текста из одного столбца на несколько
Я переделал последний макрос:
А еще (но не знаю почему)апострофы удаляет функция =текст(A1;0) ))))
Заранее благодарю за помощь.
Денис
Подскажите как использовать функцию ПЕЧСИМВ на всем листе что бы не обрабатывать каждый столбик отдельно.
В таблице много столбиков с текстом в каждой ячейке с знаками которые нужно убрать этой функцией.
абвгд@еёжз
как можно подчистить значения ячеек, таким образом, чтобы удалились все символы начиная от @ и до конца текста ячейки. т.е. нужно удалить @еёжз
Имеем текст:
Мастер стиральной машины gorenje!
Надо его привести к такому виду:
мастер-стиральной-ма
т. е. удалить знаки препинания (!?,.), заменить пробелы на тире и обрезать справа, чтобы получилось не больше 20-ти символов.
Тема: Удаление апострофов в начале ячеек
Подскажите что делать в таком случае:
Я вставил новый модуль (меню Insert - Module) и ввел туда его текст:
Но после выползает окно с ошибкой
ссылка на скрин:
В итоге макрос не устанавливается.
Буду очень благодарен за подсказку.
Буду пробовать.
Дай бог вам сил и здоровья.
Вот незадача:
Я скопировал макрос, применил его, но в этот раз вот такая проблема
Данный макрос я давно использовал и он работа, но сейчас не получается.
Подскажите пожалуйста в чем может быть проблема.
А подскажите, пожалуйста, если у нас массив данных по типу
Диван кожаный PF-QW12345(F)
грубо говоря, список моделей, которые копируются из базы 1С, а для документа необходимо оставлять только саму модель:
PF-QW12345(F)
можно ли как-то макросом убрать ненужные слова?
То есть нужен макрос оставляющий в ячейке только тот текст, что выделен синим шрифтом.
Спасибо!
Подскажите пожалуйста! такая ситуация. есть таблица эксель, со списком. в каждой ячейке есть текст, пример:
абвгд@еёжз
как можно подчистить значения ячеек, таким образом, чтобы удалились все символы начиная от @ и до конца текста ячейки. т.е. нужно удалить @еёжз
=ЛЕВСИМВ(A1;НАЙТИ("@";A1)-1)
где A1 - ячейка с текстом.
Можно
Можно просто набрать в соседнем справа столбце пару-тройку ячеек с правильными ответами и нажать на вкладке "Данные - Мгновенное заполнение"
Подскажите пожалуйста, как можно удалить сразу несколько символов из строки с помощью функции SUBSTITUTE.
Например мне нужно удалить пробел, "/" и "-" из текста "125 a/55-86", т.е. оставить только буквы и цифры.
Принимая во внимание Ваши слова о том что Вы являетесь тренером по продуктам MS Office (а значит не только по Excel), обращаюсь к Вам с покорнейшей просьбой: не могли бы Вы создать макрос, который подобно приведенному в данном разделе менял бы символы латиницы на похожие символы кириллицы в выделенном фрагменте текста MS Word? Был бы Вам благодарен всей душой, поскольку мне весьма часто приходится сталкиваться с этой проблемой, а программировать в MS Word я не умею. Большое спасибо заранее и низкий поклон за Ваш труд!
Может есть безмакросный вариант, указав не символ в одной функции, а список символов?
Спасибо.
Как их можно удалить.
Пробовала через заменить, но тогда удаляются все скобки, а это не правильно.
Помогите пожалуйста