Всем привет.
Прошу помощи в решении такой задачи. Есть список названий техники из 1С. В этом списке, в каждом названии техники, с большой вероятностью прописан государственный номер техники (если гос номер ещё не выдан,то в строке он не будет указан). Задача - извлечь номера из строки.
Для начала я макросом убираю все пробелы и дефисы, чтобы получить последовательность букв и чисел.
Из того, что получилось, я выделил несколько закономерностей:
- номер имеет длинну от 6 до 8 символов;
- последние два символа - 100% буквы также, как и 4й, 5й, и 6й символы с конца - 100% числа. То есть такой шаблон ??ЧЧЧ?ББ (Ч - число, Б - буква);
- всего существует четыре шаблона номеров: ЧЧЧЧЧББ, ББЧЧЧЧББ, ЧЧЧЧБББ, ЧЧЧЧББ
Пример файла с названиями во вложении.
P.S. база огромная, гос. номера могут быть как с дефисами, пробелами, так и с любым регистром букв, при этом буквы в номере не всегда введены кирилицей.
Прошу помощи в решении такой задачи. Есть список названий техники из 1С. В этом списке, в каждом названии техники, с большой вероятностью прописан государственный номер техники (если гос номер ещё не выдан,то в строке он не будет указан). Задача - извлечь номера из строки.
Для начала я макросом убираю все пробелы и дефисы, чтобы получить последовательность букв и чисел.
Из того, что получилось, я выделил несколько закономерностей:
- номер имеет длинну от 6 до 8 символов;
- последние два символа - 100% буквы также, как и 4й, 5й, и 6й символы с конца - 100% числа. То есть такой шаблон ??ЧЧЧ?ББ (Ч - число, Б - буква);
- всего существует четыре шаблона номеров: ЧЧЧЧЧББ, ББЧЧЧЧББ, ЧЧЧЧБББ, ЧЧЧЧББ
Пример файла с названиями во вложении.
P.S. база огромная, гос. номера могут быть как с дефисами, пробелами, так и с любым регистром букв, при этом буквы в номере не всегда введены кирилицей.
Изменено: - 02.06.2015 07:41:05