А в какой версии Экселя оно должно работать? А то я видел что в OneNote 2010+ есть встроенный OCR, может к этому функционалу как-то можно обратиться через объектную модель в VBA? Я по ссылке особо не лазил, но возможно почерпнете себе что-то полезное. З.Ы. Вашу картинку распознал примерно так: Так что я теперь даже и не знаю, советовать ли такое.
Попробуйте здесь. Единственное без регистрации доступно только 10 страниц. Результат сохраняет в Word, потом можно скопировать данные и вставить в excel. Но главное все цифры правильно определились.
bedvit, всегда интересно когда вижу такие задачки: это просто такая хотелка заказчика, или в сети реально больше нет нормальных источников для получения этих котировок без танцев с бубном?
PooHkrd, для данных в реальном времени - перерыл разные источники не нашел, возможно это платные API на биржевых платформах, а платить никто не хочет. Михаил, посмотрю, есть у меня мысли, завтра оформлю, если успею Kuzmich, все здорово, только это нужно автоматически, несколько раз в день, без Homo. Андрей_26, да, в онлайне можно, но надо постоянно несколько раз в день снимать показания.
bedvit: нужно автоматически, несколько раз в день, без Homo
совсем без человека туфта получиться - НЕТ ещё таких надёжных технологий оптического распознавания…
Во всех делах очень полезно периодически ставить знак вопроса к тому, что вы с давних пор считали не требующим доказательств (Бертран Рассел) ►Благодарности сюда◄
Jack Famous написал: НЕТ ещё таких надёжных технологий оптического распознавания…
Алексей, контрастность повыше и от 400 dpi и машинный текст ра познается давно очень четко. Друкое дело что на примере есть проблемы и с тем и с другим
bedvit попробуйте Puma.NE Для Вас не составит труда приспособить под свои нужды, есть пример на шарпе. Я пользуюсь этой OCR, если надо установщик, я сброшу Вам.
БМВ: контрастность повыше и от 400 dpi и машинный текст распознается давно очень четко
а как же обстоят дела со спецификациями типа Насос Dunfoss ME456FS Ду125 PE (выдуманная строка для демонстрации смешанного текста)? Там потом надо дополнительно прогонять по алгоритму символы "чужого" языка среди "родных"
Это я не говорю про распознавание таблиц из отсканированных PDF со сдвигами и прочими "радостями" — ограничился только примером Я уже "наелся" этими распознаваниями и периодически "перекусываю"
Aiseesoft PDF Converter Ultimate, т.к. показал себя несколько лучше FineReader на тестах, но это такой холивар, который сильно зависит от исходных данных
Во всех делах очень полезно периодически ставить знак вопроса к тому, что вы с давних пор считали не требующим доказательств (Бертран Рассел) ►Благодарности сюда◄
Jack Famous, Алексей, OCR - optical characters recognition , character - символ иенроглиф символ распознан правильно - задача выполнена, а то что за этим символом стоит другая буква - это уже optical text recognition.
по-моему вы рака за камень заводите Распознать форму чёрных пикселей и связать её с наиболее похожим символом (из списка) — оно, конечно, хорошо, но, если на выходе распознанный текст не идеинтичен оригинальному, то я считаю ,что точность распознавания недостаточная (хоть и технически можно объявить виноватой интерпритацию)
Во всех делах очень полезно периодически ставить знак вопроса к тому, что вы с давних пор считали не требующим доказательств (Бертран Рассел) ►Благодарности сюда◄
Off Алексей, а кто сказал что в оригинале именно те буквы что вы ожидаете? Какие буквы разрешены в гос номерах автомобилях и почему? ? точнее для чего? Были ж раньше ЛГ, ЛД....
БМВ: кто сказал что в оригинале именно те буквы что вы ожидаете?
здравый смысл: все слова есть в словарях или известны, как употребимые, но пока не закреплённые. Торговые марки, конкретные модели и прочее также проверяются по списку — что это вообще за вопрос такой?))
Цитата
БМВ: Какие буквы разрешены в гос номерах автомобилях и почему?
те, которые имеют аналог написания в латинице, чтобы все менты прочитать могли в любой стране. Хороший интерактивчик, только к чему вы ведёте?)))
Во всех делах очень полезно периодически ставить знак вопроса к тому, что вы с давних пор считали не требующим доказательств (Бертран Рассел) ►Благодарности сюда◄
Во всех делах очень полезно периодически ставить знак вопроса к тому, что вы с давних пор считали не требующим доказательств (Бертран Рассел) ►Благодарности сюда◄
интересный продукт, почитаю внимательнее про него. с .NET можно перейти на C++ (проще в свою библиотеку положить, при необходимости) Хочу попробовать Tesseract OCR и здесь можно скачать в собранном виде
тут не подскажу. Использовал полную и без взаимодействия с API
Во всех делах очень полезно периодически ставить знак вопроса к тому, что вы с давних пор считали не требующим доказательств (Бертран Рассел) ►Благодарности сюда◄
Сегодня по быстрому попытался систематизировать выше предоставленные данные. Делал на двух примерах: раз, два 1.OneNote 2016 - некоторые символы не распознаны
3."ABBYY PDF Transformer + , выпуск 12.0.104.225, артикул 1132.27" - не пробовал в силу отсутствия данного продукта и необходимых ручных действий (возможно ли автоматизировать?)
4."картинку в ворд на лист и запись в PDF. Открыть PDF вордом"- в Word2016 - один из рисунков не распознался совсем
5.Puma.NE - быстро не взлетело
6.Tesseract с настройками по умолчанию ("Это просто позор какой-то" (с) т. Швондер.) - в одном из рисунков большая часть данных вообще не попала в итог. Делал через командную строку итог выполнения программы
7. Первый попавшийся онлайн-конвертер, который работал по ссылке - первую распознал, вторую нет
doober, сможете Puma.NE протестировать? Разбирать код некогда (библы подключил, Студия 2017, проект запускал в папке Sample). Если результат будет, тогда гляну в чем там засада (если получится)