Цель - архивация изображений в системе 1с
- Чтение текстовой и штрих кодовой инфрмации из файлов, через их загрузку в сервис
- Получение информации, по номеру полиса или его части
- Поиск по тексту
- Поиск в кодах, по коду или по части кода
- Скачивание файла из сервиса
- Получение актуального списка списка файлов
Описание
Веб сервис выполняет роль буфера в котором происходит извлечение текстовой и кодовой информации.
Все ответы от сервера или JSON или файл
Установка
Требуется JAVA JDK тестировалось на 8
https://download.oracle.com/java/17/latest/jdk-17_windows-x64_bin.exe
Требуется Visual C++ Redistributable Packages for Visual Studio 2013.
https://www.microsoft.com/en-US/download/details.aspx?id=40784
- Создать каталог images
- запустить broker_ocr.exe
- создать базу данных вызвав
http:/127.0.0.1:8888/create_database/
- Все можно работать, при следующем запуске будет использоваться созданная база данных
- tesseract ocr, boof cv , zbar уже включены в состав программы
запросы к сервису
GEThttp:/127.0.0.1:8888/create_database/
- создание базы данных
- используется тоько при стартовом запуске
GEThttp:/127.0.0.1:8888/file_download/<int:id>
- скачивание файла с сервера
- id - номер файла в БД
GEThttp:/127.0.0.1:8888/file_info/<int:id>
- получние информации о файла
- id - номер файла в БД
0 create_date "Thu, 02 Dec 2021 17:32:49 GMT" ent "ХХХ0183876376" error "" hash "87d448ac59d6f971e7f314205ba22981" id 1 name "images/5b9f5aabecbf4e09974d09b499b5e63d.JPEG" original_file_name "BRN3C2AF4969430_20210916_171105_011116.jpg" qr "\nhttps://dkbm-web.autoins.ru/dkbm-web-1.0/qr.htm?id=ХХХ0183876376" type "ent"
GEThttp:/127.0.0.1:8888/files/
- получает списко всех файлов
в массиве такого вида:
0
create_date "Thu, 02 Dec 2021 17:32:49 GMT"
ent "ХХХ0183876376"
error ""
hash "87d448ac59d6f971e7f314205ba22981"
id 1
name "images/5b9f5aabecbf4e09974d09b499b5e63d.JPEG"
original_file_name "BRN3C2AF4969430_20210916_171105_011116.jpg"
qr "\nhttps://dkbm-web.autoins.ru/dkbm-web-1.0/qr.htm?id=ХХХ0183876376"
type "ent"
http:/127.0.0.1:8888/ocr_extract_file/
curl -v -X POST -F file=@"BRN3C2AF4969430_20210916_171105_011123.jpg" http://127.0.0.1:5000/ocr_extract_file/?QR=True
Извлекает текст и коды из файла, записывает в базу данных
Возвращает данные о кодах и тексте в виде JSON
- на входе files[file] = картинка
- Извлекает текст из файла
- извлечь коды : Параметр ocr_extract_file/?QR=1
- возвращает массив json файл и ocr текст
http:/127.0.0.1:8888/qr_ent/<string:name>
Поиск по номеру полиса или его части в базе данных
- http:/127.0.0.1:8888/qr_ent/89888
возвращает JSON
0
create_date "Thu, 02 Dec 2021 17:32:49 GMT"
ent "ХХХ0183876376"
error ""
hash "87d448ac59d6f971e7f314205ba22981"
id 1
name "images/5b9f5aabecbf4e09974d09b499b5e63d.JPEG"
original_file_name "BRN3C2AF4969430_20210916_171105_011116.jpg"
qr "\nhttps://dkbm-web.autoins.ru/dkbm-web-1.0/qr.htm?id=ХХХ0183876376"
type "ent"
POSThttp:/127.0.0.1:8888/qr_extract_file/
- Извлекает qr из файла
- на входе files[file] = картинка
- возварщает массив фалов json
GEThttp:/127.0.0.1:8888/qr/<string:name>
- поиск по части кода в бд
- возвращает массив файлов json
GEThttp:/127.0.0.1:8888/free_file/<int:id>
Служит для освобождения из выборки списка не скачанных и не присоединнённых файлов
- параметр id файла
- возвращает массив файлов json
GEThttp:/127.0.0.1:8888/ocr_text/<int:id>
- возвращает текст извлеченный из ображения
- возвращает массив из ocr JSON
Files watchdog (мониторинг и отправка файлов в БД )
Данная обработка создана для того чтобы отправлять всей файлы из указанной папки
в сервис Broker QR - OCR.
При добавлении файлов отправко происходит автоматически
files_watchdog.exe --delete=1 --dir="d:/test_imgs/" --host="http://127.0.0.1:8888/ocr_extract_file?QR=True&scanner=test_imgs"
Параметры:
- --delete удалять файлы после передачи в сервис
- --host Адрес на который отправляется файл default="http://127.0.0.1:8888/ocr_extract_file?QR=True"
- --dir Каталог поиска изображений, по умолчанию каталог запуска.