Рубрики
Без рубрики

Веб сервис по распознаванию изображений, QR и остальные ШК + Текст «Broker QR — OCR»

Цель - архивация изображений в системе 1с

  1. Чтение текстовой и штрих кодовой инфрмации из файлов, через их загрузку в сервис
  2. Получение информации, по номеру полиса или его части
  3. Поиск по тексту
  4. Поиск в кодах, по коду или по части кода
  5. Скачивание файла из сервиса
  6. Получение актуального списка списка файлов

Описание

Веб сервис выполняет роль буфера в котором происходит извлечение текстовой и кодовой информации.
Все ответы от сервера или JSON или файл

Установка

Требуется JAVA JDK тестировалось на 8

https://download.oracle.com/java/17/latest/jdk-17_windows-x64_bin.exe

Требуется Visual C++ Redistributable Packages for Visual Studio 2013.
https://www.microsoft.com/en-US/download/details.aspx?id=40784

  1. Создать каталог images
  2. запустить broker_ocr.exe
  3. создать базу данных вызвав http:/127.0.0.1:8888/create_database/
  4. Все можно работать, при следующем запуске будет использоваться созданная база данных
  5. tesseract ocr, boof cv , zbar уже включены в состав программы

запросы к сервису

http:/127.0.0.1:8888/create_database/ GET

  • создание базы данных
  • используется тоько при стартовом запуске

http:/127.0.0.1:8888/file_download/<int:id> GET

  • скачивание файла с сервера
  • id - номер файла в БД

http:/127.0.0.1:8888/file_info/<int:id> GET

  • получние информации о файла
  • id - номер файла в БД
    0   
    create_date "Thu, 02 Dec 2021 17:32:49 GMT"
    ent "ХХХ0183876376"
    error   ""
    hash    "87d448ac59d6f971e7f314205ba22981"
    id  1
    name    "images/5b9f5aabecbf4e09974d09b499b5e63d.JPEG"
    original_file_name  "BRN3C2AF4969430_20210916_171105_011116.jpg"
    qr  "\nhttps://dkbm-web.autoins.ru/dkbm-web-1.0/qr.htm?id=ХХХ0183876376"
    type    "ent"

    http:/127.0.0.1:8888/files/ GET

  • получает списко всех файлов

в массиве такого вида:

0   
create_date "Thu, 02 Dec 2021 17:32:49 GMT"
ent "ХХХ0183876376"
error   ""
hash    "87d448ac59d6f971e7f314205ba22981"
id  1
name    "images/5b9f5aabecbf4e09974d09b499b5e63d.JPEG"
original_file_name  "BRN3C2AF4969430_20210916_171105_011116.jpg"
qr  "\nhttps://dkbm-web.autoins.ru/dkbm-web-1.0/qr.htm?id=ХХХ0183876376"
type    "ent"

http:/127.0.0.1:8888/ocr_extract_file/

curl -v -X POST -F file=@"BRN3C2AF4969430_20210916_171105_011123.jpg" http://127.0.0.1:5000/ocr_extract_file/?QR=True

Извлекает текст и коды из файла, записывает в базу данных
Возвращает данные о кодах и тексте в виде JSON

  • на входе files[file] = картинка
  • Извлекает текст из файла
  • извлечь коды : Параметр ocr_extract_file/?QR=1
  • возвращает массив json файл и ocr текст

http:/127.0.0.1:8888/qr_ent/<string:name>

Поиск по номеру полиса или его части в базе данных

  • http:/127.0.0.1:8888/qr_ent/89888

возвращает JSON

0   
create_date "Thu, 02 Dec 2021 17:32:49 GMT"
ent "ХХХ0183876376"
error   ""
hash    "87d448ac59d6f971e7f314205ba22981"
id  1
name    "images/5b9f5aabecbf4e09974d09b499b5e63d.JPEG"
original_file_name  "BRN3C2AF4969430_20210916_171105_011116.jpg"
qr  "\nhttps://dkbm-web.autoins.ru/dkbm-web-1.0/qr.htm?id=ХХХ0183876376"
type    "ent"

http:/127.0.0.1:8888/qr_extract_file/ POST

  • Извлекает qr из файла
  • на входе files[file] = картинка
  • возварщает массив фалов json

http:/127.0.0.1:8888/qr/<string:name> GET

  • поиск по части кода в бд
  • возвращает массив файлов json

http:/127.0.0.1:8888/free_file/<int:id> GET

Служит для освобождения из выборки списка не скачанных и не присоединнённых файлов

  • параметр id файла
  • возвращает массив файлов json

http:/127.0.0.1:8888/ocr_text/<int:id> GET

  • возвращает текст извлеченный из ображения
  • возвращает массив из ocr JSON

Files watchdog (мониторинг и отправка файлов в БД )

Данная обработка создана для того чтобы отправлять всей файлы из указанной папки
в сервис Broker QR - OCR.

При добавлении файлов отправко происходит автоматически

files_watchdog.exe --delete=1 --dir="d:/test_imgs/" --host="http://127.0.0.1:8888/ocr_extract_file?QR=True&scanner=test_imgs"

Параметры:

  • --delete удалять файлы после передачи в сервис
  • --host Адрес на который отправляется файл default="http://127.0.0.1:8888/ocr_extract_file?QR=True"
  • --dir Каталог поиска изображений, по умолчанию каталог запуска.
Рубрики
Без рубрики

IDEA!APP!

Разработка автоматизации процессов, разработка технического задания, разработка ПО, тестирование ПО. Обслуживание и поддержка готовых решений.