DEV Community

HuaweiDevsLATAM
HuaweiDevsLATAM

Posted on

OCR con el kit ML de HUAWEI

Alt text of image

  1. Introducción

El reconocimiento óptico de caracteres es la función para detectar y procesar caracteres de un alfabeto determinado. Con el servicio de reconocimiento de texto de HUAWEI, puede extraer texto de imágenes, documentos o cualquier representación impresa de caracteres.

Este servicio se puede ejecutar en la nube o en el dispositivo. Si el servicio necesita escanear caracteres de un idioma basado en chino simplificado, japonés, coreano y latín, el servicio puede usar el reconocimiento de texto del dispositivo.

El servicio en la nube admite idiomas como chino simplificado, inglés, español, portugués, italiano, alemán, francés, ruso, japonés, coreano, polaco, finlandés, noruego, sueco, danés, turco, tailandés, árabe e hindi.

  1. Preparativos

Para habilitar el Kit de AA, es necesario seguir estos pasos.
· Inicie sesión en Huawei Developer https://developer.huawei.com/consumer/en/console

Alt text of image

Acceder a la galería de aplicaciones de HUAWEI
Alt text of image

Seleccione Mis aplicaciones y luego seleccione la aplicación que desea integrar al servicio.

Alt text of image

Acceda a la sección Desarrollar y haga clic en Administrar API

Alt text of image

Habilitar el Kit de AA

Alt text of image
Establecer ubicación de almacenamiento

Alt text of image

Descargue agconnect-services.json y agréguelo en el directorio raíz de la aplicación de su proyecto de Android Studio

Alt text of image

Alt text of image

Abra el archivo build.gradle en el directorio raíz

· Agregar el maven “maven{url’https://developer.huawei.com/repo/’}” y Classpath “classpath’com.huawei.agconnect:agcp:1.2.1.301’”

Agrega las dependencias de los SDK a tu proyecto

“dependencies{

// Importar el SDK base.

implementation ‘com.huawei.hms:ml-computer-vision-ocr:1.0.3.300’

//Importar el paquete de modelo de idioma basado en latín.

implementation ‘com.huawei.hms:ml-computer-vision-ocr-latin-model:1.0.3.315’

//Importar el paquete de modelos japonés y coreano.

implementation ‘com.huawei.hms:ml-computer-vision-ocr-jk-model:1.0.3.300’

// Importar el paquete de modelos en chino e inglés.

implementation ‘com.huawei.hms:ml-computer-vision-ocr-cn-model:1.0.3.300’

}”

Alt text of image

Agregue la configuración dentro del mismo archivo build.gradle

“apply plugin: ‘com.huawei.agconnect’”

Alt text of image

En el archivo de manifiesto de Android, agregue el siguiente código para permitir que su aplicación actualice automáticamente los últimos modelos de ML en el dispositivo.

<manifest
<meta-data
android:name=”com.huawei.hms.ml.DEPENDENCY”android:value= “ocr”/></manifest>
Enter fullscreen mode Exit fullscreen mode

Alt text of image

Desarrollo

Reconocimiento de texto a partir de imágenes en el dispositivo

Necesita crear MLTextAnalyzer para reconocer texto en imágenes. También configure MLLocalTextSetting para especificar idiomas, si no se especifica ninguno, solo se reconocerán los idiomas basados ​​en el latín
Enter fullscreen mode Exit fullscreen mode

Alt text of image

Cree el MLFrame utilizando android.graphics. Se admiten imágenes de mapa de bits JPG, JPEG, PNG, BMP.

Alt text of image

Alt text of image

  1. Pase el objeto MLFrame al método asyncAnalyseFrame para el reconocimiento de texto.

Alt text of image

  1. Cuando se complete el reconocimiento, detenga el analizador

Alt text of image

Reconocimiento de texto a partir de imágenes en la nube

Crea un analizador. MLRemoteTextSettings, para especificar los lenguajes que se reconocerán.
Enter fullscreen mode Exit fullscreen mode

Alt text of image

  1. Cree el MLFrame utilizando android.graphics. Se admiten imágenes de mapa de bits JPG, JPEG, PNG, BMP.

Alt text of image

  1. Pase el objeto MLFrame al método asyncAnalyseFrame para el reconocimiento de texto.

Alt text of image

  1. Cuando se complete el reconocimiento, detenga el analizador Alt text of image

Reconocimiento de texto de transmisiones de cámara en el dispositivo

Para procesar la transmisión de la cámara en la aplicación, los fotogramas de la cámara se convierten en objetos MLFrame y esto reconoce el texto mediante el método de reconocimiento de imágenes estáticas locales.

Cree un analizador MLTextAnalyzer y configure el procesador de resultados de detección
Enter fullscreen mode Exit fullscreen mode
  1. Cuando se complete el reconocimiento, detenga el analizador Alt text of image
  2. Cree la clase OcrDetectorProcessor para procesar los resultados.
    Alt text of image

  3. Llame a la API síncrona para utilizar el LensEngine integrado del SDK para crear un objeto, registrar el analizador e inicializar los parámetros de la cámara.

Alt text of image

  1. Llame al método de ejecución para iniciar la cámara y leer las transmisiones de la cámara para su reconocimiento.

Alt text of image

  1. Cuando se complete el reconocimiento, detenga el analizador. Alt text of image

Top comments (0)