Saltar a contenido

Amazon AWS - Textract

Nada puede ser más sencillo que interactuar con Amazon Textract que el complemento BotCity.

El complemento BotCity para AWS Textract te permite analizar y extraer rápidamente información de cientos de documentos, ya sean escritos a mano o ingresados.

Instalación

pip install botcity-aws-textract-plugin

Importando el complemento

Después de instalar este paquete, el siguiente paso es importar el paquete en tu código y comenzar a utilizar las funciones.

from botcity.plugins.aws.textract import BotAWSTextractPlugin

Configuración de la conexión

Note

Hay dos formas diferentes de autenticación.

1. Creando la carpeta .aws en el directorio principal, necesitas crear dos archivos.

# ~/.aws/config
[default]
region=<region_code>
# ~/.aws/credentials
[default]
aws_access_key_id=<your_aws_access_key_id>
aws_secret_access_key=<your_aws_secret_access_key>

2. Pasando las credenciales en el constructor de la clase.

# Using the `.aws` folder
textract = BotAWSTextractPlugin()

# Alternative using the credentials as constructor arguments
textract = BotAWSTextractPlugin(
            region_name='<region_code>',
            use_credentials_file=False,
            access_key_id='<your_aws_access_key_id>',
            secret_access_key='<your_aws_secret_access_key>',
)

Como demostración de la biblioteca, construyamos juntos un ejemplo simple que analizará el texto de la siguiente imagen:

otter_crossing.jpg

Haz clic aquí para descargar

Leyendo el texto de la imagen

Ahora vamos a leer el texto de la imagen.

# Read the text from the image
textract.read("otter_crossing.jpg")

# Print the text from the image
print(textract.full_text())

The output should look like this:

CAUTION
Otters
crossing
for
next
6
miles

Código completo

Echemos un vistazo al código completo:

# Instantiate the plugin using the `.aws` folder
textract = BotAWSTextractPlugin()

# Read the text from the image
textract.read("otter_crossing.jpg")

# Print the text from the image
print(textract.full_text())

Consejo

Este complemento te permite utilizar encadenamiento de métodos, por lo que el código anterior se puede escribir de la siguiente manera:

text = BotAWSTextractPlugin() \
    .read("otter_crossing.jpg") \
    .full_text()
# Print the text from the image
print(text)