Amazon AWS - Textract¶

Nada puede ser más sencillo que interactuar con Amazon Textract que el complemento BotCity.

El complemento BotCity para AWS Textract te permite analizar y extraer rápidamente información de cientos de documentos, ya sean escritos a mano o ingresados.

Instalación¶

PythonJava

pip install botcity-aws-textract-plugin

Importando el complemento¶

Después de instalar este paquete, el siguiente paso es importar el paquete en tu código y comenzar a utilizar las funciones.

PythonJava

from botcity.plugins.aws.textract import BotAWSTextractPlugin

Configuración de la conexión¶

Note

Hay dos formas diferentes de autenticación.

1. Creando la carpeta .aws en el directorio principal, necesitas crear dos archivos.

# ~/.aws/config
[default]
region=<region_code>

# ~/.aws/credentials
[default]
aws_access_key_id=<your_aws_access_key_id>
aws_secret_access_key=<your_aws_secret_access_key>

2. Pasando las credenciales en el constructor de la clase.

PythonJava

# Using the `.aws` folder
textract = BotAWSTextractPlugin()

# Alternative using the credentials as constructor arguments
textract = BotAWSTextractPlugin(
            region_name='<region_code>',
            use_credentials_file=False,
            access_key_id='<your_aws_access_key_id>',
            secret_access_key='<your_aws_secret_access_key>',
)

Como demostración de la biblioteca, construyamos juntos un ejemplo simple que analizará el texto de la siguiente imagen:

Haz clic aquí para descargar

Leyendo el texto de la imagen¶

Ahora vamos a leer el texto de la imagen.

PythonJava

# Read the text from the image
textract.read("otter_crossing.jpg")

# Print the text from the image
print(textract.full_text())

The output should look like this:

CAUTION
Otters
crossing
for
next
6
miles

Código completo¶

Echemos un vistazo al código completo:

PythonJava

# Instantiate the plugin using the `.aws` folder
textract = BotAWSTextractPlugin()

# Read the text from the image
textract.read("otter_crossing.jpg")

# Print the text from the image
print(textract.full_text())

Consejo

Este complemento te permite utilizar encadenamiento de métodos, por lo que el código anterior se puede escribir de la siguiente manera:

PythonJava

text = BotAWSTextractPlugin() \
    .read("otter_crossing.jpg") \
    .full_text()
# Print the text from the image
print(text)