Extrair Dados PDF (OCR)

Objeto utilizado para extrair dados de um arquivo PDF

Visão Geral

O objeto Extrair Dados PDF (OCR) é responsável por realizar a extração de informações de arquivos PDF utilizando OCR, com base em uma configuração previamente definida no objeto Configurar Extração PDF (OCR).

Esse objeto utiliza a configuração criada anteriormente para identificar e processar o conteúdo do documento, permitindo que o robô capture informações presentes em PDFs digitalizados ou documentos que não possuem texto estruturado.

A extração ocorre a partir de um arquivo PDF informado no fluxo do robô, utilizando os parâmetros definidos na configuração de OCR.

Esse recurso é utilizado em automações que envolvem leitura e processamento de documentos como:

Notas fiscais
Boletos
Contratos
Comprovantes
Documentos digitalizados em PDF

Funcionamento

O objeto executa o processo de extração de dados de um PDF utilizando OCR, baseado em uma configuração previamente criada.

O fluxo de funcionamento ocorre da seguinte forma:

O usuário cria uma configuração utilizando o objeto Configurar Extração PDF (OCR).
No objeto Extrair Dados PDF (OCR), essa configuração é selecionada no campo Configuração.
O usuário informa o arquivo PDF que será processado.
Durante a execução do robô, o sistema aplica o OCR no documento.
Os dados identificados são processados e disponibilizados para uso no fluxo do robô.

Essa abordagem permite reutilizar a mesma configuração de OCR para diferentes documentos que possuem estrutura semelhante.

Quando usar

Quando for necessário extrair dados de arquivos PDF digitalizados.
Quando o documento não possui texto selecionável.
Quando existir uma configuração de OCR previamente definida para o layout do documento.

Quando não usar

Quando o PDF possui texto estruturado, permitindo leitura direta sem OCR.
Quando não existe uma configuração de extração previamente criada.

Configuração

CAMPO

DESCRITIVO

Título

Nome do objeto dentro do fluxo do robô. Permite identificar a etapa no processo de automação.

Nome Identificador do Objeto

Identificador único utilizado para referenciar os dados extraídos em outras etapas do robô.

Configuração

Seleciona a configuração previamente criada através do objeto Configurar Extração PDF (OCR).

Importar Arquivo

Caminho do arquivo PDF que será processado pelo OCR para extração das informações.

Observação:

Os campos Configuração e Importar Arquivo são obrigatórios para execução do objeto.

Estrutura de Bloco

Não há estrutura de bloco específica documentada para este objeto.

Exemplos

Exemplo simples

Extrair dados de um PDF digitalizado.

Fluxo:

Criar uma configuração utilizando Configurar Extração PDF (OCR).
Adicionar o objeto Extrair Dados PDF (OCR).
Selecionar a Configuração criada.
Informar o arquivo PDF no campo Importar Arquivo.
Executar o robô para realizar a extração das informações.

Exemplo aplicado

Automação para leitura de Notas Fiscais em PDF.

Fluxo possível:

Criar uma configuração de OCR baseada em um modelo de nota fiscal.
Receber um PDF de nota fiscal no robô.
Utilizar o objeto Extrair Dados PDF (OCR) para processar o documento.
Extrair dados como:
- Número da nota
- CNPJ
- Valor total
- Data de emissão
Utilizar as informações extraídas para preenchimento de sistemas ou armazenamento em banco de dados.

Retornos

Erros comuns e como evitar

Erro

Como evitar

Configuração não selecionada

Garantir que uma configuração válida de OCR esteja definida no campo Configuração

Arquivo PDF inválido

Verificar se o caminho do arquivo informado está correto

Falha na extração de dados

Certificar-se de que o layout do documento corresponde ao modelo utilizado na configuração

Boas práticas

Criar configurações de OCR específicas para cada tipo de documento.
Utilizar arquivos de boa qualidade para melhorar a precisão do OCR.
Nomear corretamente os objetos para facilitar a manutenção do fluxo do robô.
Reutilizar a mesma configuração quando os documentos possuírem layout semelhante.

PreviousConfigurar Extração PDF (OCR)NextExtrair Dados Documento

Last updated 22 days ago

Was this helpful?

hashtagVisão Geral

hashtagFuncionamento

hashtagQuando usar

hashtagQuando não usar

hashtagConfiguração

hashtagEstrutura de Bloco

hashtagExemplos

hashtagExemplo simples

hashtagExemplo aplicado

hashtagRetornos

hashtagErros comuns e como evitar

hashtagBoas práticas