Atualizações do pacote Extração de documentos

Analise as atualizações nas versões lançadas do Extração de documentos pacote, como recursos novos e aprimorados, além de correções e limitações. A página também lista as datas de lançamento de cada versão e as versões compatíveis da Control Room e do Agente de bot.

Resumo das versões

A tabela a seguir lista as versões do pacote Extração de documentos liberadas com uma versão de Automation 360 ou como uma versão somente pacote (em ordem decrescente de datas de lançamento). Clique no link da versão para obter informações sobre as atualizações dessa versão do pacote.
Versão Data da versão Tipo de versão Versão da Agente de bot Versão da Control Room
Atualizações do pacote Extração de documentos 5 de abril de 2024 Com Automation 360 versão v.32 (No local) 21,252 ou mais recente 19223 ou mais recente
Atualizações do pacote Extração de documentos 21 de março de 2024 Com a versão Automation 360 v.32 (Sandbox) 21,252 ou mais recente 19223 ou mais recente
Atualizações do pacote Extração de documentos 26 de janeiro de 2024 Pacote-somente; após a versão Automation 360 v.31 21,252 ou mais recente 19223 ou mais recente
Atualizações do pacote Extração de documentos 22 de dezembro de 2023 Somente Pacote; após a versão Automation 360 v.31 (Sandbox) 21,252 ou mais recente 19223 ou mais recente
Atualizações do pacote Extração de documentos 6 de dezembro de 2023 Com a versão Automation 360 v.31 (Sandbox) 21,252 ou mais recente 19223 ou mais recente
Atualizações do pacote Extração de documentos 28 de novembro de 2023 Com Automation 360 versão v.30 21,252 ou mais recente 19223 ou mais recente
Atualizações do pacote Extração de documentos 16 de novembro de 2023 Pacote-somente; após a versão Automation 360 v.30 21,252 ou mais recente 19223 ou mais recente
3.30.24 21 de setembro de 2023 Somente Pacote; após a versão Automation 360 v.30 (Sandbox) 21,252 ou mais recente 19223 ou mais recente
3.30.22 6 de setembro de 2023 Com a versão Automation 360 v.30 (Sandbox) 21,252 ou mais recente 19223 ou mais recente
Atualizações do pacote Extração de documentos 21 de agosto de 2023 Somente Pacote; após a Automation 360 v.29 21,98 ou mais recente 15345 ou mais recente
3.30.19 16 de agosto de 2023 Somente Pacote; após a Automation 360 v.29 21,98 ou mais recente 15345 ou mais recente
Atualizações do pacote Extração de documentos 17 de julho de 2023 Pacote-somente; após a versão Automation 360 v.29 21,98 ou mais recente 15345 ou mais recente
Atualizações do pacote Extração de documentos 6 de junho de 2023 Com a versão Automation 360 v.29 (Sandbox) 21,98 ou mais recente 15345 ou mais recente
Nota:
  • Para baixar um pacote individual (atualizado em uma versão do Automation 360 em que você quer apenas o pacote), use este URL:

    https://aai-artifacts.my.automationanywhere.digital/packages/<package-file-name>-<version.number>.jar

  • Para o Extração de documentos pacote, a convenção de nomenclatura é: bot-command-iqbot-extraction360-<version-number>-full.jar

    Por exemplo, bot-command-iqbot-extraction360-3.31.22-full.jar

Para obter etapas detalhadas sobre como baixar um pacote e adicioná-lo de modo manual à Control Room, consulte Adicione pacotes à Control Room.

3.32.23

  • Versão da Agente de bot compatível: 21,252 ou mais recente
  • Versão da Control Room compatível: 19223 ou mais recente
Correções
Os usuários agora podem salvar o feedback de validação em seus ambientes do Automação de documento quando o proxy está habilitado na máquina do Agente de bot.

ID de caso do Service Cloud: 02092484

Com Google Vision OCR e proxy habilitados, a extração do documento não falha mais para documentos não estruturados e não mostra mensagem de erro.

ID de caso do Service Cloud: 02104409

3.32.22

  • Versão da Agente de bot compatível: 21,252 ou mais recente
  • Versão da Control Room compatível: 19223 ou mais recente
Correções
Com o modelo aprimorado de detecção de tabelas de documentos que está adicionando o Indicador do fim de tabela, agora você pode extrair dados da tabela de todas as páginas para o idioma selecionado. Portanto, as tabelas ausentes e os problemas de extração das últimas linhas das páginas são reduzidos.

ID de caso do Service Cloud: 02065073

Com a extração de tabela aprimorada, as tabelas não estruturadas não mostram mais os valores inúteis e agora extraem os dados da tabela com êxito.

3.31.22

  • Versão da Agente de bot compatível: 21,252 ou mais recente
  • Versão da Control Room compatível: 19223 ou mais recente
Correções
Depois de adicionar feedback de validação à instância de aprendizado, a extração do documento não falha mais com uma mensagem de erro.

Antes, a extração do documento falhava quando a caixa de seleção de validação era selecionada.

Depois de adicionar feedback de validação à instância de aprendizado, o feedback é salvo para todas as tabelas em todas as páginas do documento e os dados são extraídos de maneira correta de todas as páginas.

Antes, o feedback não era salvo para todas as páginas.

ID de caso do Service Cloud: 01995135, 02093575, 02093389

Depois de adicionar o feedback de validação, se os IDs das tabelas corresponderem, os dados de todas as tabelas de cada página serão extraídos e exibidos no validador.

Antes, nesses casos, algumas páginas eram ignoradas e os dados de todas as páginas não eram exibidos no validador.

Ao aplicar as configurações de treinamento avançado, você precisa trocar colunas e todos os valores das colunas precisam ser mapeados de forma correta. Como resultado, os dados são extraídos de forma correta em colunas separadas. Você pode optar por mapear de novo todas as células da coluna ou remover todas as outras linhas de células incorretas, mantendo as duas primeiras linhas intactas. Não deve haver células incorretas na coluna e todas as células da coluna devem ter os valores corretos.

Antes, nesses casos, os dados de duas colunas eram extraídos em uma única coluna.

Agora, você pode extrair os valores dos campos da tabela na ordem correta e o problema de extração de várias linhas foi eliminado. Além disso, você pode usar o recurso Indicador de fim da tabela para extrair várias linhas após aplicar dados de feedback quando houver apenas uma linha na tabela.
Nota: Para tabelas de linha única, a prática recomendada é usar o recurso Indicador de fim de tabela. Caso contrário, em cenários específicos, a extração poderá ser parcial.

ID de caso do Service Cloud: 02091013

Depois de treinar um documento, quando o usuário processar o mesmo documento com o Google Vision OCR, o feedback é salvo e extrai os dados exigidos.

Antes, nesses casos, não era possível processar um tipo específico de documento e a cada vez a validação manual do documento era exigida.

ID de caso do Service Cloud: 02098682

3.31.17

  • Versão da Agente de bot compatível: 21,252 ou mais recente
  • Versão da Control Room compatível: 19223 ou mais recente
Correções
Com o Google Vision OCR, agora é possível processar os documentos com sucesso sem uma licença do IA de documentos do Google. Além disso, ele não gera uma mensagem de erro.

Antes, ele solicitava uma licença do IA de documentos do Google para processar os documentos e gerava um erro ao extrair os documentos. Como resultado, não era possível extrair os documentos com o Google Vision OCR.

ID de caso do Service Cloud: 02097428, 02096992, 02097798, 02097157, 02098378, 02098563, 02094573

3.31.16

  • Versão da Agente de bot compatível: 21,252 ou mais recente
  • Versão da Control Room compatível: 19223 ou mais recente
Correções
Quando os usuários criam uma instância de aprendizado com IA de documentos do Google (BYOK) e proxy autenticado, a extração do documento não falha mais em documentos para um documento com mais de 10 páginas.

Antes, nesses casos, a extração falhava com uma mensagem de erro e os usuários não conseguiam processar os documentos.

3.31.15

  • Versão da Agente de bot compatível: 21,252 ou mais recente
  • Versão da Control Room compatível: 19223 ou mais recente
Correções
Se as Regras do documento contiverem diversas condições usando o operador AND com (ou sem) um grupo, uma mensagem de erro apropriada será exibida. Além disso, a ação correspondente agora será aplicada nos campos.

3.31.13

  • Versão da Agente de bot compatível: 21,252 ou mais recente
  • Versão da Control Room compatível: 19223 ou mais recente
O que foi alterado
Com extração aprimorada de documentos não estruturados em Automação de documento, você pode:
  • Processar consultas complexas de forma eficaz.
  • Validar documentos com navegação aprimorada para a página relevante.
Correções
Com a extração aprimorada de tabelas usando o mecanismo ABBYY OCR, o feedback heurístico agora funciona de maneira correta.
  • Para o idioma alemão, a extração de faturas funciona de maneira correta após a aplicação do feedback e todos os dados da tabela são extraídos.
  • Para o idioma espanhol, os dados da tabela são extraídos de maneira correta do documento da fatura.
  • Para o idioma inglês, os dados da fatura são extraídos de todas as páginas com ABBYY OCR.

ID de caso do Service Cloud: 01995901

Quando um usuário extrai os dados da tabela de um arquivo PDF em que a tabela é expandida para várias páginas, os dados de todas as páginas são extraídos com sucesso após aplicar o feedback heurístico.

Antes, os usuários não conseguiam extrair dados da segunda página do arquivo PDF em que a tabela era expandida para várias páginas.

ID de caso do Service Cloud: 01996536

Iniciando a extração da primeira página para todos os campos, o feedback heurístico agora está funcionando da maneira correta para captura de dados de tabelas multilinhas e gera a saída correta.

Anteriormente, os dados da tabela multilinha não eram extraídos mesmo após o fornecimento do feedback heurístico. Como resultado, a saída não foi gerada de forma adequada.

ID de caso do Service Cloud: 01944805, 01946809, 01952836, 01957090, 01975800, 01981088, 01944805, 01946809, 01952836, 01957090

Para Microsoft Formulários padrão, a extração da tabela não falha mais quando as células estão vazias e os usuários podem extrair o documento com êxito.
Quando um usuário importa uma instância de aprendizado e processa os documentos, o documento extraído mostra a ordem correta das palavras para as datas em todas as páginas.
Quando um usuário importa uma instância de aprendizado e processa os documentos, todos os valores são exibidos na tabela após a extração.

Antes, nesses casos, a região identificada pelo sistema (SIR) era destacada, mas um valor vazio era mostrado na tabela.

Quando um usuário importa um arquivo .dw com feedback heurístico e processa um documento que contém o valor (-) na última linha, os documentos são extraídos de maneira correta sem ignorar o valor negativo na última linha.

Anteriormente, nesses casos, a última linha era ignorada, resultando em perda de dados ou processamento incorreto.

Quando um usuário processa um documento que contém uma tabela, a extração é concluída com êxito sem a mensagem de erro DOCUMENT_PARTIALLY_FAILED ou Tempo limite de extração.

Anteriormente, nesses casos, alguns documentos não eram extraídos devido a múltiplas detecções da mesma tabela e causavam problemas de tamanho da tabela (max () arg).

Quando um usuário importa uma instância de aprendizado e processa os documentos, todos os valores são exibidos de forma separada de todas as páginas.

Anteriormente, as linhas da segunda página eram mescladas em uma linha.

Limitações
Quando um usuário usa o Google Vision OCR, a detecção ou a extração da tabela não funcionará.

Alternativa: É recomendado usar o mecanismo ABBYY OCR.

ID de caso do Service Cloud: 01995901

Em casos específicos, onde as tabelas são espalhadas por várias páginas sem cabeçalhos em todas as páginas (páginas sem cabeçalho), os usuários podem observar que os dados não estão sendo extraídos de todas as páginas após aplicar o feedback.

3.30.24

  • Versão da Agente de bot compatível: 21,252 ou mais recente
  • Versão da Control Room compatível: 19223 ou mais recente
Correções
Os usuários agora podem visualizar corretamente os dados extraídos da segunda linha usando o feedback heurístico.
Para o tipo de documento Ordem de compra, agora você pode extrair os valores do campo da tabela corretamente de todas as páginas.
O arquivo de feedback gerado não mostra mais nenhuma mensagem de erro e os usuários podem processar os documentos com êxito.

3.30.22

  • Versão da Agente de bot compatível: 21,252 ou mais recente
  • Versão da Control Room compatível: 19223 ou mais recente
Novidades
O Automação de documento fornece uma extração aprimorada por meio das novas ações Obter dados do documento e Atualizar dados do documento. Você pode usar essas ações para aplicar lógica personalizada para manipulação e validação de dados a fim de maximizar o processamento direto (STP) e reduzir os esforços de verificação manual.

3.30.21

  • Versão da Agente de bot compatível: 21,98 ou mais recente
  • Versão da Control Room compatível: 15345 ou mais recente
Correções
Esta versão do pacote Extração de documentos é um patch para corrigir o '501: DOCUMENT_PARTIALLY_FAILED' erro que ocorreu durante o processamento de alguns documentos.

3.30.19

  • Versão da Agente de bot compatível: 21,98 ou mais recente
  • Versão da Control Room compatível: 15345 ou mais recente
Correções
O pacote Extração de documentos oferece um recurso de extração aprimorado para colunas de cabeçalho de tabela complexas.
  • Cenário 1: Extração de dados dos cabeçalhos de colunas em tabelas com vários cabeçalhos mesclados em uma única coluna.
  • Cenário 2: Extração de dados dos cabeçalhos de colunas em tabelas com vários subcabeçalhos divididos.
Siga estas etapas para ativar a extração aprimorada de dados do cabeçalho da tabela:
  1. Criar ou editar uma instância de aprendizado.
  2. Para adicionar ou editar os campos da tabela, navegue até a guia Campos da tabela e clique em Adicionar um campo > Propriedades do campo.
  3. Adicione cada cabeçalho de tabela como um campo da tabela separado. Por exemplo:

    Cenário 1: Adicione o cabeçalho da coluna e cada subcabeçalho mesclado como um campo da tabela separado. Usando a captura de tela como referência, você extrairia dados dos três campos de cabeçalho da coluna mesclados, para os quais criaria três campos da tabela separados, como CGST com o alias CGST, SGST com o alias SGST e CESS com o alias CESS.

    Exemplo de cabeçalho da coluna com vários subcabeçalhos.

    Cenário 2: Adicione o cabeçalho da coluna e cada subcabeçalho dividido como um campo da tabela separado. Semelhante ao exemplo acima, para um cabeçalho de coluna CGST com subcabeçalhos divididos Rate e AMT, você precisaria criar dois campos de tabela separados CGST Rate com o alias CGST Rate e CGST AMT com o alias CGST AMT.

    Exemplo de cabeçalho de coluna com vários subcabeçalhos divididos.

  4. Clique em Enviar para salvar suas alterações.

3.29.17

  • Versão da Agente de bot compatível: 21,98 ou mais recente
  • Versão da Control Room compatível: 15345 ou mais recente
Correções
O pacote Document Extraction tem correções de melhoria de extração para campos de formulário e tabela.

3.29.14

  • Versão da Agente de bot compatível: 21,98 ou mais recente
  • Versão da Control Room compatível: 15345 ou mais recente
Novidades
Automação de documento fornece uma extração aprimorada por meio de feedback heurístico com foco em cenários complexos, como multitables. Além disso, há melhorias na extração dos campos de formulário e no desempenho imediato (especificamente para campos de tabela).