수기 작성 문서에서 데이터를 추출할 때는 이러한 문서의 데이터 추출 정확도가 일반적으로 타이핑하거나 인쇄한 문서보다 낮다는 것을 알아두는 것이 중요합니다.

데이터 추출 정확도가 낮은 이유는 일반적으로 다음과 같습니다.

  • 일관되지 않은 문자 모양 및 크기
  • 단어와 문자 사이의 가변적인 간격
  • 겹치거나 연결된 글자
  • 다양한 종류의 잉크와 종이 사용
  • 약어나 속어의 사용
  • 얼룩과 수정
  • 표준 서식을 따르지 않는 텍스트 배치

수기 작성 문서에서 데이터를 추출하기 전에 다음 지침을 준수해야 합니다.

  • ABBYY OCR 대신 Google Vision OCR 또는 표준 양식을 사용합니다.
  • 생성형 AI 기반 데이터 추출 옵션을 활성화한 경우 비전 기반 생성형 AI 모델을 사용해야 합니다. 비전 기반 생성형 AI 데이터 추출 항목을 참조하십시오.
  • 가능하다면 문서를 스캔하고 저장할 때 다음 권장 설정을 사용합니다.
    • 문서를 스캔할 때는 최적의 DPI(예: 300 DPI)를 사용합니다.
    • 회색조 또는 컬러 설정으로 문서를 스캔합니다.
    • 문서를 저장할 때 과도한 압축을 사용하지 않습니다.