TOPドキュメント・解析ドキュメントの解析精度を向上させるために、どのような方法がありますか?
最終更新日 : 2025/05/16

ドキュメントの解析精度を向上させるために、どのような方法がありますか?

解析精度には、次の2つの要因が大きく関係しています。

  1. アップロード時に自動解析されるOCRスキャンの精度
    アップロードされたファイルは、まずは自動的にOCRスキャンされテキスト化されます。
    機械文字であれば、ほぼほぼ正確に読み取りができますが、手書き文字の場合は誤読することも多く、本来記載されている文字と異なる出力がされる場合があります。なお、OCRスキャン時のエラーについてはプロダクト内で修正することはできないため、アップロードされるファイル側で何かしらの対応をする必要があります。

  2. 生成AIによるプロンプト実行
    通常な解析方法では、自動的にOCRスキャンされたテキストを生成AIによって設定された項目ごとに解析しています。
    アップロードされたドキュメントの構造がわかりやすいものであれば、誤読する可能性は低くなる傾向がありますが、情報量が非常に多かったり、特殊な構造をしているような場合は誤読する可能性は高まります。ただし、OCRスキャン時に取得したい項目と値が読み取りできているのであれば、設定プロンプトによって取得精度を向上させることは可能です。