電子帳簿保存法改正 電子取引 電子保存義務化
効率化の鍵を握る、「AI OCR」!

コラム
データ管理

 令和3年 電子帳簿保存法改正 で、電子取引の取引情報について、令和4年1月1日から、「電磁的記録保存」が義務化されました。実運用上、効率化の鍵を握るのは、「検索機能の確保」のための「取引年月日」「取引金額」「取引先」等記録項目の抽出です。紙の場合は、このような要件がなく、「電磁的記録保存」義務化から加わったとも言えます。尚、以降では、電子帳簿保存法を「電帳法」と略します。

 帳票類からの記録項目の抽出は、手作業で行えないこともないですが、大量にあると時間、コストも掛かりますし、ミスも発生します。これを解決してくれるのが、「AI OCR」です。本報告では、電帳法における「AI OCR」のポイントについてみていきます。

1. そもそもOCRとは

 OCRは、Optical character recognitionの略で、日本語では、「光学文字認識」です。紙に印刷された活字や手書き文字を文字コードの列に変換します。最近では、主に、スキャナーやスマホ撮影で取り込んだ画像をもとに処理を行っています。

2. 紙保存と電子保存の検索条件の差異

 電子保存では、「取引年月日」「取引金額」「取引先」等の検索できることという要件が付されていますが、紙の場合はありませんでした。何故でしょうか。それは、紙は、そのまま目で見えますが、電子ファイルは、ビューワーソフトで開けてみないと中身がわからないところにあると考えます。

図1 帳票の保存が紙と電子の場合の差異

紙と同等レベルを維持しようとすると、ファイルを見ただけで、「取引年月日」「取引金額」「取引先」くらいはわかるようにしておいてもらわないという要件になったものと推測します。さらに、そこまでやれるのなら、それらをキーとして検索できるようにまで要件にしておけば、税務調査がしやすいという発想なのでしょう。

しかしながら、紙保存から電子保存に変えた時には、明らかに、次のような作業が増えてしまいます。 これらは、紙の場合はなかった作業なので効率を上げないと関係する担当者の工数が大幅に増えてしまいます。
・電子ファイルを都度開ける。
・「取引年月日」「取引金額」「取引先」の記録項目とその内容・値を抽出する。
加えて、検索要件の追加があるので、
・検索用の台帳に、記録項目の内容・値を入力する。

3. 電帳法スキャナー保存での利用

 電帳法スキャナー保存では、紙帳票をスキャナーで、JPEGやPDFの画像として取り込みます。その画像から、OCR技術を利用して、記録項目である「取引年月日」「取引金額」「取引先」等を抽出します。

(1)画像を文字コードに変換する場合の留意点

 OCRには、印刷した活字を対象とするもの、手書き文字まで対象とするものと大きく二つに分かれます。OCRを使って文字コードに変換しても100%正しく認識はできません。そのため、読取率または誤読率という指標があります。活字の場合は、フォントの形状、大きさ、手書き文字の場合は、個人のくせなどに左右されます。当然、活字の場合の方が、読取率が高く、手書き文字の方が、読取率は下がります。
 最近では、AIを使うことで、特に、手書き文字の読取率は向上していますが、誤読をなくすことはできません。

(2)記録項目の抽出

 OCRを使って、記録項目を抽出するには、図1に示すように、帳票のレイアウト定義や、記録項目の記載位置を定義し、その場所から文字コードを拾うことが必要です。しかしながら、帳票レイアウトは、取引先や担当者ごとに変わりますし、記載項目名称にも表示揺れがあります。これまでは、このようなレイアウトや記載項目の差異を帳票毎に設定していく作業が、必要でした。そのため、OCRの利用を特定取引先、特定用途に利用が限る傾向がありました。
 しかしながら、電帳法 スキャナー保存の普及につれ、レイアウトや記載項目を学習するAIタイプのソフトが発達し、その手間を大幅に減らすことに貢献しています。

図2 記録項目の抽出

4. 電帳法 電子取引への適用

(1)画像から文字コードへの変換が不要となる。

 スキャナー保存の画像と電子取引の電子ファイル(PDF等)から、記録項目を抽出する場合に、大きな差異があります。それは、画像からの文字コード変換が不要であるということです。そのため、変換における誤読率も大幅に下がります。ただ、取引先によっては、文字を画像で埋め込んである場合もあり、その場合は、画像から文字への変換は必要となります。

(2)記録項目の抽出

 電子取引になったからと言っても、帳票レイアウトは、取引先や担当者ごとに変わりますし、記載項目名称にも表示揺れがあります。スキャナー保存と同じく、レイアウトや記載項目を学習するAIタイプのソフトを利用することで、帳票毎に設定する手間が大幅に減らせると期待できます。

(3)属性設定につなげる

 このように抽出した記録項目を電子取引の各帳票の属性として、自動登録するようにしておくことで大幅な工数の削減となります。

(4)確認作業の必要性

 AIを使っても、様々な帳票を受けますので、うまく抽出できていない可能性があります。自動化に任せてしまうだけでなく、人手で、対象帳票を開けて確認することも必要です。

5. 導入のポイント

 AIOCRの機能に期待しますが、現時点では、様々なレベル、価格のものが販売されています。以下に評価のポイントを挙げましたので、参考にして頂きたく。

(1)実帳票での確認
 実際を使用する帳票PDF等を取引先毎に集めて、どこまで自動でできるかを確認する。

(2)よくばらない
 利用頻度の高い帳票については、高い抽出率であることを確認する。利用頻度(取引頻度)の低い会社については、手入力も止むなしと割り切る。

(3)コストパフォーマンスのよいものを選ぶ
 AIOCRは、機能やテンプレートが充実しているものは値段が高いものになりがちです。自社で必要なレベルの目標を作っておく。

(4)抽出する記録項目の追加についても予め評価しておく

6. まとめ

 これからは、電子取引による帳票が増えてきます。記録項目の抽出、属性登録は、手間のかかる作業です。先行して省力化を検討してはどうでしょうか。

関連記事