Scene 1:

データ読込体験の概要

データ読込は「PDF」「画像」「書類」など、ファイルを対象にクローリングをする機能です。

例えば、このような場合に有用です。

PDFからデータを抽出したい
 書類からデータを抽出したい
 書類からデータを抽出する方法

フック宛に、FAXから書類をPDFに変換して送信すれば、書類からデータを抽出できます。

さらに、「CLジョイント」の機能を使用すれば、抽出したデータをそのまま管理画面に送信できます。

今回のチュートリアルは、PDFのデータを抽出します。

データ読み込みは、ファイルを対象にクローリングができます。

データ読込の課題として、文字認識(ORC) が完璧ではありません。


どのORCでも言えることですが、 「0」 と 「o」 のような紛らわしい文字や、手書き文字などは、100%正確に識別することはできませんのでご注意ください。


事前準備

データ読込体験の準備として、テストサイト商品情報のPDFをダウンロードしてください。

1. テストサイトに移動

テストサイトに移動します。

テストサイト

2. テスト用ファイル画面に移動

赤枠をクリックして、テスト用ファイル画面に移動します。

3. テスト用ファイルをダウンロード

「DLボタン」をクリックして、3つのPDFをダウンロードします。

DLファイル
item1.pdf
item2.pdf
item3.pdf

これらが、今回のチュートリアルで使用するPDFです。

テストサイトに移動するのがめんどうな場合は、下記のリンクをクリックしてください。

PDFをDL

ページの先頭へ