データ読込は「PDF」「画像」「書類」など、ファイルを対象にクローリングをする機能です。
例えば、このような場合に有用です。
フック宛に、FAXから書類をPDFに変換して送信すれば、書類からデータを抽出できます。
さらに、「CLジョイント」の機能を使用すれば、抽出したデータをそのまま管理画面に送信できます。
今回のチュートリアルは、PDFのデータを抽出します。
データ読み込みは、ファイルを対象にクローリングができます。
データ読込の課題として、文字認識(ORC) が完璧ではありません。
どのORCでも言えることですが、 「0」 と 「o」 のような紛らわしい文字や、手書き文字などは、100%正確に識別することはできませんのでご注意ください。
データ読込体験の準備として、テストサイト商品情報のPDFをダウンロードしてください。
テストサイトに移動します。
赤枠をクリックして、テスト用ファイル画面に移動します。
「DLボタン」をクリックして、3つのPDFをダウンロードします。
DLファイル |
---|
item1.pdf |
item2.pdf |
item3.pdf |
これらが、今回のチュートリアルで使用するPDFです。
テストサイトに移動するのがめんどうな場合は、下記のリンクをクリックしてください。