Scene 4:

シーケンス - STEP2

STEP2は「クローリング」

テストサイトでクローリングする流れは、第二にクローリングです。

STEP2は、テストサイトをクローリングです。

NEXT STEPを作成:STEP2

クローリングを選択します。

STEPタグ 商品名・攻撃力・価格を取得COPY
アクション クローリング

STEP2: クローリング

セット:商品名

今回、クローリングで取得する項目は「商品名・攻撃力・価格」の3点です。


アイスソード01をクリック

まずは商品名を取得するので 「アイスソード01」をクリックします。

「アイスソード01」をクリックすると、右サイドの情報に「1階層」「2階層」「3階層」・・・と階層が表示されます。

階層とは?

WEBサイトは「HTML」という言語でできており、HTMLは カギカッコ < > でくくった「タグ」で構成されています。

<p>pタグの例</p>

そして、タグの深さを「階層」といいます。

例えば、サンプルAサンプルBは共に div > ul > li > p とタグが深くなるので階層は4になります。

<div>
 <ul>
  <li>
   <p>サンプルA</p>
  </li>  
  <li>
   <p>サンプルB</p>
  </li>
 </ul>
</div>

対象をクリックすると、右エリアに階層が表示されます。

10階層を「対象に含めない」に変更

クローリングですべての商品名を取得したいですが、現段階では「アイスソード01」しか選択されていません。右サイドの階層を操作して、すべての商品名を範囲選択させます。

範囲選択のコツは 最下層から順番に「対象に含めない」にすること です。右サイドバーをスクロールすると最下層は10階層なのがわかるので、10階層を「対象に含めない」に変更すると、枠が横向きに範囲選択されました。

範囲選択のコツは 最下層から順番に「対象に含めない」にすること です。

10階層を元に戻す

すべての商品名が範囲選択されるには横向きではなく縦向きです。

希望と違うので、10階層を元 (10階 配置:親から2番目) に戻します。

範囲選択が、希望と違ったら元に戻します。

9階層を「対象に含めない」に変更

範囲選択のコツは 最下層から順番に「対象に含めない」にする なので、最下層(10階層)の次は9階層です。

9階層を「対象に含めない」に変更すると、枠が縦向きに範囲選択されました。

最下層から順番に「対象に含めない」にするといずれ希望どうりの範囲選択になります。

セット:攻撃力

次は、攻撃力を設定します。

攻撃力をクリック

右サイドバーから「B:row2」をクリックしてから、アイスソード01の攻撃力「4721」をクリックして、「B:row2」に攻撃力をセットします。

10階層のラジオボタンを「対象に含めない」に変更

攻撃力の階層を確認すると、最下層は商品名と同じ10階層だとわかります。

最下層から順番にラジオボタンを「対象に含めない」にする に従い、10階層を「対象に含めない」に変更すると、枠が横向きに範囲選択されます。

10階層を元に戻す

横向きは希望と違うので、10階層を元 (10階 配置:親から3番目) に戻します。

9階層を「対象に含めない」に変更

9階層を「対象に含めない」に変更すると、枠が縦向きに範囲選択されて、攻撃力が範囲選択されました。

セット:価格

次は、価格を設定します。

価格をクリック

右サイドバーから「C:row3」をクリックしてから、アイスソード01の価格「6,910」をクリックして、「C:row3」に価格をセットします。

9階層を「対象に含めない」に変更

「商品名」と「攻撃力」の結果から、「価格」も9階層が縦向きではないかと予想されるので、今回は、いきなり9階層のラジオボタンを「対象に含めない」に変更しましょう。

予想通り、枠が縦向きに範囲選択されて、価格が範囲選択されました。

HTMLはだいたい同じ構造です。構造の法則を見つけたら、直感で操作してください。

クローリングは自動でシーケンスロックされます

商品名・攻撃力・価格が範囲選択できたら、STEP2は完了です。「保存」ボタンを押してください。

クローリングは必ず最終STEPになり、クローリングの後にSTEPを追加することはできません。そのため、クローリングを保存すると同時にシーケンスロックされます。

クローリングは最終STEPなので、自動でシーケンスロックされます。

ページの先頭へ