Anemone Flashcards

Question 1

Q

基本的なクローラーメソッド

Question 2

Q

階層の制限を指定するオプション

Answer

A

:depth_limit

Question 3

Q

sleep機能(アクセス間隔を指定)のオプション

Question 4

Q

UAを指定するオプション

Answer

A

:user_agent

Question 5

Q

オプションの指定の仕方としては、.crawlメソッドの第二引数にオプションを___で渡します(第一引数はURL)

Question 6

Q

＿＿＿メソッドを使うことによってURLを取得できます。

Question 7

Q

____メソッドでは、引数に正規表現を渡すことで対象を絞ることができます。

Answer

A

.on_pages_like

Question 8

Q

すべてのページに対して、処理を行うメソッド

Answer

A

.on_every_page

Question 9

Q

ページごとにどのリンク先を巡回するか指定するメソッド

Answer

A

.focus_crawl(&block)

Question 10

Q

巡回しないURLを正規表現で指定する

Answer

A

.skip_links_like(*patterns)

Question 11

Q

取得対象のURLを絞り込む、もしくは除外した後で、____メソッドもしくはon_pages_likeメソッドで取得したページに対しての処理を記述します。

Answer

A

on_every_page

Question 12

Q

Anemone::Pageに関するメソッドで一番多く利用するのは、___です。このメソッドは、ページ中に含まれている<a>タグのリンク先をすべて取得し、配列と
して返します。リンク先の取得や巡回先の選択など、さまざまな用途で使います。</a>

Question 13

Q

require 'anemone'
#(1)　巡回対象サイトのURLを指定
Anemone\_\_\_\_("http://example.com/") do |anemone|
  #(2)除外対象ページのURLパターンを指定
　anemone.skip_links_like /除外対象のURLパターン/

　#(3)巡回対象ページのURLの指定
anemone.focus_crawl do |page|
page.links
end

    #(4) 正規表現で一致したページのみ処理
    anemone.on_pages_like(/処理対象のURLパターン/) do |page|
    #ページに対する処理の記述
end

    #(5)すべてのページに対しての処理
    anemone.on_every_page do |page|
      #ページに対する処理の記述
    end

    #(6) ストレージ対する処理
　anemone.after_crawl do |page|
      #ストレージに対する処理の記述
    end
end

Question 14

Q

require 'anemone'
#(1)　巡回対象サイトのURLを指定
Anemone.crawl("http://example.com/") do |anemone|
  #(2)除外対象ページのURLパターンを指定
　anemone.\_\_\_\_ /除外対象のURLパターン/

　#(3)巡回対象ページのURLの指定
anemone.focus_crawl do |page|
page.links
end

    #(4) 正規表現で一致したページのみ処理
    anemone.on_pages_like(/処理対象のURLパターン/) do |page|
    #ページに対する処理の記述
end

    #(5)すべてのページに対しての処理
    anemone.on_every_page do |page|
      #ページに対する処理の記述
    end

    #(6) ストレージ対する処理
　anemone.after_crawl do |page|
      #ストレージに対する処理の記述
    end
end

Answer

A

skip_links_like

Question 15

Q

require 'anemone'
#(1)　巡回対象サイトのURLを指定
Anemone.crawl("http://example.com/") do |anemone|
  #(2)除外対象ページのURLパターンを指定
　anemone.skip_links_like /除外対象のURLパターン/

　#(3)巡回対象ページのURLの指定
anemone.____ do |page|
page.links
end

    #(4) 正規表現で一致したページのみ処理
    anemone.on_pages_like(/処理対象のURLパターン/) do |page|
    #ページに対する処理の記述
end

    #(5)すべてのページに対しての処理
    anemone.on_every_page do |page|
      #ページに対する処理の記述
    end

    #(6) ストレージ対する処理
　anemone.after_crawl do |page|
      #ストレージに対する処理の記述
    end
end

Answer

A

focus_crawl

Question 16

Q

require 'anemone'
#(1)　巡回対象サイトのURLを指定
Anemone.crawl("http://example.com/") do |anemone|
  #(2)除外対象ページのURLパターンを指定
　anemone.skip_links_like /除外対象のURLパターン/

　#(3)巡回対象ページのURLの指定
anemone.focus_crawl do |page|
page.links
end

    #(4) 正規表現で一致したページのみ処理
    anemone.\_\_\_(/処理対象のURLパターン/) do |page|
    #ページに対する処理の記述
end

    #(5)すべてのページに対しての処理
    anemone.on_every_page do |page|
      #ページに対する処理の記述
    end

    #(6) ストレージ対する処理
　anemone.after_crawl do |page|
      #ストレージに対する処理の記述
    end
end

Answer

A

on_pages_like

Question 17

Q

require 'anemone'
#(1)　巡回対象サイトのURLを指定
Anemone.crawl("http://example.com/") do |anemone|
  #(2)除外対象ページのURLパターンを指定
　anemone.skip_links_like /除外対象のURLパターン/

　#(3)巡回対象ページのURLの指定
anemone.focus_crawl do |page|
page.links
end

    #(4) 正規表現で一致したページのみ処理
    anemone.on_pages_like(/処理対象のURLパターン/) do |page|
    #ページに対する処理の記述
end

    #(5)すべてのページに対しての処理
    anemone.\_\_\_\_ do |page|
      #ページに対する処理の記述
    end

    #(6) ストレージ対する処理
　anemone.after_crawl do |page|
      #ストレージに対する処理の記述
    end
end

Answer

A

on_every_page

Question 18

Q

require 'anemone'
#(1)　巡回対象サイトのURLを指定
Anemone.crawl("http://example.com/") do |anemone|
  #(2)除外対象ページのURLパターンを指定
　anemone.skip_links_like /除外対象のURLパターン/

　#(3)巡回対象ページのURLの指定
anemone.focus_crawl do |page|
page.links
end

    #(4) 正規表現で一致したページのみ処理
    anemone.on_pages_like(/処理対象のURLパターン/) do |page|
    #ページに対する処理の記述
end

    #(5)すべてのページに対しての処理
    anemone.on_every_page do |page|
      #ページに対する処理の記述
    end

    #(6) ストレージ対する処理
　anemone.\_\_\_\_ do |page|
      #ストレージに対する処理の記述
    end
end

Answer

A

after_crawl