kakakakakku blog

Weekly Tech Blog: Keep on Learning!

Elasticsearch のノード名と Marvel のキャラクター一覧を比較してみた

Elasticsearch のノード名はデフォルトだと "Iron Man" や "X-Man" などアメコミのキャラクター名が自動的に設定されるようになっていて,実際にコードを見たら2825種類の候補の中から選ばれるようになっていた.

今のローカルの Elasticsearch を見てみると "Legion" だった.確かに Marvel のキャラクターだ!

➜ curl -s http://localhost:9200/_nodes | jq '.nodes[].name'
"Legion"

marvel.com

Marvel のキャラクター一覧に存在しないこともある

"Tempus" は何のキャラクターなんだろう?

➜ curl -s http://localhost:9200/_nodes | jq '.nodes[].name'
"Tempus"

比較してみた

簡単なスクリプトを書いて「Elasticsearch のノード名」と「Marvel のキャラクター一覧」を比較してみた.

  • Elasticsearch : 2825 件
  • Marvel : 1269 件
  • 一致件数 : 730

よって「Elasticsearch のノード名」の中で約25%のキャラクターが「Marvel のキャラクター一覧」に含まれていることがわかった.思ったより少なかったなー!

探すと出てくる場合もある?

Marvel のキャラクター一覧には載ってないけど,Marvel 関連の Wiki などを見てると,ちゃんと載ってる場合がある.マイナー過ぎるってことなのかなー?Marvel に詳しい人教えて!w

スクリプト

Mechanize で Marvel の HP をクローリングした.スクリプトと実行結果のサンプルを載せておくよー.

--- Characters Count
Elasticsearch : 2825
Marvel : 1269

--- Common Characters Count
730

--- Uncommon Characters Count based Elasticsearch
2095

--- Common Characters Sampling
Unicorn
Blazing Skull
Warbird
Asylum
Diablo
Tana Nile
Iron Lad
Vision
Baron Strucker
Lockjaw

--- Uncommon Characters Sampling based Elasticsearch
Midgard Serpent
Theresa Cassidy
Scorcher
Riot Grrl
Lady Lark
Deathurge
Perun
Asp
Tempus
Diamond Lil