t_wの輪郭

情報デライトでクローラーを回すデライトの生HTMLファイル容量全輪郭の表題推定容量メタページのメタ情報だけを保存
ページメタ情報の容量野良クローラの推定容量入門自作検索エンジン桁数を一個減らしたいクローラで得られるページ数ページのメタ情報だけを保存

=15.718837606837608[KB]
=0.015350427350427352[MB]
=8.98 / 585 [MB]
 
関連するURLのリストを持つと、やはり容量が大きくなる
数だけ持つべきかもしれない
 
ページランクを無視するならURLは残さなくてもいい