t_wの輪郭

クローラCrawler
RSL Collective『AIクローラーを制御する「RSL Collective」はどこまで実効力を持つか?マスメディアや大...『Xユーザーの辻正浩 | Masahiro Tsujiさん: 「「最大手検索エンジン以外はサーバ負荷からまともにクロールさせてもらえない問題」の対応のため、Microsoft Bingはサイト管理者からコンテンツを送りクロールを削減するBing Content Submission APIや他社と連携したIndexNowの仕組みなどで試行錯誤した。 一方BraveはGoogleを名乗ってクロールした」 / X』人力クローラー『Peta-Byte Scale Web Crawler · Success Stories』go.jpをクロールするスクリプトページメタ情報の容量野良クローラの推定容量デライト起点のクローラーあれデライトクローラー2023年11月9日日記あれbingbotSemrushBotあれデライト外部検索通類をデプロイしたあれクロールを途中から再開できるようにしたデライトクローラ

https://x.com/tsuj/status/1816683754368434632

=15.718837606837608[KB]
=0.015350427350427352[MB]
=8.98 / 585 [MB]
 
関連するURLのリストを持つと、やはり容量が大きくなる
数だけ持つべきかもしれない
 
ページランクを無視するならURLは残さなくてもいい