t_wの輪郭

強化学習レコメンド
あれあれあれExploration & Exploitation

あれ

2025/12/28 6:39:00

遺伝的アルゴリズムでは一世代の個体数(多様性)を減らすと学習が早くなる。

逆が成り立つ?プラットフォーム内でのやり取りが高速化すれば、流通する情報の多様性が減少する?

プラットフォーム内でのやり取りが高速化を実現する形態としては、コミュニケーションの流路の数の増大が考えられる。
Xで考えれば、プラットフォーム全体のフォローの数が増えれば、情報の伝達は高速化される。

あれ

2021/3/2 16:04:00

推薦が無視されたときに、負の報酬を与えると探索的になる。

あれ

2021/3/2 15:46:00

強化学習においては学習が進むにつれて探索優先から活用優先に変わっていくのが定石とされている。しかし、レコメンドシステムにおいては活用優先から探索優先に変わっていくのがいいかもしれない。利用者の飽きを防止できる。