t_wの輪郭

Google

BERT

2023/6/14 12:05:00
ModernBERTSentence EmbeddingはBERTよりGloVeの方が良いあれあれあれあれHuBERT2023年11月14日日記あれあれ日本語BERTALBERTあれ『BERTの埋め込み空間の可視化を最速で』『BERTのMasked Language Modelを利用して文の校正を行う』

あれ

2023/12/2 23:59:00

LambdaでBERTを動かせるようになったんだけども、この知識を200万円ぐらいで売りたい。

誰か買ってくんねーかなぁ……
AI構築を外注すると考えると、安いほうですわよ。

ちなみにAI構築を外注すると、1回の試行で数百万円かかった上でだいたい失敗するらしいぞ♥

あれ

2023/12/2 15:24:00

500MBあるBERTをONNXに変換した後に量子化したら110MBほどになってLambdaで動かせるようになった。
Githubに乗せるファイルは100MB以下でないとだめなので、ダメ押しでgzipで圧縮したら75MBになった。

あれ

2023/12/2 14:21:00

knownetの検索をBedrockからBERTに移行した。
検索精度の変化は定量的な比較をしてないので謎。体感的には変わらん気がする。