t_wの輪郭

あれ

ONNX

2021/9/8 3:30:00
ONNX Runtime GenAIONNX Runtimesherpa-onnx-node『[Rust] ortでonnxモデルを使って推論したりWASMにしたりしてみる | DevelopersIO』あれあれonnxruntimeonnxruntime-nodeでgzipで圧縮したonnxファイルを読み込むonnxに変換して量子化するコマンドtransformers.onnxあれあれnetronmrsekut-p『ONNX』「ONNXはOpen Neural Network Exchangeの略称で、推論で広く使用されている機械学習モデルのフォーマットです。」Open Neural Network ExchangeONNX Runtime Web

あれ

2023/12/2 15:24:00

500MBあるBERTをONNXに変換した後に量子化したら110MBほどになってLambdaで動かせるようになった。
Githubに乗せるファイルは100MB以下でないとだめなので、ダメ押しでgzipで圧縮したら75MBになった。