t_wの輪郭

機械学習Finetuningfine tuning
『[2501.05707] Multiagent Finetuning: Self Improvement with Diverse Reasoning Chains』『Fine-tuning a pretrained model』『Examples — transformers 2.2.2 documentation』あれあれSFTQLoRALLMの1回のファインチューニングは50円でできることがあるあれ『LLMのファインチューニングを他手法との違いから理解する(Part 1)』『Fine-tune Llama 2 with DPO』『自分の過去ツイートでrinna/japanese-gpt-neox-3.6bをfinetuningして「俺tter」を生成する』ナレッジグラフのファインチューニング

あれ

2024/4/22 9:54:00

llama.cppでfinetuningためしとるけども、全然うまくいってないな。

素直にTransformers使うべきなんか。
でもなーPythonやだしなー。

SFT

2024/4/21 12:48:00

Supervised Fine-tuning