エントリーの編集は全ユーザーに共通の機能です。
必ずガイドラインを一読の上ご利用ください。
ここにツイート内容が記載されます https://b.hatena.ne.jp/URLはspanで囲んでください
Twitterで共有ONにすると、次回以降このダイアログを飛ばしてTwitterに遷移します
注目コメント算出アルゴリズムの一部にLINEヤフー株式会社の「建設的コメント順位付けモデルAPI」を使用しています
はじめに Unslothはより高速なLLMファインチューニングのための軽量ライブラリです。 Unslothを使う理由... はじめに Unslothはより高速なLLMファインチューニングのための軽量ライブラリです。 Unslothを使う理由としては単に高速なだけでなく、Llama3公式推奨のFine-tuningフレームワークより低いスペックのマシンでも動作するところが良いからです。 この記事では、Unslothを使ってLlama3をFine-tuningする方法について説明します。 開発環境 WSL2 (Ubuntu 24.04) Anaconda CUDA 12.5 本記事で使うソースコード及びデータセットは、GitHub上で公開しています。 前準備 まずは環境構築です。正直ここが一番苦労でした。 自分でなんとかライブラリーをインストールしたりしないで、Anacondaを使って環境構築することをおすすめします。 CUDAのインストール sudo apt-key del 7fa2af80 wget https