Radeon ZLUDA Stable Diffusion インストール手順書
お持ちのRadeon GPUでStable DiffusionをWindows 10/11環境で動かすための手順を以下にまとめました。2024年2月以降のZLUDA公開により、RadeonでのStable Diffusion利用が非常に簡単になっています。
1. 事前準備 (Nvidia GPUと共通)
Stable Diffusionをスムーズに動作させるための共通の準備です。
1-1. ストレージの確保
Stable Diffusion関連のファイルは、モデルファイルを含めると100GB以上のストレージを消費することがあります。事前に十分な空き容量を確保しておきましょう。Python関連のファイルも数十GBを占めることがあります。
1-2. SDXLモデルのダウンロード
A1111などのStable Diffusion Web UIは、インストール途中でモデルの有無を確認し、モデルがない場合は自動でダウンロードを試みます。しかし、これが原因でインストールに時間がかかったり、失敗したりすることがあります。インストールの前に、SDXLモデルを一つダウンロードしておくことを強く推奨します。
モデルのファイルサイズは通常7GB程度です。
おすすめのSDXLモデル (2025年1月時点):
- 昼向け: animagineXLV31_v31.safetensors (SHA256:
1449E5B0B9DE87B0F414C5F29CB11CE3B3DC61FA2B320E784C9441720BF7B766
) - 昼夜兼用: ebara_pony_2.1.safetensors (SHA256:
cc6db13c9135afbb75df7cfed4fa99208a510da7c3d2d8bf9634e5576e6f1532
)
これらのモデルはVAE内蔵なので、初めて使う方におすすめです。実写系モデルは、最初の生成で予期せぬ結果が出ることがあるため、最初は避けるのが無難です。
ダウンロード後のハッシュ値確認:
ダウンロードしたモデルファイルのSHA256などのハッシュ値が、配布元に記載されているものと一致するか必ず確認してください。これはファイルの破損だけでなく、セキュリティ上の問題を防ぐためにも重要です。
1-3. Pythonのインストール
Pythonは公式サイトからダウンロードしてください。Microsoft Store版は使用しないでください。
- Python公式サイトにアクセスします: https://www.python.org/
- Python 3.10.6の64bit版 (
python-3.10.6-amd64.exe
) をダウンロードします。最新バージョンではなく、指定されたバージョンを使用してください。 - インストーラーを実行します。
- インストールの際に、「Add Python 3.10 to PATH」のチェックボックスに必ずチェックを入れてください。
- インストール完了後、PCを再起動します。
インストール確認:
コマンドプロンプトを開き、以下のコマンドを入力します。
python -V
Python 3.10.6
と表示されれば成功です。エラーになる場合は、PATHへの追加を忘れているため、Pythonを再インストールしてください。
1-4. Gitのインストール
- Git公式サイトにアクセスします: https://git-scm.com/
- インストーラーをダウンロードし、実行します。
- インストールはデフォルト設定のまま進めてください。「Git from the command line and also from 3rd-party software」が選択されていることを確認してください。
インストール確認:
コマンドプロンプトを開き、以下のコマンドを入力します。
git -v
git version (バージョン番号)
と表示されれば成功です。
1-5. Visual C++ Runtimeのインストール
通常はPCにインストールされていますが、新品PCやOS再インストール直後の場合はインストールが必要です。
- Microsoftの公式サイトからダウンロードします: https://learn.microsoft.com/ja-jp/cpp/windows/latest-supported-vc-redist
- x86用 (
vc_redist.x86.exe
) と x64用 (vc_redist.x64.exe
) の両方をダウンロードし、インストールします。 - インストールはデフォルト設定のまま進めてください。
1-6. グラフィックドライバの更新
既に最新にしている場合はそのまま、それ以外の場合はRadeonのグラフィックドライバを更新します。
- Radeonの場合: 2023年30週以降のドライバ、特に2023年11月以降のバージョンに更新してください。
- 新しいドライバは公開から2週間程度は情報収集し、問題がないか確認してから適用することをおすすめします。稀に物理破損につながるような問題が発生することもあります。
2. AMDのAI用開発キット (HIP SDK) の導入 (AMD Radeon GPU限定)
Stable DiffusionをRadeon GPUで動作させるために必要なAI開発キットです。
- AMD Developerサイトにアクセスします: https://www.amd.com/en/developer/resources/rocm-hub/hip-sdk.html
- 以下のどちらかのバージョンのHIP SDKをダウンロードします。
- 5.7.1 HIP SDK:
AMD-Software-PRO-Edition-23.Q4-Win10-Win11-For-HIP.exe
- 6.2.4 HIP SDK:
AMD-Software-PRO-Edition-24.Q4-Win10-Win11-For-HIP.exe
- 5.7.1 HIP SDK:
- インストーラーを実行します。
- インストールの際、ディスプレイドライバーのチェックボックスは未チェックのまま進めてください。
- インストール完了後、PCを再起動します。
どちらを選ぶべきか:
- 新型GPU (gfx1151 / RDNA3.5 Strix Point Radeon 880M, 890M, Ryzen AI Max) の場合: 6.2.4を選択してください。
- その他の公式対応GPU (RX7000シリーズ、RX6950XT, RX6900XT, RX6800XT, RX6800):
- 速度の向上 (約2%) と安定性を重視するなら6.2.4。
- 旧型GPUやComfyUIでの追加作業を避けたいなら5.7.1も選択肢になります。
- 公式非対応GPU (gfx900, gfx906, gfx1010, gfx1032, gfx1031など): 通常は5.7.1一択です。追加ライブラリが必要になります (後述)。
HIP SDKの更新について:
既にHIP SDKがインストールされている場合は、Windowsの「アプリと機能」から既存のHIP SDKを完全にアンインストールしてから、新しいバージョンをインストールしてください。上書きインストールやアップグレードインストールはサポートされていません。
旧型・非公式対応GPUの場合の追加ライブラリ導入
公式対応GPU以外でStable Diffusionを動作させる場合、追加のライブラリが必要になります。
- 以下のGitHubリポジトリから、お使いのGPUとHIP SDKのバージョンに合ったライブラリをダウンロードします。
- HIP 5.7用: https://github.com/brknsoul/ROCmLibs
- RX6600:
Optimised_ROCmLibs_gfx1032.7z
- RX6700:
Optimised_ROCmLibs_gfx1031.7z
- その他 (旧型、APU内蔵GPUなど):
ROCmLibs.7z
- RX6600:
- HIP 6.2.x用: https://github.com/YellowRoseCx/koboldcpp-rocm/releases/tag/deps-v6.2.0
rocblasDec02.7z
(ライブラリ) と必要に応じてrocblas-6.2.0.dll.7z
(rocblas.dll)
- HIP 5.7用: https://github.com/brknsoul/ROCmLibs
- ダウンロードした圧縮ファイルを展開します。
- 展開したライブラリを以下のHIP SDKのライブラリフォルダにコピーします。
- HIP 5.7の場合:
C:\Program Files\AMD\ROCm\5.7\bin\rocblas\library
- HIP 6.2の場合:
C:\Program Files\AMD\ROCm\6.2\bin\rocblas\library
- HIP 5.7の場合:
- もしダウンロードしたファイルに
rocblas.dll
が含まれている場合は、以下の場所にもコピーして既存のファイルを置き換えます。- HIP 5.7の場合:
C:\Program Files\AMD\ROCm\5.7\bin\rocblas.dll
- HIP 6.2の場合:
C:\Program Files\AMD\ROCm\6.2\bin\rocblas.dll
- HIP 5.7の場合:
- gfx1201 (RX9070/XT) に限り、上記設定で動作しない場合は、
C:\Windows\System32
にあるamdhip64.dll
をC:\Program Files\AMD\ROCm\6.2\bin
にコピーしてください。 - ライブラリなどを入れ替えたら、PCを再起動します。
HIP SDKインストール確認:
コマンドプロンプトを開き、以下のコマンドを入力します。
"%HIP_PATH%bin\hipInfo.exe"
ダブルクォーテーションを含めて入力してください。
出力される情報の中で、以下の点を確認します。
Name:
の項目に「AMD Radeon RX (お使いのVGA名)
」と表示されていること。gcnArchName:
の項目に「gfx10xx
」のようなVGAのアーキテクチャ名が表示されていること。
もしName:
が「AMD Radeon(TM) Graphics
」と表示されている場合は、APU内蔵GPUが認識されています。この場合は、後述の「4. APU機にVGAを挿して使っている場合限定の追加設定」を参照してください。
3. A1111 ZLUDA対応Fork版のインストールと起動
いよいよStable Diffusion Web UI (A1111) のインストールと起動です。
3-1. A1111 ZLUDA Fork版の入手
- Stable Diffusion Web UIをインストールしたい場所に、新しいフォルダを作成します。例:
C:\A1111
。全角文字は使用しないでください。 - 作成したフォルダ内でコマンドプロンプトを開きます。
- 以下の
git clone
コマンドを実行し、A1111 ZLUDA Fork版をダウンロードします。
git clone https://github.com/lshqqytiger/stable-diffusion-webui-amdgpu.git .
3-2. SDXLモデルファイルの投入
ダウンロードしたA1111のフォルダ内にmodels
フォルダが作成され、その中にStable-diffusion
フォルダがあります。
models\Stable-diffusion
事前にダウンロードしておいたSDXLモデルファイルをこのフォルダにコピーしてください。
3-3. 起動用ファイル webui-user.bat の編集
ZLUDAを使用するための起動オプションを設定します。
- A1111のフォルダ内にある
webui-user.bat
ファイルをメモ帳などのテキストエディタで開きます。ダブルクリックして起動しないように注意してください。 - ファイル内の以下の行を見つけます。
set COMMANDLINE_ARGS=
- これを以下のように書き換えて、ZLUDAを使用するように設定します。
set COMMANDLINE_ARGS=--use-zluda
- 変更を保存します。
VRAMが少ないGPUの場合 (16GB未満のRX7700XT, RX7600XTなど):
VRAMが16GB未満のGPUを使用している場合は、VRAM不足を避けるために--medvram
オプションを追加します。
set COMMANDLINE_ARGS=--use-zluda --medvram
3-4. A1111初回起動
必ずSDXLモデルを投入してから起動してください。
webui-user.bat
をダブルクリックして起動します。- コマンドプロンプトが開かれ、様々な処理内容が表示されます。このコマンドプロンプトはWeb UIの本体なので、閉じないでください。
- 初回起動時には、各種ファイルのダウンロードが始まります(約3GB)。これには時間がかかります。
- しばらくするとWebブラウザでWeb UIが自動的に開きますが、この時点ではまだ初回起動処理中です。タスクマネージャーでCPUの負荷(シングルタスクにつきCPU1コア相当)が見えている間は処理が継続しています。
- 初回起動処理の進捗は、
C:\Users\(ユーザー名)\AppData\Local\ZLUDA\ComputeCache\zluda.db
ファイルのサイズで確認できます。ゼロから徐々に大きくなり、約45MBになると処理が完了し、CPU負荷がなくなります。 - コマンドプロンプトに「
calculate empty prompt(...)
」と表示されれば準備完了です。
3-5. 初回生成
初回起動処理が完了したら、すぐに生成を試します。
- Web UIで特に設定を変更せず、「Generate」ボタンをクリックします。
- 512×512サイズの画像生成が始まります。この時も、初回生成処理が開始され、
zluda.db
ファイルが再び肥大化し始めます。 - 約10分程度(zluda.dbが約90MBになるまで)待つと、コマンドプロンプトにプログレスバーが表示され、画像生成が開始されます。
初回起動と初回生成には時間がかかりますが、これは最初の1回だけです。次回以降はスムーズに開始されます。ただし、バージョンアップやGPUドライバの更新などがあった場合は、再度初回処理が行われることがあります。
補足:
- 初回起動および初回生成中は、コンソールに「
Compilation is in progress. Please wait...
」というメッセージが30秒ごとに表示されるようになりました。 - 2025年3月にTorchのバージョンが2.3.1から2.6.0に更新されたことで、各種パラメーターの最適値が変わりました。
- A1111の「Settings」タブ > 「Optimizations」 > 「Cross attention optimization」 にある8種類の選択肢を試してみてください。PCの構成によって最適な設定が異なりますが、生成速度やVRAM消費量に大きな差が出ることがあります。
- VRAMやメインメモリが少ないPCでメモリ不足になる場合は、「Settings」タブ > 「VAE」 > 「VAE type for decode (method to decode latent to image)」を「Full」から「TAESD」に変更することで、メモリ使用量を減らし、速度も向上させることができます。画質にわずかな影響が出る可能性があります。
3-6. V-Prediction v_predモデル対応
V-Prediction技術を用いたSDXLモデル (v_pred
モデル) を使用する場合の対応です。
- A1111本家の
dev
版のconfigs
フォルダにあるsd_xl_v.yaml
ファイルをダウンロードします。
https://github.com/AUTOMATIC1111/stable-diffusion-webui/tree/dev/configs
sd_xl_v.yaml
をクリックし、右上の下向き矢印マーク、または三点リーダーメニューからダウンロードします。 - ダウンロードした
sd_xl_v.yaml
ファイルを、V-Predictionモデルと同じフォルダにコピーし、モデルファイルと同じ名前にリネームします。
例: V-Predictionモデル名がfoo-v_pred.safetensors
であれば、sd_xl_v.yaml
をfoo-v_pred.yaml
にリネームします。
これにより、A1111でv_pred
モデルを使用できるようになります。A1111のdev
版ではこの作業は不要ですが、確実に認識させたい場合はこの方法がおすすめです。
さらに、モデルによってはA1111の設定で「Zero Terminal SNR」を有効にする必要があります。
- 「Settings」タブ > 「Sampler parameters」
- 「Noise schedule for sampling (for use with zero terminal SNR trained models)」 の設定を、「Default」から「Zero Terminal SNR」に変更します。
使用するv_pred
モデルごとに、DefaultとZero Terminal SNRを切り替えて出力画像を比較し、この設定が必要かどうかを確認してください。違いがなければDefaultのままで構いません。
3-7. A1111終了方法
コマンドプロンプトでA1111を終了させるには、以下の手順が正式な作法です。
- コマンドプロンプト内で
Ctrl + C
を押します。 n
と入力し、Enter
キーを押します。
強制終了について:
コマンドプロンプトのウィンドウを直接閉じても強制終了は可能で、通常は大きな問題は起きません。ただし、強制終了すると生成中に作成された一時ファイルが残る場合があります。
一時ファイルの場所は以下の通りです。
C:\Users\(ユーザー名)\AppData\Local\Temp\gradio
A1111のバージョンによって一時ファイルの削除タイミングが異なるため、残った一時ファイルが気になる場合は、Web UIを起動して何も生成せずに終了させるか、一括削除用の.bat
ファイルを作成しておくと便利です。
A1111の「Settings」タブ > 「Saving images」 > 「Saving images/grids」の以下の項目も確認しておくと良いでしょう。
Directory for temporary images; leave empty for default
Cleanup non-default temporary directory when starting webui
4. APU機にVGAを挿して使っている場合限定の追加設定
PCにAPU (CPU内蔵GPU) と別途Radeon GPUの両方が搭載されている場合、AI用途で内蔵GPUが優先されてしまうことがあります。これを回避するには以下の2つの方法があります。
4-a. APUの内蔵GPUを無効化する
PCのBIOS設定で、APU内蔵GPUを無効化します。これにより、OSは内蔵GPUを認識しなくなり、外部Radeon GPUが優先されます。
4-b. OSの環境変数でVGAを指定する
APU内蔵GPUも通常使用しつつ、AI関連の処理のみ外部Radeon GPUを使用するように設定します。
- Windows 10/11の「設定」を開きます。
- 「システム」 > 「詳細情報」 > 「システムの詳細設定」 をクリックします。
- 「システムのプロパティ」ウィンドウが開いたら、「詳細設定」タブ内にある「環境変数」 をクリックします。
- 「環境変数」ウィンドウが開いたら、「ユーザー環境変数」 の枠内にある「新規」 をクリックします。
- 「新しいユーザー変数」ウィンドウで、以下のように入力し、「OK」をクリックします。
- 変数名:
HIP_VISIBLE_DEVICES
- 変数値:
1
- 変数名:
- すべてのウィンドウを「OK」で閉じ、PCを再起動します。
上記設定後もAPU内蔵GPUが使われてしまう場合は、変数値「1」ではなく「0」や「2」など、別の数値を試してPCを再起動してください。最適な数値はPCの構成によって異なります。
設定確認:
コマンドプロンプトを開き、以下のコマンドを入力します。
"%HIP_PATH%bin\hipInfo.exe"
出力される情報の中で、Name:
の項目に「AMD Radeon RX (お使いのVGA名)
」と表示されていれば成功です。もし「AMD Radeon(TM) Graphics
」と表示されている場合は、まだAPU内蔵GPUが認識されています。
5. トラブルシューティング
5-1. A1111やForgeのインストールがうまくいかないとき
A1111などのWeb UIは多くの外部モジュールに依存しており、それらの仕様変更によって一時的に動作しなくなることがあります。これは珍しいことではありません。
- 数日待つ: 作者側が対応してくれるまで待つのが最も簡単な解決策です。
- 古いバージョンを試す: 問題が発生している外部モジュールの古いバージョンを明示的に指定することで解決する場合があります。GitHubの
discussions
やIssues
を確認し、同様の問題が報告されていないか調べてみましょう。 - 再試行: 初回インストール時には、
webui-user.bat
の実行中にエラーで停止することがよくあります。しかし、すぐに再実行するとすんなり起動することがあります。
5-2. 画像生成はできたがGPU負荷がゼロに見える
WindowsのタスクマネージャーのGPU負荷表示は、通常「3D」処理の負荷を示しています。ゲームではこれで問題ありませんが、Stable DiffusionのZLUDAを使った生成は3D処理ではないため、タスクマネージャーの「3D」の負荷はゼロに見えてしまいます。
ZLUDAでのGPU負荷を確認するには、タスクマネージャーのGPUの表示グラフのうち、いずれかをプルダウンして「Compute」に変更してください。「Compute 0」や「Compute 1」など複数ある場合は、一つずつ試して負荷が表示されるものを見つけてください。
生成中にComputeの負荷が99%前後で安定していれば正常です。もし負荷グラフが大きく波打っている場合は、VRAM不足によるメモリスワップが発生している可能性があります。
5-3. 画像生成時間が長すぎる
生成時間が異常に長い場合は、GPUではなくCPUで生成されている可能性があります。これは、古い情報や誤った設定が混在している場合に起こりやすいです。
生成速度の目安:
GPUの単精度浮動小数点演算性能 (TFLOPS) やFP16値に連動します。特にSDXLの場合はFP16値が重要です。
Radeon | VRAM | TFLOPS(=FP32) | FP16(換算値) | FP8 | 備考 |
---|---|---|---|---|---|
RX 9070XT | 16GB | 48.7 | 194.8 | 389.6 | RDNA4機 |
RX 9070 | 16GB | 36.1 | 144.4 | 288.8 | RDNA4機 |
RX 7900XTX | 24GB | 61 | (122) | ||
RX 7900XT | 20GB | 52 | (104) | ||
RX 7900GRE | 16GB | 46 | (92) | ||
RX 7800XT | 16GB | 37 | (74) | ||
RX 7600XT | 16GB | 22.57 | (45.14) | ||
RX 6950XT | 16GB | 23.65 | (47.30) | ||
RX 6900XT | 16GB | 23.04 | (46.08) | ||
RX 6800XT | 16GB | 20.74 | (41.48) | ||
RX 6800 | 16GB | 16.17 | (32.34) | ||
(W6800) | 32GB | 19.25 | (38.50) | VRAM32GB最安VGA |
VRAM