Sign in
投稿は全部で1件あります。
2026-03-10
DGX Spark環境でモデル推論速度とGPUメモリ使用量の改善を目指し、FlashAttention 2をインストールした際の体験記です。wheelインストールが失敗し、ソースビルドでの導入となった経緯や、その際のCPU負荷、そしてインストール後に期待したほどの速度・メモリ改善が体感できなかった率直なレビューを共有します。今後の導入を検討されている方の参考になれば幸いです。