Sign in
投稿は全部で4件あります。
2026-03-10
DGX Spark環境でモデル推論速度とGPUメモリ使用量の改善を目指し、FlashAttention 2をインストールした際の体験記です。wheelインストールが失敗し、ソースビルドでの導入となった経緯や、その際のCPU負荷、そしてインストール後に期待したほどの速度・メモリ改善が体感できなかった率直なレビューを共有します。今後の導入を検討されている方の参考になれば幸いです。
2026-03-03
DGX Spark の ARM64 環境で Ditto TalkingHead を TensorRT に移植する手順を詳細に解説。x86 用 GridSample3D プラグインのロード失敗から、ARM64 用プラグインの再ビルド、CMake 設定の修正、ONNX→TensorRT 変換と推論成功まで、実践的なトラブルシューティング情報を提供します。
2025-11-26
このポストでは、GGUFモデルを超えDGX Sparkを活用したローカルAI研究の新しい地平を探求します。最新のFluxモデルとローカル環境構築方法、性能比較、実際の活用事例を紹介します。
2025-11-19
DGX Spark ARMベースでFLUX 1-dev 12BモデルをLoRAファインチューニングした実践経験を共有します。1000ステップ、100エポックの学習過程、OOM問題、電力効率、CPUボトルネックなどの詳細分析と今後の改善案を含んでいます。