Sign in
There are a total of 1 posts.
2026-03-10
DGX Spark 환경에서 모델 추론 속도 및 GPU 메모리 사용량 개선을 위해 FlashAttention 2를 설치한 후기입니다. 설치 과정의 어려움과 설치 후 체감 효과를 공유합니다.