Sign in
총 4개의 게시물이 있습니다.
2026-03-10
DGX Spark 환경에서 모델 추론 속도 및 GPU 메모리 사용량 개선을 위해 FlashAttention 2를 설치한 후기입니다. 설치 과정의 어려움과 설치 후 체감 효과를 공유합니다.
2026-03-03
DGX Spark ARM64 환경에서 Ditto TalkingHead 프로젝트를 TensorRT로 포팅하는 과정을 상세히 기록했습니다. x86용 GridSample3D 플러그인 로드 실패 원인 분석, ARM64용 플러그인 재빌드 방법, CMake 설정 수정, ONNX→TensorRT 변환 성공 및 추론까지의 전체 절차를 단계별로 설명해 AI 개발자와 엔지니어에게 유용한 실전 트러블슈팅 정보를 제공합니다.
2025-11-26
이 포스트에서는 GGUF 모델을 넘어 DGX Spark를 활용한 로컬 AI 연구의 새로운 지평을 탐구합니다. 최신 Flux 모델과 로컬 환경 구축 방법, 성능 비교, 실전 활용 사례를 소개합니다.
2025-11-19
DGX Spark ARM 기반에서 FLUX 1-dev 12B 모델을 LoRA 파인튜닝한 실전 경험을 공유합니다. 1000 Step, 100 Epoch 학습 과정, OOM 이슈, 전력 효율, CPU 병목 등 상세 분석과 향후 개선 방안을 담았습니다.