MIKI BLOG

Todos los artículos

There are a total of 1 posts.

2026-03-10

Mi Experiencia Instalando FlashAttention 2 para Inferencia de Modelos en DGX Spark

Comparto mi experiencia instalando FlashAttention 2 en un entorno DGX Spark, buscando mejorar la velocidad de inferencia del modelo y optimizar el uso de la memoria GPU. Detallo los desafíos del proceso de instalación, incluyendo la compilación desde el código fuente, y los resultados obtenidos en términos de rendimiento y consumo de recursos.

#cuda #gpu #dgx spark #flashattention 2 +2