Releases · Dao-AILab/flash-attention

04 Sep 06:46

v2.1.2.post3

4976650

v2.1.2.post3

Set single threaded compilation for CUDA 12.2 so CI doesn't OOM

Assets 96

04 Sep 06:00

github-actions

v2.1.2.post2

6a89b2f

v2.1.2.post2

Remove constexpr in launch template to fix CI compilation

Assets 2

04 Sep 05:46

github-actions

v2.1.2.post1

97ba7a6

v2.1.2.post1

Try switching back to Cutlass 3.2.0

Assets 2

04 Sep 05:29

github-actions

v2.1.2

1dc1b6c

v2.1.2

Bump to v2.1.2

Assets 2

28 Aug 07:39

github-actions

v2.1.1

757058d

v2.1.1

Update Cutlass to v3.2.0

Assets 88

25 Aug 06:43

github-actions

v2.1.0

9e5e8bc

v2.1.0

Change causal mask to be aligned to bottom-right instead of top-left

Assets 88

22 Aug 07:21

github-actions

v2.0.9

6711b3b

v2.0.9

Bump version to 2.0.9

Assets 88

16 Aug 22:13

github-actions

v2.0.8

2286d7c

v2.0.8

Bump to v2.0.8

Assets 88

14 Aug 21:56

github-actions

v2.0.7

c60851a

v2.0.7

Bump to v2.0.7

Assets 74

14 Aug 17:28

github-actions

v2.0.6.post2

f8dccfc

v2.0.6.post2

[CI] Fix MATRIX_CUDA_VERSION check

Assets 74

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Releases: Dao-AILab/flash-attention

v2.1.2.post3

v2.1.2.post2

v2.1.2.post1

v2.1.2

v2.1.1

v2.1.0

v2.0.9

v2.0.8

v2.0.7

v2.0.6.post2