Releases · Dao-AILab/flash-attention

14 Aug 17:04

v2.0.6.post1

9c531bd

v2.0.6.post1

Use single thread compilation for cuda12.1, torch2.1 to avoid OOM CI

Assets 2

13 Aug 23:53

github-actions

v2.0.6

67ae6fd

v2.0.6

Bump to v2.0.6

Assets 68

17 Jul 10:19

github-actions

v1.0.9

6d48e14

v1.0.9

Bump to v1.0.9

Assets 2

03 Jul 00:11

github-actions

v1.0.8

9610114

v1.0.8

Bump to v1.0.8

Assets 2

30 May 21:22

github-actions

v1.0.7

85b51d6

v1.0.7

Bump version to 1.0.7

Assets 2

27 May 02:55

github-actions

v1.0.6

7c766b1

v1.0.6

Merge pull request #243 from ksivaman/bump_version_to_v1_0_6

bump to v1.0.6

Assets 2

12 May 21:24

github-actions

v1.0.5

eff9fe6

v1.0.5

Add ninja to pyproject.toml build-system, bump to v1.0.5

Assets 2

26 Apr 16:21

github-actions

v1.0.4

ad11394

v1.0.4

[Docs] Clearer error message for bwd d > 64, bump to v1.0.4

Assets 2

21 Apr 20:38

github-actions

v1.0.3.post0

fbbb107

v1.0.3.post0

Bump version to v1.0.3.post0

Assets 2

21 Apr 19:05

github-actions

v1.0.3

67ef5d2

v1.0.3

Bump version to 1.0.3

Assets 2

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Releases: Dao-AILab/flash-attention

v2.0.6.post1

v2.0.6

v1.0.9

v1.0.8

v1.0.7

v1.0.6

v1.0.5

v1.0.4

v1.0.3.post0

v1.0.3