eskip: improve lexer performance 2 #2870

AlexanderYastrebov · 2024-01-16T21:34:26Z

use plain ascii instead of unicode package
use loop for scanSymbol
call scan functions directly instead of selectScanner to aid inlining

goos: linux
goarch: amd64
pkg: github.com/zalando/skipper/eskip
                  │    HEAD~1    │                HEAD                 │
                  │    sec/op    │   sec/op     vs base                │
ParsePredicates-8   9.637µ ± 11%   8.894µ ± 4%   -7.71% (p=0.001 n=10)
Parse-8             329.1m ±  4%   272.7m ± 2%  -17.15% (p=0.000 n=10)
geomean             1.781m         1.557m       -12.56%

                  │    HEAD~1    │                HEAD                 │
                  │     B/op     │     B/op      vs base               │
ParsePredicates-8   2.008Ki ± 0%   2.008Ki ± 0%       ~ (p=1.000 n=10)
Parse-8             49.94Mi ± 0%   49.94Mi ± 0%       ~ (p=0.926 n=10)
geomean             320.4Ki        320.4Ki       -0.00%

                  │   HEAD~1    │                 HEAD                 │
                  │  allocs/op  │  allocs/op   vs base                 │
ParsePredicates-8    33.00 ± 0%    33.00 ± 0%       ~ (p=1.000 n=10) ¹
Parse-8             1.100M ± 0%   1.100M ± 0%       ~ (p=0.367 n=10)
geomean             6.025k        6.025k       +0.00%
¹ all samples are equal

See previous #2755

Add a benchmark for parsing 10000 routes. Signed-off-by: Alexander Yastrebov <[email protected]>

AlexanderYastrebov · 2024-01-16T21:39:09Z

eskip/lexer.go

 func scanSymbol(code string) (t token, rest string, err error) {
 	t.id = symbol
-	t.val, rest = scanWhile(code, isSymbolChar)
+	for i := 0; i < len(code); i++ {
+		if !isSymbolChar(code[i]) {
+			t.val, rest = code[0:i], code[i:]
+			return
+		}
+	}
+	t.val, rest = code, ""
 	return
 }


Before scanSymbol had awful performance - slower than scanning escaped string:

After

* use plain ascii instead of unicode package * use loop for scanSymbol * call scan functions directly instead of selectScanner to aid inlining ``` goos: linux goarch: amd64 pkg: github.com/zalando/skipper/eskip │ HEAD~1 │ HEAD │ │ sec/op │ sec/op vs base │ ParsePredicates-8 9.637µ ± 11% 8.894µ ± 4% -7.71% (p=0.001 n=10) Parse-8 329.1m ± 4% 272.7m ± 2% -17.15% (p=0.000 n=10) geomean 1.781m 1.557m -12.56% │ HEAD~1 │ HEAD │ │ B/op │ B/op vs base │ ParsePredicates-8 2.008Ki ± 0% 2.008Ki ± 0% ~ (p=1.000 n=10) Parse-8 49.94Mi ± 0% 49.94Mi ± 0% ~ (p=0.926 n=10) geomean 320.4Ki 320.4Ki -0.00% │ HEAD~1 │ HEAD │ │ allocs/op │ allocs/op vs base │ ParsePredicates-8 33.00 ± 0% 33.00 ± 0% ~ (p=1.000 n=10) ¹ Parse-8 1.100M ± 0% 1.100M ± 0% ~ (p=0.367 n=10) geomean 6.025k 6.025k +0.00% ¹ all samples are equal ``` See previous #2755 Signed-off-by: Alexander Yastrebov <[email protected]>

AlexanderYastrebov · 2024-01-17T10:14:16Z

eskip/lexer.go

-func isAlpha(c byte) bool       { return unicode.IsLetter(rune(c)) }
-func isDigit(c byte) bool       { return unicode.IsDigit(rune(c)) }


This is equivalent but inlines better since c is byte and unicode.* does internal check for ascii

AlexanderYastrebov · 2024-01-17T10:15:09Z

eskip/lexer.go

-func isSymbolChar(c byte) bool  { return isUnderscore(c) || isAlpha(c) || isDigit(c) }
+func isAlpha(c byte) bool       { return (c >= 'a' && c <= 'z') || (c >= 'A' && c <= 'Z') }
+func isDigit(c byte) bool       { return c >= '0' && c <= '9' }
+func isSymbolChar(c byte) bool  { return isAlpha(c) || isDigit(c) || isUnderscore(c) }


Check more frequent class first

szuecs · 2024-01-17T14:09:58Z

👍

AlexanderYastrebov · 2024-01-17T14:23:34Z

👍

eskip: add BenchmarkParse

9270779

Add a benchmark for parsing 10000 routes. Signed-off-by: Alexander Yastrebov <[email protected]>

AlexanderYastrebov added the major moderate risk, for example new API, small filter changes that have no risk like refactoring or logs label Jan 16, 2024

AlexanderYastrebov commented Jan 16, 2024

View reviewed changes

AlexanderYastrebov changed the title ~~eskip: optimize lexer (2)~~ eskip: improve lexer performance 2 Jan 16, 2024

AlexanderYastrebov marked this pull request as draft January 16, 2024 21:42

AlexanderYastrebov force-pushed the eskip/optimize-lexer-5 branch from b039073 to 9a52f75 Compare January 16, 2024 21:58

AlexanderYastrebov marked this pull request as ready for review January 16, 2024 22:03

AlexanderYastrebov commented Jan 17, 2024

View reviewed changes

AlexanderYastrebov merged commit 200e590 into master Jan 17, 2024
14 checks passed

AlexanderYastrebov deleted the eskip/optimize-lexer-5 branch January 17, 2024 14:23

AlexanderYastrebov mentioned this pull request Feb 9, 2024

Optimise sanitize with string builder #2918

Closed

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

eskip: improve lexer performance 2 #2870

eskip: improve lexer performance 2 #2870

AlexanderYastrebov commented Jan 16, 2024

AlexanderYastrebov Jan 16, 2024 •

edited

Loading

AlexanderYastrebov Jan 17, 2024

AlexanderYastrebov Jan 17, 2024

szuecs commented Jan 17, 2024

AlexanderYastrebov commented Jan 17, 2024

		func isAlpha(c byte) bool { return unicode.IsLetter(rune(c)) }
		func isDigit(c byte) bool { return unicode.IsDigit(rune(c)) }

eskip: improve lexer performance 2 #2870

eskip: improve lexer performance 2 #2870

Conversation

AlexanderYastrebov commented Jan 16, 2024

AlexanderYastrebov Jan 16, 2024 • edited Loading

Choose a reason for hiding this comment

AlexanderYastrebov Jan 17, 2024

Choose a reason for hiding this comment

AlexanderYastrebov Jan 17, 2024

Choose a reason for hiding this comment

szuecs commented Jan 17, 2024

AlexanderYastrebov commented Jan 17, 2024

AlexanderYastrebov Jan 16, 2024 •

edited

Loading