Optimization CPU #145

newaaz · 2024-05-05T23:22:54Z

No description provided.

spajic · 2024-05-09T21:03:26Z

.gitignore

@@ -0,0 +1,9 @@
+data_large.txt


spajic · 2024-05-09T21:04:44Z

case-study.md

+
+1. Подготовил тест для защиты метрики от деградации. В нём проверяется время выполнения программы, ips и асимптотика *(performance_spec.rb)*
+2. Подготовил проверку производительности программы, в которой вычисляется время выполнения программы с (1, 2, 4, 8, 16) * 1000 строк, и проверяется ips на 8 * 1000 строк. В ходе оптимизации программы эти коэффициенты будут увеличиваться *(benchmark.rb)*.
+3. Подготовил файлы для профилирования:


👍 лайк за создание удобства для себя

spajic · 2024-05-09T21:04:55Z

case-study.md

+  - stackprof.rb - генеруирует отчёты для командной строки и JSON для speedscope
+  - work-method.rb - копия оптимизируемой программы, но с отключённым GC и возможностью в виде аргумента задавать файл с разными количествами строк
+
+Благодаря такой подготовке я могу быстро проверять гипотезы при профилировании и тестировать полученные результаты в ходе реального выполнения программы.


spajic · 2024-05-09T21:05:40Z

case-study.md

+    ≈ 11.616 × 21852     
+    ≈ 253839.792  секунд
+
+Это примерно 253839.792 / 3600 ≈ 70.51 часов.


spajic · 2024-05-09T21:06:26Z

case-study.md

+- Все профилировщики показывают самое проблемной место - Array#select (**67%**) в котором для каждого пользователя перебирается весь массив сессий, что приводит к асимптотической сложности сложности порядка O(n*m), где n - число пользователей, а m - число сессий.
+- Чтобы улучшить производительность создал вспомогательную хэш-таблицу в которой сгруппировал сессии по *user_id*
+- Получил значительный прирост в скорости: на 16 000 строках было 7,3сек, стало 0,7сек.
+- Данный метод перестал являться точкой роста.


и тут асимптотика становится лучше, и можно переприкинуть расчёты

spajic · 2024-05-09T21:07:22Z

case-study.md

+### Ваша находка №2
+- Ruby-prof: flat, graph, callstack показали следующую точку роста - сложение массивов - Array#+ (**33%**). Это занимает много времени т.к. каждый раз инициализируется новый массив. Сложение вызывается в 3-х местах.
+- Использую **map** для обработки users_objects
+- 16 000 строк - было 0,7сек, стало 0,5 сек.


Хорошо подбирать объём данных так, чтобы программа успевала покрутиться пару секунд. Если она завершается слишком быстро (“не успевает поработать”) могут возникнуть какие-то перекосы (например, на полном объёме основная часть времени тратится в основном цикле, а если данных мало - то большая часть уходит на инициализацию и финализацию, например на чтение из файла и запись потом в файл)

И плюс когда время уже на миллисекунды - больше влияние погрешностей.

spajic · 2024-05-09T21:09:06Z

case-study.md

+В результате проделанной оптимизации наконец удалось обработать файл с данными.
+Удалось улучшить метрику системы с 70.51 часов (ориентировочно) до 32 секунд и практически уложиться в заданный бюджет.
+
+Самое главное - сумел организовать рабочий процесс по оптимизации программы с помощью фреймворка оптимизации. Разобрался как формировать и фиксировать метрики, быстро проверять гипотезы и выстраивать эффективный feedback-loop! 


spajic · 2024-05-09T21:09:18Z

case-study.md

+Самое главное - сумел организовать рабочий процесс по оптимизации программы с помощью фреймворка оптимизации. Разобрался как формировать и фиксировать метрики, быстро проверять гипотезы и выстраивать эффективный feedback-loop! 
+
+## Защита от регрессии производительности
+Для защиты от потери достигнутого прогресса при дальнейших изменениях программы gодготовил тест *(performance_spec.rb)* для защиты метрики от деградации. В нём проверяется время выполнения программы, ips и асимптотика.


spajic · 2024-05-09T21:10:05Z

task-1.rb

    report['usersStats'][user_key] ||= {}
    report['usersStats'][user_key] = report['usersStats'][user_key].merge(block.call(user))
  end
 end

 def work
+  progressbar = ProgressBar.create(


надо иметь в виду что прогресс-бар может тормозить, особенно если постоянно его дёргать

spajic · 2024-05-09T21:10:25Z

task-1.rb

-    uniqueBrowsers += [browser] if uniqueBrowsers.all? { |b| b != browser }
-  end
-
+  uniqueBrowsers = sessions.map { |s| s['browser'] }.uniq


я бы их в Set просто напихивал

spajic

Всё очень чётко сделано, аккуратно, было приятно читать, респект 👍

Sergey Kochubey added 11 commits May 5, 2024 10:40

Array#select optimized

a72369b

Array#+ optimized 1 of 3

a97b84e

Array#all? optimized 1/2

b41d731

Date#parse optimized

ad86b53

tests, benchmark, profiling added

5d7e652

split optimized

583c90d

total_time, longest_session, browsers - refactored

f8e4e7b

collect_stats_from_users optimized

6de2bc0

String+ optimized

5b0a89c

optimization complete

d90a477

progressbar added

63117d8

spajic reviewed May 9, 2024

View reviewed changes

.gitignore

@@ -0,0 +1,9 @@

data_large.txt

Copy link

Collaborator

spajic May 9, 2024

Choose a reason for hiding this comment

The reason will be displayed to describe this comment to others. Learn more.

👍

spajic reviewed May 9, 2024

View reviewed changes

spajic approved these changes May 9, 2024

View reviewed changes

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Uh oh!

Optimization CPU #145

Optimization CPU #145

Uh oh!

newaaz commented May 5, 2024

Uh oh!

spajic May 9, 2024

Uh oh!

spajic May 9, 2024

Uh oh!

spajic May 9, 2024

Uh oh!

spajic May 9, 2024

Uh oh!

spajic May 9, 2024

Uh oh!

spajic May 9, 2024

Uh oh!

spajic May 9, 2024

Uh oh!

spajic May 9, 2024

Uh oh!

spajic May 9, 2024

Uh oh!

spajic May 9, 2024

Uh oh!

spajic left a comment

Uh oh!

Uh oh!

Optimization CPU #145

Are you sure you want to change the base?

Optimization CPU #145

Uh oh!

Conversation

newaaz commented May 5, 2024

Uh oh!

Choose a reason for hiding this comment

Uh oh!

Choose a reason for hiding this comment

Uh oh!

Choose a reason for hiding this comment

Uh oh!

Choose a reason for hiding this comment

Uh oh!

Choose a reason for hiding this comment

Uh oh!

Choose a reason for hiding this comment

Uh oh!

Choose a reason for hiding this comment

Uh oh!

Choose a reason for hiding this comment

Uh oh!

Choose a reason for hiding this comment

Uh oh!

Choose a reason for hiding this comment

Uh oh!

spajic left a comment

Choose a reason for hiding this comment

Uh oh!

Uh oh!