Оптимизация первого задания #146

KingeKod · 2024-05-21T08:14:04Z

No description provided.

spajic

👍

spajic · 2024-05-26T21:54:34Z

case-study.md

+Я решил исправить эту проблему, оптимизировав эту программу.
+
+## Формирование метрики
+Для того, чтобы понимать, дают ли мои изменения положительный эффект на быстродействие программы я придумал использовать такую линейную метрику, чтобы программа отрабатывала за линейное время выполнения в зависимости от размера входных данных.


Это не "метрика", это асимптотика. Метрика == число, вроде кол-во секунд или кол-во мегабайт, или кол-во IPS, ...

spajic · 2024-05-26T21:54:50Z

case-study.md

+Программа поставлялась с тестом. Выполнение этого теста в фидбек-лупе позволяет не допустить изменения логики программы при оптимизации.
+
+## Feedback-Loop
+Для того, чтобы иметь возможность быстро проверять гипотезы я выстроил эффективный `feedback-loop`, который позволил мне получать обратную связь по эффективности сделанных изменений за 0.84551 сек.


spajic · 2024-05-26T21:56:02Z

case-study.md

+- expected block to perform linear, but performed exponential
+- expected block to perform linear, but performed logarithmic
+- expected block to perform linear, but performed power
+Любые, но не линейная


)) но кстати logarithmic - это лучше чем линейная

spajic · 2024-05-26T21:57:31Z

case-study.md

+### Находка №2
+- Опять же с помощью Flat увидел, что следующей точкой роста стал метод all?, котоый использовался при вычислении уникальных браузеров, вложенная цикличность
+- Заменил эту вложенную цикличность each + all? на одиночный проход map и выборкой всех уникальных значений
+- Для 10000 строк стало отрабатывать за 0.001084 сек. - было 0.196914 сек. -> в 180 раз? Вышел сильный прирост для небольшого объема данных


при профилировании лучше давать программе поработать пару секунд хотя бы, чтобы уменьшить влияние погрешностей и дать покрутиться в основном цикле (если он есть)

spajic · 2024-05-26T21:57:44Z

case-study.md

+- Для 10000 строк стало отрабатывать за 0.001084 сек. - было 0.196914 сек. -> в 180 раз? Вышел сильный прирост для небольшого объема данных
+- Отчет профилировщика изменился, исправленная проблема перестала быть главной точкой роста
+
+Так как для 10000 отрабатывает теперь очень быстро, изменил и увеличил Feedback-Loop, теперь стало отрабатывать для 100000 строк за 4.852382 сек, остановился на этом.


spajic · 2024-05-26T21:58:28Z

case-study.md

+Так как для 10000 отрабатывает теперь очень быстро, изменил и увеличил Feedback-Loop, теперь стало отрабатывать для 100000 строк за 4.852382 сек, остановился на этом.
+
+### Находка №3
+- Тем же Flat профилировщиком увидел, что следующей тяжелой операцией является сложение массивов, т.е. метод "+", который вызывается при первом же each, где в массив собираются сессии и пользователи


Flat это не профилировщик, а отчёт (просто обращаю внимание)

spajic · 2024-05-26T21:59:13Z

case-study.md

+
+### Находка №4
+- Flat профилировщиком показал, что следующая точка роста - это each. Для более понятной картины воспользовался CallTreePrinter, так как в древовидной структуре вызовов можно увидеть последовательность и понятное процентное соотношение затрат ресурсов конкретных методов. В метододе each вызываются map, однако их много, но из дерева видно, что трудозатратным в них является парсинг даты(Date.parse)
+- Заменил Date.parse на Date.strptime, так как при парсе даты .strptime является более оптимальным методом


с датами можно вообще ничего не делать, это пасхалочка

spajic · 2024-05-26T22:00:23Z

case-study.md

+
+Тест benchmark.rb проходит успешно, среднее время трех запусков программ с data_large.txt получается меньше 30 сек, а так же проверка на линейность perform_linear - выполняется
+
+Если оптимизировать далее, то скорее придется переписывать программу, стараясь уменьшать кол - во итераций в программе.


Во втором задании можно зайти с другой стороны и получить интересные реузльтаты

Фролов Артём Юрьевич added 8 commits May 18, 2024 01:29

step 1

6b7be64

step 2

8dc4c81

step 3

0e6196c

step 4

7d3f6b4

step 5

7b145a1

step 6

87d243f

step 7

ceabd58

summary result

e54472d

spajic approved these changes May 26, 2024

View reviewed changes

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Uh oh!

Оптимизация первого задания #146

Оптимизация первого задания #146

Uh oh!

KingeKod commented May 21, 2024

Uh oh!

spajic left a comment

Uh oh!

spajic May 26, 2024

Uh oh!

spajic May 26, 2024

Uh oh!

spajic May 26, 2024

Uh oh!

spajic May 26, 2024

Uh oh!

spajic May 26, 2024

Uh oh!

spajic May 26, 2024

Uh oh!

spajic May 26, 2024

Uh oh!

spajic May 26, 2024

Uh oh!

Uh oh!


		Тест benchmark.rb проходит успешно, среднее время трех запусков программ с data_large.txt получается меньше 30 сек, а так же проверка на линейность perform_linear - выполняется

		Если оптимизировать далее, то скорее придется переписывать программу, стараясь уменьшать кол - во итераций в программе.

Оптимизация первого задания #146

Are you sure you want to change the base?

Оптимизация первого задания #146

Uh oh!

Conversation

KingeKod commented May 21, 2024

Uh oh!

spajic left a comment

Choose a reason for hiding this comment

Uh oh!

Choose a reason for hiding this comment

Uh oh!

Choose a reason for hiding this comment

Uh oh!

Choose a reason for hiding this comment

Uh oh!

Choose a reason for hiding this comment

Uh oh!

Choose a reason for hiding this comment

Uh oh!

Choose a reason for hiding this comment

Uh oh!

Choose a reason for hiding this comment

Uh oh!

Choose a reason for hiding this comment

Uh oh!

Uh oh!