[potashin] optimization by suslovnikita · Pull Request #109 · hardcode-dev/rails-optimization-task3

suslovnikita · 2024-05-16T21:22:25Z

No description provided.

suslovnikita · 2024-05-16T21:29:32Z

app/services/utils_service.rb

+            if nesting == 0 # если закончился объкет уровня trip, парсим и импортируем его
+              trip = FastJsonparser.parse(str)
+
+              copy(


тут, конечно, забивается на валидации всех моделей совершенно.

идея по этому поводу была такая – использовать по одному инстансу модели на каждую и валидировать их перед копи/записью в справочники через валидации, которые не лезут в базу. на те, которые лезут в базу, вроде uniqueness, сделать уникальный индекс, потом делать reset шаблона.
тут есть момент по реализации, что делать с валидным родительским элементом, но невалидные дочерним (или наоборот).

второй вариант: переносить все валидации на констрейнты и индексы в базу

справедливо; у меня кстати по поводу валидаций в моделях и констрейнтов в pg как-то не сложилось однозначного мнения

в целом валидации в модели имеют место быть - на мой взгляд, ответственность модели - это быть валидным кирпичиком предметной области;

но с другой стороны если валидации будут в базе - у модели тоже не получится быть невалидной

но с третьей стороны в моделях как-то попроще и нет очень много завязок на БД

короче путь компромиссов

suslovnikita · 2024-05-16T22:45:22Z

case-study-a.md

+В результате проделанной оптимизации наконец удалось обработать файл с данными. 
+Удалось улучшить метрику системы с с 77 секунд до 1.4с для medium и уложиться в заданный бюджет.
+Файл large грузится за 6.5 секунд
+Файл 1м стал грузится за 56 секунд.


тут хочется понять, как обработать файл на 10м до минуты (нужны наводки, сейчас грузит чуть меньше 10 минут). из идей пока только использовать sax parser вроде ::Oj::Saj.

а я что-то потерял контекст; где-то было что за 1 минуту можно? (я просто не помню)

можно попрофилировать, посмотреть ;)

навскидку, возможно там парсинг не нужен, можно просто по кусочкам разбирать на поля

@spajic в ридми написано, что large должен до минуты проходить, я подумал, что для остальных такая же метрика, с учетом дальнейших оптимизаций))

spajic

Всё круто, респект 💪

spajic · 2024-05-20T12:40:36Z

.ruby-version

@@ -1 +1 @@
-2.6.3
+2.6.10


ого, вот это им попатчить пришлось ))

spajic · 2024-05-20T12:40:49Z

Gemfile

 gem 'pg', '>= 0.18', '< 2.0'
 gem 'puma', '~> 3.11'
 gem 'bootsnap', '>= 1.1.0', require: false
+gem 'fast_jsonparser'


возможно прикольно было бы к рельсам по дефолту его прикрутить; или сделать возможность настройки

типа чтобы где-то в кишках Rails.cache.read не терялось время на парсинг строки не самым эффективным

spajic · 2024-05-20T12:46:11Z

app/services/utils_service.rb

+
+  def initialize
+    @cities = {}
+    @buses = Hash.new { |h, k| h[k] = {} }


классная штука с автоматической инициализацией

spajic · 2024-05-20T12:52:00Z

app/services/utils_service.rb

+            if nesting == 0 # если закончился объкет уровня trip, парсим и импортируем его
+              trip = FastJsonparser.parse(str)
+
+              copy(


справедливо; у меня кстати по поводу валидаций в моделях и констрейнтов в pg как-то не сложилось однозначного мнения

в целом валидации в модели имеют место быть - на мой взгляд, ответственность модели - это быть валидным кирпичиком предметной области;

но с другой стороны если валидации будут в базе - у модели тоже не получится быть невалидной

но с третьей стороны в моделях как-то попроще и нет очень много завязок на БД

короче путь компромиссов

spajic · 2024-05-20T12:52:32Z

app/services/utils_service.rb

+      copy trips (from_id, to_id, start_time, duration_minutes, price_cents, bus_id) from stdin with csv delimiter ';'
+    SQL
+
+    ActiveRecord::Base.connection.raw_connection.copy_data(sql) do


кайф, лайк за стриминг, очень мало кто это делает в этом задании

spajic · 2024-05-20T12:54:18Z

case-study-a.md

+Для того, чтобы понимать, дают ли мои изменения положительный эффект на быстродействие программы я придумал использовать такую метрику: время загрузки medium файла (10к записей, 77 секунд в первой итерации)
+
+## Гарантия корректности работы оптимизированной программы
+Программа не поставлялась с тестом, поэтому перед выполнением оптимизации я добавил его самостоятельно: загрузка example файла с дальнейшим сравнением загруженных в бд данных с эталоном. Выполнение этого теста в фидбек-лупе позволяет не допустить изменения логики программы при оптимизации.


spajic · 2024-05-20T12:57:21Z

case-study-a.md

+В результате проделанной оптимизации наконец удалось обработать файл с данными. 
+Удалось улучшить метрику системы с с 77 секунд до 1.4с для medium и уложиться в заданный бюджет.
+Файл large грузится за 6.5 секунд
+Файл 1м стал грузится за 56 секунд.


а я что-то потерял контекст; где-то было что за 1 минуту можно? (я просто не помню)

можно попрофилировать, посмотреть ;)

навскидку, возможно там парсинг не нужен, можно просто по кусочкам разбирать на поля

spajic · 2024-05-20T13:00:36Z

case-study-b.md

+Для того, чтобы понимать, дают ли мои изменения положительный эффект на быстродействие программы я придумал использовать такую метрику: время загрузки страницы `автобусы/Самара/Москва` при наличии 100к поездок в базе данных. Начальное измерение – 13.3с.
+
+## Гарантия корректности работы оптимизированной программы
+Программа не поставлялась с тестом, поэтому перед выполнением оптимизации я добавил его самостоятельно: результат работы страницы `автобусы/Самара/Москва` для данных из файла `fixtures/example.json` сравнивается с тем, который был сформирован до изменений.


spajic · 2024-05-20T13:01:27Z

case-study-b.md

+
+## Результаты
+В результате проделанной оптимизации наконец удалось обработать файл с данными.
+Удалось улучшить метрику системы с 13.3с до 0.6с.


spajic · 2024-05-20T13:01:51Z

test/controllers/trips/index_test.rb

+    get(:index, params: {from: 'Самара', to: 'Москва'})
+
+    assert_response(:success)
+    assert_equal(@response.body.squish, File.read('test/fixtures/files/example_index.html').squish)


suslovnikita added 9 commits May 9, 2024 16:13

config: make it work

2cf1b6c

chore: add test

d5bd479

chore: use pg streaming

ce43d25

chore: update case study a

e049650

chore: add case study b, add specs to fight regression

46a0aa6

chore: 1st step case b & annotate

9ecd74e

chore: 2nd step case b

028cd9e

chore: 3rd & 4th steps case b

c315cda

chore: 4th step case b

a3337a8

suslovnikita commented May 16, 2024

View reviewed changes

chore: further micro optimizations

a899f61

suslovnikita force-pushed the feature/potashin-optimization branch from 82002a5 to a899f61 Compare May 16, 2024 22:38

suslovnikita commented May 16, 2024

View reviewed changes

spajic approved these changes May 20, 2024

View reviewed changes

		@@ -1 +1 @@
		2.6.3
		2.6.10

Conversation

suslovnikita commented May 16, 2024

Uh oh!

suslovnikita May 16, 2024 • edited Loading Uh oh! There was an error while loading. Please reload this page.

Uh oh!

Choose a reason for hiding this comment

Uh oh!

Choose a reason for hiding this comment

Uh oh!

suslovnikita May 16, 2024 • edited Loading Uh oh! There was an error while loading. Please reload this page.

Uh oh!

Choose a reason for hiding this comment

Uh oh!

Choose a reason for hiding this comment

Uh oh!

Choose a reason for hiding this comment

Uh oh!

spajic left a comment

Choose a reason for hiding this comment

Uh oh!

Choose a reason for hiding this comment

Uh oh!

Choose a reason for hiding this comment

Uh oh!

Choose a reason for hiding this comment

Uh oh!

Choose a reason for hiding this comment

Uh oh!

Choose a reason for hiding this comment

Uh oh!

Choose a reason for hiding this comment

Uh oh!

Choose a reason for hiding this comment

Uh oh!

Choose a reason for hiding this comment

Uh oh!

Choose a reason for hiding this comment

Uh oh!

Choose a reason for hiding this comment

Uh oh!

Choose a reason for hiding this comment

Uh oh!

Reviewers

Assignees

Labels

Projects

Milestone

Development

Uh oh!

2 participants

suslovnikita May 16, 2024 •

edited

Loading

suslovnikita May 16, 2024 •

edited

Loading