-
Notifications
You must be signed in to change notification settings - Fork 2
New issue
Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.
By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.
Already on GitHub? Sign in to your account
추론요청일 쌓이는데 추론시간은 짧아지는 이슈 #44
Comments
|
|
하드웨어 모니터링
|
하드웨어 메트릭에 힌트가 조금 더 있는듯 하네. 아래 글들 위주로 봐보면서 동작 방법에 대해서 조금 더 이해를 해야겠다. |
이 현상이 우리가 최종적으로 관찰하려는 결과와 크게 상관이 없을수도 있기는 한데... 그 이유 자체가 궁금하기는 하다. 하드웨어의 특성을 파악하는 차원에서 조금 더 분석해보자. |
xavier 장비내에서 실행되는 tf server에 master가 아닌 xavier에서 직접 요청을 보내봤습니다. master에서 보냈던 경우와 마찬가지로 초당 50개의 mobilenet v1 요청을 보내보았습니다. 결과로는 기존에 요청이 쌓이고 처리시간이 증가했던 결과에 비해 네트워크 지연이 없어서 처리가 바로바로 완료된것을 볼 수 있습니다. 이 실험으로 측정한 것이 실제 요청 처리 시간이고 master에서 측정했던 시간은 실제 요청 처리시간 + 네트워크 지연시간 이라서 이러한 차이를 보이는 것 같습니다. cpu 사용량도 확인 해본 결과 8개의 코어가 각각 15~30% 사이의 사용률로 전체적으로 증가하지는 않았습니다. 1초대 모든 요청전송 완료시간 : 1.302548885345459 total request num: 500 inference time info (each argument is info about requests per sec) [1] reqeust num per sec: 50 [2] reqeust num per sec: 50 [3] reqeust num per sec: 50 [4] reqeust num per sec: 50 [5] reqeust num per sec: 50 [6] reqeust num per sec: 50 [7] reqeust num per sec: 50 [8] reqeust num per sec: 50 [9] reqeust num per sec: 50 [10] reqeust num per sec: 50 |
석현아 그렇다면
위 경우 정도를 확인 혹은 분석 해 볼만 해 보인다. |
xavier 장비 내에서 inception v3 모델에 대해 추론을 실행 해 보았습니다.
결과를 보시면 이전과 마찬가지로 9~10초에 평균 요청처리시간이 감소함을 볼 수 있습니다.
|
"9 |
10초 동안 요청을 보낼 때 각장비에서 요청을 다 처리하지 못해 요청이 쌓이고 그로인해 추론시간이 점점 증가한다. 하지만 10초 중 7초에서 최고점을 찍고 8~10초는 추론시간이 줄어드는 현상이 있다. 매초 요청을 다 처리하지 못한다면 추론시간이 점점 증가해야하는데 줄어드는 이유를 파악해야한다.
The text was updated successfully, but these errors were encountered: