9. Java의 GC에 대해 설명해 주세요. #47

KIMSEI1124 · 2024-09-04T03:21:24Z

KIMSEI1124
Sep 4, 2024
Maintainer

finalize() 를 수동으로 호출하는 것은 왜 문제가 될 수 있을까요?
어떤 변수의 값이 null이 되었다면, 이 값은 GC가 될 가능성이 있을까요?

KIMSEI1124 · 2024-09-04T03:22:30Z

KIMSEI1124
Sep 4, 2024
Maintainer Author

G1 GC

CMS GC를 대체하기 위해 새롭게 등장한 GC
대용량의 메모리가 있는 멀티 프로세서 시스템을 위해 제작됨.
CMS GC보다 효율적으로 동시에 Application과 GC를 진행할 수 있고, 메모리 Compaction 과정까지 지원한다.
Java 9 버전부터 기본 GC 방식

GC의 종류

Serial GC
Parallel GC
Parallel Old GC

...

Concurrent Mark-Sweep(CMS) GC\
- 가비지 컬렉션 알고리즘 중 하나
- 애플리케이션의 응답 시간을 최적화하려는 목적으로 설계됨
- 주로 큰 힙 크기와 긴 가비지 컬렉션 일시 중지 시간을 피하고 싶은 애플리케이션에서 사용됨
CMS GC와 Parallel GC의 차이 = Compaction 작업 유무로 구분될 수 있다.

Compaction : 메모리의 조각화(fragmentation) 문제를 해결하기 위한 작업

메모리 조각화

가비지 컬렉션을 통해 불필요한 객체들이
해제되면서 메모리의 여러 위치에 여유 공간이 생기게 되는데, 이러한 여유 공간들이 연속되지 않고 여기저기 분산되어 있을 때 발생하는 현상

공간이 많아도, 분산으로 인해, 연속적인 공간이 부족하여
메모리 할당을 실패하는 문제가 발생할 수 있다.

Compaction은 이 조각화된 메모리를 정리하여 연속적인 블록으로 만들어주는 과정이다.

CMS GC는 주요 목적이 응답 시간을 최소하 하는 것이므로, Compaction 작업을 기본적으로 수행하지는 않는다.

왜 이름이 G1일까?

G1 GC의 G1은 (Garbage-First) 의 약자로, 가장 많은 가비지가 있는 영역부터 수집하는 핵심 전략을 갖고 있다.

이렇게 하면 가장 효율적으로 메모리를 재활용할 수 있으며, 주어진 일시 중지 시간(pause time) 목표 내에서 가능한 한 최대의 메모리를 회수하는 것이 가능해진다.

G1은 어떤 안정성 문제가 있었을까?

G1은 Java 7에서 처음으로 사용 가능하게 되었는데, 당시에 더 오래 된 Parallel GC나 CMS GC
와 같은 GC들에 비해 완전히 검증되지 않았다.

초기 버전의 G1 GC는 일부 케이스에서 예상치 못한 행동이나 성능 문제를 일으킬 수 있었다.

어떤 케이스 였을까 ?

G1 GC의 주요 목표 중 하나는 일시 중지 시간을 줄이는 것이지만,
초기 버전에서는 일부 상황에서 예상보다 긴 일시 중지 시간이 발생했다.

G1은 메모리 조각화 문제를 해결하기 위해 설계되었지만,
초기 버전에서는 여전히 일부 상황에서 조각화 문제가 발생했다.

일부 애플리케이션에서는 G1 GC를 사용할 때 전반적인 성능 저하가 발생했으며,
이는 CMS GC나 Parallel GC와 비교했을 때 특히 두드러졌다.

이러한 문제점들은 시간이 지나면서 Java 업데이트와 함께 개선되었고,
G1 GC는 현재 많은 환경에서 안정적으로 사용되고 있다.

G1은 어떻게 기본 GC가 될 수 있었을까?

G1이 기본 GC로 채택된 것에는 여러가지 중요 요인들이 있다.

예측 가능한 일시 중지 시간:
G1 GC는 일시 중지 시간 목표 (예: -XX:MaxGCPauseMillis)를 설정할 수 있게 설계되었다. 이를 통해 개발자들은 일시 중지 시간을 예측 가능한 범위로 제한할 수 있다. 이러한 특징은 실시간성을 요구하는 애플리케이션에서 특히 중요하다.
대규모 힙 지원
CMS GC의 한계점:
메모리 조각화와 전체 GC로 인한 긴 일시 중지 시간 문제 등의 한계점을 해결하기 위해 G1 이 등장했다.
현대 애플리케이션의 요구 사항 :
대규모 메모리, 실시간 요구 사항 및 효율성을 중시하는 현대 애플리케이션의 요구 사항을 충족시키기 위해 G1 GC가 적합하다고 판단된다.

Ref. #

https://steady-coding.tistory.com/590

0 replies

KIMSEI1124 · 2024-09-04T03:22:54Z

KIMSEI1124
Sep 4, 2024
Maintainer Author

들어가며

Garbage Collection 즉 GC 는 메모리 관리 방법 중 하나이며 JVM에서 메모리를 관리하는 방법입니다.

말 그래도 쓰레기를 수집하는 기능이며 쓰레기는 실제 쓰레기를 뜻하는게 아니라 개발자가 동적으로 할당한 메모리 영역 중 더 이상 쓰이지 않는 영역을 말합니다.

가비지 컬렉션은 그러한 영역을 자동으로 찾아내어 해제하는 기능을 합니다.

그러면 가비지 컬렉션은 어떻게 더 이상 쓰이지 않는 영역을 탐지하는 알고리즘이 어떤 것이 있는지 확인해 보겠습니다.

알고리즘

GC는 작동 방식에 따라 크게 두 가지로 분류 가능합니다. ₂₎

참조 횟수 카운팅 GC ( Reference Counting Garbage Collection )
추적 기반 GC ( Tracing Garbage Collection )

참조 횟수 카운팅 GC ( Reference Counting Garbage Collection )

Reference Counting GC는 GC의 초기 알고리즘으로 Gabrage 를 발견하는 것에 초점이 맞추어져 있습니다.
어느 한 메모리가 다른 메모리를 얼마나 많이 참조하는지 횟수를 세어서 메모리 접근 가능과 불가능을 나누는 방식입니다.

예를 들어 A 메모리가 B 메모리를 참조하면 B 메모리의 참조 횟수를 1을 더하고, A 메모리가 B 메모리 참조를 중단하면 B 메모리 참조 횟수를 1을 뺍니다.

만약 1을 뺐을 때, 참조 횟수가 0이 되면 해당 메모리에 아무도 접근을 못 하는 것이므로 해당 메모리를 해제합니다.

장점

다른 GC 알고리즘에 비해 구현이 매우 간단한 편입니다.

또한 참조횟수가 0이 되자마자 소멸한다는 장점도 있습니다.

단점

크게 두 가지 단점이 존재합니다.

오버헤드

참조 횟수를 변경하도록 구현을 하는데 이러한 부분이 프로그램을 느리게 만듭니다.
참조 횟수를 + 하는 부분 보다 - 를 하는 부분에서 정수 감소, 조건문, 함수 호출 등이 실행될 수 있어서 대입이 빈번히 일어나는 곳에서는 성능이 좋지 않습니다.
또한 캐시 효율이 낮아질 수도 있습니다.
무한 참조 ( Cyclic Reference )

메모리들이 서로 참조하는 형상입니다.
예를 들면 다음과 같습니다.
메모리 A가 메모리 B를 가리키고, 메모리 B가 메모리 A를 가리키면 두 메모리의 참조 횟수는 모두 1입니다.
하지만 만약 다른 메모리에서도 메모리 A나 B에 접근 가능한 루트가 없다고 하면 둘 다 GC에 의해 해제되어야 합니다.
그러나 메모리 A와 B 모두 서로를 참조하고 있어, 참조 횟수가 0이 아니기 때문에 해제가 불가능해져 그대로 메모리 누수가 발생합니다.

추적 기반 GC ( Tracing Garbage Collection )

가장 많이 사용되는 GC 기법입니다. Tracing 즉 추적이라는 단어의 뜻처럼 프로그램 실행 중 특정 타이밍에 현재 할당된 모든 메모리를 조사하여 현재 접근 가능한지 불가능한지 분류한 뒤, 접근이 불가능한 메모리를 쓰레기라고 간주하여 해제시키는 방식입니다. ₁₎

이 방식을 사용하면 Reference Counting GC의 단점인 오버헤드 이슈와 순환 참조 이슈를 어느 정도 해결이 가능합니다.

메모리 조사의 시작점이 있어야 할 텐데, 항상 접근 가능한 메모리를 root라고 합니다. 이 메모리 부터 검사를 시작해서 참조하는 다른 메모리를 확인하는 행위를 반복하여 접근이 가능한 메모리이거나 불가능한 메모리인지 분류합니다.

추적 기반 GC 알고리즘은 총 5가지의 알고리즘을 조사하였으며 목록은 다음과 같습니다.

Mark-Sweep Algorithm
Mark-Sweep-Compact Algorithm
Tri-color Marking Algorithm ( Incremental GC )
Copying Algorithm ( Incremental GC )
Generational Algorithm ( Incremental GC )

이 중에서 먼저 위에 위에 있는 2가지의 알고리즘에 대해 알아 보도록 하겠습니다.

Mark-Sweep Algorithm

Mark-Sweep Algorithm 은 이름의 해석 그대로 메모리를 Mark(마킹) 후, **Sweep(해제)**하는 방식입니다.

마킹이 안 된 메모리는 전부 해제한 후 살아남은 객체의 마킹 정보를 초기화합니다.

Marking 정보는 각 객체의 Header 에 Flag 나 별도의 BitmapTable 등을 사용하여 저장합니다.

이 방식대로 수행하면 접근이 가능하거나 불가능한 메모리를 완벽하게 분류해서 해제하는 것이 가능합니다.

하지만 프로그램 실행 도중 메모리가 변경되면 마킹을 다시 해야 하기 때문에 프로그램을 통째로 정지(stop-the-world)시켜야 합니다.

이러한 이유 때문에 Mark-Sweep 방식은 프로그램 실행 도중 잠깐 멈추는 시간이 생겨, 실시간으로 빠르게 동작해야 하는 프로그램에서는 뚝뚝 끊기는 큰 단점이 발생합니다.

Mark-Sweep-Compact Algorithm

위의 Mark-Sweep 그림을 보면 해제 과정 후 메모리 상태가 중간중간 비워져 있는 상태를 확인할 수 있습니다.
GC가 수행되면서 제거된 메모리들이 있던 곳이며 이렇게 조각난 상태를 Fragmentation(단편화)라고 하는데, 이 문제를 해결하기 위해 만들어진 알고리즘 입니다.

단편화는 메모리의 빈 부분들을 합쳐보면 충분히 많은 메모리가 있음에도 불구하고 새로운 객체를 할당할 수 없는 상황이 생깁니다. 또한 새로운 객체를 할당하기 위해 메모리 상의 빈 공간을 뒤지는 과정 자체가 성능에 악영향을 미치기 때문에 프로그램도 느려질 수 있습니다.

그래서 Compact 단계에서는 빈 공간을 없애고, 사용되는 메모리들을 연속적으로 붙여줍니다.

하지만 이러한 Compact 단계 자체와 그 후에 메모리의 참조 관계를 다시 설정해주는 등의 부가적인 오버헤드가 발생합니다.

점진적 GC ( Incremental GC )

위의 2가지 추적 기반 GC ( Tracing Garbage Collection )을 소개하였는데 해당 알고리즘들은 문제점들이 있었습니다.
이러한 문제점을 해결하기 위해 나온 것이 Incremental 점진적 GC 입니다.

위의 방식들처럼 마킹과 해제를 한 번에 하지 않고, 여러 번에 걸쳐서 수행하는 방식입니다.
이 방법을 사용하면 프로그램을 통째로 정지하는 것에 비해 마킹과 해제를 하는 한 싸이클에 걸리는 시간은 더 오래 걸릴 수 있지만, 한번 GC를 수행할 때 프로그램이 정지하는 시간을 줄일 수 있습니다.

위에서 설명한 Mark-Sweep 알고리즘에서도 점진적 GC를 어느정도 적용할 수 있습니다.
해제 단계에서 접근이 불가능하다고 판단된 메모리는 절대 다시 접근 가능해질 수 없기 때문에 해당 메모리의 해제는 언제 해도 상관없으므로 여러 번에 걸쳐서 수행해도 됩니다.
문제는 탐색 단계인데, 마킹을 점진적으로 하려면 **Tri-color Marking(삼색 기법)**등의 방법을 추가로 사용해야 합니다.

그러면 Tri-color Marking 알고리즘을 포함한 나머지 2개의 알고리즘도 확인해 보겠습니다.

Tri-color Marking Algorithm ( Incremental GC )
Copying Algorithm ( Incremental GC )
Generational Algorithm ( Incremental GC )

Tri-color Marking Algorithm

기존에는 접근/불가능이라는 2가지의 색으로만 마킹을 했다면 Tri-color Marking (삼색 기법)는 3가지의 색으로 마킹을 하는 것 입니다.

3가지의 색은 아래와 같이 구분합니다.

흰색 : 접근 가능한지 알 수 없는 메모리
회색 : 접근 가능하지만 해당 메모리에서 참조하는 메모리의 마킹을 하지 않은 경우
검은색 : 접근 가능하며 해당 메모리가 참조하는 메모리의 마킹도 끝난 경우

Tri-color Marking 의 3가지 색으로 구분하기 위한 탐색 방법은 다음과 같습니다.

root 메모리 조사
흰색인 메모리를 발견하면 회색으로 마킹
root메모리를 모두 마킹했으면 회색으로 마킹된 메모리 탐색
해당 메모리가 참조하는 모든 메모리를 회색으로 마킹
(4)번 작업이 끝나면 처음 회색이었던 메모리를 검은색으로 변경

위 작업들이 끝난 후 만약 회색으로 마킹된 메모리가 존재하지 않으면 모두 흰색이나 검은색이므로 모든 메모리의 접근 가능 여부를 결정합니다.

이런 방식을 이용하면 임의로 GC를 중단해도 다음번에는 회색인 메모리부터 조사하면 되므로 여러 번에 걸쳐 GC를 수행할 수 있습니다.

하지만 마킹을 하는 도중에 메모리 참조가 수정되면 잘못 마킹이 되는 경우가 발생할 수 있습니다.

위와 같은 문제를 해결하기 위해 read-barrier나 write-barrier를 사용하여 root 메모리를 읽거나 쓰는 것에 제약을 둡니다.

대부분의 경우 write 보다 read 행위가 더 자주 일어나므로 write-barrier가 주로 사용됩니다.

Copying Algorithm

Copying Algorithm 은 Mark-Sweep 알고리즘에서 나타나는 단편화 문제를 해결하기 위해 제시된 방법이며 Mark(마킹)을 하지 않고 아예 메모리를 옮겨버립니다.

Heap 영역을 활동하는 공간(Active)과 활동하지 않는 공간(InActive), 즉 두 개의 같은 크기의 공간으로 나누어 활동하는 공간에만 객체를 할당하는 방식입니다. 만약 활동하는 공간에서 GC를 수행하여 살아남은 객체를 사용하지 않는 공간으로 복사하고 두 공간을 서로 바꿉니다.

위 그림으로 예를 들면, 두 개의 메모리를 A, B라고 했을 때

처음에는 모든 메모리를 A에 할당합니다.
A가 가득 차는 등으로 인해 GC가 실행되면 프로그램은 잠시 일시중단 상태가 되고, A에서 살아남은 메모리가 모두 B로 복사됩니다.
A는 쓰레기 객체들만 존재하므로 A메모리를 비워버립니다.
그 다음 과정에서는 B에 메모리를 할당하다가 또 다시 GC가 실행되면 A로 복사합니다.

이후 (1)부터 (4)까지의 과정을 반복합니다.

해당 알고리즘의 장점으로는 새로운 공간에 단편화 없이, 연속된 메모리 공간에 차곡차곡 재배열이 되기에 캐시 효율이 높아집니다.
두 번째 장점으로는 처음부터 아예 메모리를 할당해두고 시작하기 때문에 Heap 영역의 메모리 할당을 Stack처럼 빠르게 할 수 있습니다.

하지만 단점으로는 처음부터 메모리를 잡아두고 시작하다 보니 메모리 공간을 많이 사용하게 됩니다.
두 번째로는 Copying이라는 작업의 오버헤드가 존재하며, 복사하는 과정에서 메모리의 주소가 바뀌므로 포인터를 이용한 접근을 포기하거나, 메모리의 주소가 바뀔 때마다 모든 메모리의 주소를 갱신해야 한다는 단점이 존재합니다.
세 번째는 프로그램의 일시 중단 현상도 존재합니다.

Generational Algorithm

객체의 라이프 사이클을 자세히 살펴보니, 한 가지 특이한 현상이 있습니다.
객체에 메모리를 할당 후, 해당 객체가 사용하지 않는 쓰레기가 될 때까지 걸리는 시간을 추적했을 때, 대부분의 객체는 잠시 사용되고 금세 버려지며, 반대로 오래 살아남아 쓰이는 경우는 "그리 많지 않다"라는 것을 파악하였습니다.

이러한 현상을 토대로 아래 두 가지 가정 (Weak Generational Hypothesis)을 전제 삼아 만들어진 방식이 해당 알고리즘입니다.

대부분의 할당된 객체는 오랫동안 참조되지 않는다.
오래된 객체에서 젊은 객체로의 참조는 거의 없다.

상대적으로 크기가 작은 New(Young) 영역에 할당하고, New(Young) 영역에서 기준 시간 이상으로 오래 살아남은 객체가 있다면 Old 영역으로 이동시켜 말 그대로 세대를 구분하는 방법입니다.

이 세대를 나누는 기준은 구현 방식마다 다른데 Stack 영역을 New(Young) 영역으로 쓸 수도 있고, Heap영역에 임의로 할당해서 쓸 수도 있지만, 대부분의 경우 Heap 영역을 사용합니다.

위의 그림을 보면, 객체는 New(Young) 세대에 할당되고 GC가 수행될 때마다 살아남은 객체에 Age를 기록합니다.

이 Age 역활은 해당 객체가 몇 번 살아남았는지 기록하는 것이며, 특정 임계값을 넘어서게 되면 Old Generation으로 복사하는 작업을 진행합니다. ( Promotion )

해당 알고리즘의 장점으로는 대부분의 객체는 New(Young) 에서 살다가 쓰레기가 되기 때문에 Old로의 복사 작업을 최소화시킬 수 있습니다.
두 번째로는 상대적으로 작은 영역만 추적하면 적은 시간과 비용으로 짧은 시간 안에 쓰레기 메모리를 확보할 수 있게 됩니다.
세 번째로는 Copying 작업이 이루어지며 Compact 작업도 수행되기 때문에 단편화 문제도 해결될 수 있습니다.

정리

참조 횟수 카운팅 GC ( Reference Counting Garbage Collection )의 장점으로는 구현이 쉽고추적, 참조 횟수가 0이 되면 즉시 소멸한다는 장점이 있지만 단점으로는 오버헤드가 많고, 무한 참조가 발생합니다. 그래서 추적 기반 GC ( Tracing Garbage Collection )를 사용하여 참조 횟수 카운팅 GC의 단점을 극복하였습니다.

Mark-Sweep 은 탐색 후 해제하는 작업을 진행하였습니다. 하지만 메모리 단편화라는 단점이 있습니다.
Mark-Sweep-Compact 은 탐색 후 해제한 뒤 메모리 단편화를 해결하기 위해서 메모리의 빈 공간을 없애고 연속적으로 붙여주는 작업을 진행하였습니다. 하지만 단편화를 해결하기 위해서 오버헤드가 많이 일어나는 등 단점등이 있습니다.
Tri-color Marking은 3가지의 색으로 구분하여 탐색하는 시간을 줄였습니다.
Copying은 해제를 할 때 복사하여 남은 쓰레기 객체를 해제하여 단편화를 해결하였습니다. 하지만 메모리를 2배를 설정해야 한다는 단점이 있습니다.
Generational 은 앞서 설명한 모든 알고리즘 기법을 사용하여 가장 효율적인 방법으로 GC를 진행하고 있습니다.

결론

현재 GC 알고리즘은 대부분 점진적 GC를 사용하고 있으며 어떠한 이유로 새로운 알고리즘이 탄생하였는지 확인하였습니다.

위의 내용에는 없지만 Major-GC, Minor-GC로 나눠서 GC를 수행할 수 있고 Cheney's Algorithm을 접목하여 단편화를 줄일 수도 있는 등 여러 모로 이점이 많습니다.

Ref

0 replies

KIMSEI1124 · 2024-09-04T03:23:14Z

KIMSEI1124
Sep 4, 2024
Maintainer Author

1. 들어가며

GC 란?

GC는 , Garbage Collection 로 동적으로 할당한 메모리 영역 중 사용하지 않는 영역을 탐지하여 해제하는 기능을 의미한다. 쉽게 필요 없는 쓰레기를 정리하는 작업으로 이해하면 된다.

Java 의 GC

책에서도 명시되어 있는 것 처럼, Java에서는 개발자가 메모리를 직접 건드리는 것이 아니라 Garbage Collector 가 알아서 불필요한 메모리를 정리해준다.

public String makeQuery(String code){
	String queryPre = "select * from table_a where a = '";
	String queryPost = "' order by c ";
	return queryPre = queryPre + code + queryPost;
}

위 예시에서 makeQuery의 메서드 수행이 완료되면, queryPre 객체과 queryPost 객체는 더 이상 필요없는 쓰레기 객체가 된다. 이런 쓰레기 객체를 정리하는 작업이 GC 이다.

그렇다면 우리는 메모리 관리에 신경쓰지 않고 개발을 해도 되는걸까? ~~안된다.~~

Stop-The-World

우리가 GC 를 신경써야 하는 이유는, GC 가 진행되는 동안 다른 동작들이 멈추기 때문이다. 이런 현상을 Stop-The-World 라고 부른다.

다시 말해, Stop-The-World 는 GC 를 실행하기 위해 JVM이 애플리케이션 실행이 멈추는 것을 의미한다. Stop-The-World 가 발생하면 GC 를 실행하는 쓰레드를 제외한 나머지 쓰레드는 모두 작업을 멈추고, GC 를 완료한 이후에 다시 실행된다.

책에서 여러가지 GC 알고리즘에 대해서 명시하고 있지만, 어떤 알고리즘을 사용하더라도 Stop-The-World는 발생한다. 그래서 대부분 GC 를 튜닝한다고 하면, Stop-The-World 시간을 줄이는 것을 의미한다.

2. Stop-The-World가 발생하는 이유

Stop-The-World 가 자주 발생할 수록 애플리케이션의 동작이 지연되고, 이는 사용자에게도 체감이 된다. 그렇다면 왜 GC 에서 Stop-The-World 가 발생하는 것 일까?

(1) 메모리 파편화 (Memory fragmentation)

메모리 파편화란, 컴퓨터 시스템에서 메모리 공간을 할당하고 해제하는 과정에서 발생하는 현상이며 크게 외부 파편화와 내부 파편화로 나눌 수 있다. 두 종류의 메모리 파편화 모두 메모리를 효율적으로 사용하는데에 있어 치명적이다.

➀ 외부 파편화
: 메모리 공간이 여러 개의 작은 조각으로 나누어져 사용되어, 충분한 메모리 공간이 있음에도 불구하고 큰 메모리 블록을 할당할 수 없는 경우

➁ 내부 파편화
: 메모리 공간 중 일부가 할당된 뒤 남는 공간이 발생하는 경우

앞서 GC 는 할당한 메모리 영역 중 사용하지 않는 영역을 탐지하여 해제하는 기능이라고 언급했다. 할당한 메모리를 해제하게 되면, 빈 메모리 공간이 새로 생성될 것이다. 이때, 메모리 파편화를 해결하기위해서 Compaction 이 일어나야 한다. 다시 말해, GC 가 일어나는 힙 영역 내의 빈 공간들을 큰 블록으로 만들고 다시 이용할 수 있는 상태로 만들어야 한다.

힙 영역 내의 공간들을 큰 블록으로 만들기 위해서는, 객체를 새로운 주소로 이동 시키고 다시 주소를 참조하는 과정이 필요하다. 이를 위해서 GC 에 Stop-The-World 가 동반될 수 밖에 없다.

(2) 객체 일관성

GC 에서 Stop-The-World 가 발생하는 이유는 한 가지가 더 있다. 만약, GC 가 발생하는 동안 다른 쓰레드가 동작하게 되면 어떻게 될까?

메모리 내의 객체들의 상태가 변경될 수도 있고, 다른 쓰레드가 객체를 참조할 수도 있다. 이런 가능성은 잘못된 결과나 의도치 않은 오류를 발생시킬 수도 있다. 예를 들어, GC 가 수집하는 객체를 다른 쓰레드가 동시에 참조하게 된다면 이후 해당 객체가 호출되는 경우, 존재하지 않는 오류가 발생할 수 있다. 혹은, 메모리 파편화 문제를 해결하기 위해서 객체가 이동하면서 쓰레드가 전혀 다른 객체의 주소를 참조하게 될 수도 있다.

이런 오류를 방지하기 위해서 GC 에 Stop-The-World 가 필요하다.

3. Compaction

흩어져 있는 메모리를 압축하는 과정을 통해, 메모리를 효율적으로 사용할 수 있다.

4. Concurrent Mark & Sweep GC (= CMS Collector)

앞서 언급했던 것처럼 어떤 알고리즘을 사용하더라도 Stop-The-World는 발생한다. 하지만, CMS Collector 는 여러 알고리즘 중 Stop-The-World 의 시간이 짧다는 장점을 가지고 있기 때문에 해당 알고리즘에 대해 간단히 설명하고자 한다.

CMS Collector 는 아래와 같은 방식으로 진행되며, 다른 알고리즘 대비 비교적 복잡하다.

Initial Mark : 클래스 로더에서 가장 가까운 객체 중 살아 있는 객체를 찾기만 한다. 따라서, 멈추는 시간이 매우 짧다.
Concurrent Mark : 이전 단계에서 살아있다고 확인한 객체에서 참조하고 있는 객체들을 따라가면서 확인한다. 이 단계는 다른 쓰레드가 실행 중인 상태에서 동시에 진행된다는 특징이 있다.
Remark : Concurrent Mark 단계에서 새로 추가되거나 참조가 끊긴 객체를 확인한다.
Concurrent Sweep : 쓰레기를 정리하는 작업을 실행한다. 이 단계 또한 다른 쓰레드가 실행되고 있는 상태에서 진행된다.

초기 단계에서 잠시 멈춘 후에, 다른 쓰레드가 실행 중인 상태에서 실행되기 때문에 Stop-The-World 시간이 매우 짧다는 특징을 가지는 것이다.

하지만, 다른 방식보다 메모리와 CPU를 더 많이 사용한다는 점이 단점이다. 또한 Compaction 단계가 기본적으로 제공되지 않는다는 점도 단점이다. 이에 따라 조각난 메모리가 많아서, Compaction 작업을 실행하면 다른 방식의 Stop-The-World 시간보다 더 많이 소요되기 때문이다. 따라서 해당 방식을 사용하기 위해서는 신중히 검토한 후에 사용해야 한다.

참고자료

https://golf-dev.tistory.com/68
https://steady-coding.tistory.com/584
https://d2.naver.com/helloworld/1329
https://developer-mac.tistory.com/21

0 replies

KIMSEI1124 · 2024-09-04T03:23:24Z

KIMSEI1124
Sep 4, 2024
Maintainer Author

서론

저자의 말을 빌려보면 GC가 필요한 상황은 JVM의 메모리 크기도 지정하지 않았고, Timeout이 지속적으로 발생하고 있는 상황이다.

우리는 이 상황을 조금 더 자세히 들여다 볼 것이다.

본론

사실, 지금부터 말할 내용은 우리가 지난 4주간 피땀흘려 공부한 내용을 종합하는 것이다.

1. memory leak 식별 및 해결

memory leak이 발생하는 상황은 잦은 GC를 유발하는 대표적인 이유이다. 이슈 16([#16])_메모리 릭(Memory leak)과 GC에서 이미 다루었듯 더 이상 불필요한 메모리가 GC에 의해 해제되지 않으면서 메모리 할당을 잘못 관리된다면 이는 다시 GC를 유발하는 악순환에 빠지게 된다.
이슈 16([#16])에서도 공부했듯 메모리 릭의 주된 원인은 무분별한 Autoboxing으로 인한 불필요한 참조 증가, 맵에 캐쉬 데이터를 선언하고 해제하지 않아 불필요한 참조 증가, java.sql.Connection 객체와 같이 스트림 객체를 사용하고 닫지 않는 경우 등에 의해 발생한다.
따라서 우리는 메모리 프로파일링 도구를 사용하여 누수를 식별하고, 코드를 검토하여 불필요한 객체 참조를 제거해야한다. 아래는 2015년 기준 대표적으로 사용하는 자바 메모리 프로파일링 도구의 도식표이다

2. 불필요한 객체 생성 줄이기

책에도 이미 살짝 언급한 내용이 존재한다. 비슷한 원리로 GC를 줄이는 방식이 무엇이 있을까 고민해보자.

반복적인 객체 생성
```
for(int i = 0; i < 100_000_000; i++) {
		List<Integer> list = new ArrayList<>();
}
```
자바의 primitive type은 메모리의 스택 영역에 저장되므로 반복문 안에서 선언해도 메모리 릭에 영향을 끼치지 않지만 Reference type을 위와 같이 반복적으로 선언한다면 메모리 릭을 일으킬 수 있다.
따라서, 반복적으로 객체를 생성하는 경우엔 아래와 같이 객체 생성 및 참조 해제를 관리하자.

List<Integer> list; // 루프 밖에서 선언

for (int i = 0; i < 100_000_000; i++) {
    list = new ArrayList<>();

    /* list 사용 */

    list = null; // 사용 후에 참조 해제
}

불필요한 복제

객체 복제가 필요한 경우, shallow copy와 deep copy를 구분하여 필요한 복제만 수행해야 한다. 둘의 차이는 굳이 언급하지 않겠다. 모르는 사람은 깨알 블로그 홍보를 받아랏! Deep Copy vs Shallow Copy

3. 캐시 활용

자주 사용하는 데이터를 캐시하여 반복적인 계산이나 sql 쿼리를 피할 수 있다. 캐시가 사용되는 가장 기본적인 이유 중 하나가 메모리 릭을 막는 방법과 아주 깊은 연관이 있다. 캐시를 사용하여 반복적으로 계산하거나 데이터를 다시 불러오는 대신 이전 결과를 저장하고 다시 사용함으로써 불필요한 메모리 소비를 방지할 수 있다. 예시를 멀리서 찾지 말자. 피보나치 수열을 dp로 풀던 경험을 떠올리면 익숙할 것이다.
위에선 캐시를 조심하라며, 근데 또 캐시를 활용하라 해? 뭐 어쩌라는거야?

잘 좀 쓰자. 맵에 데이터를 캐시하고 방치하는 것은 당연히 메모리 누수를 유발하지만 이를 방지하기 위한 적절한 메커니즘을 사용해야 한다.

캐시 크기 제한

캐시에 저장되는 데이터의 최대 개수나 총 크기를 제한하고, 캐시에 새로운 데이터를 추가할 때 이런 제한 사항을 고려하여 캐시가 무한정 커지는 것을 방지해야 한다.
캐시 대체 알고리즘

캐시에서 데이터를 삭제할 때 어떤 데이터를 삭제할지를 결정하는 대체 알고리즘을 선택한다. 가장 오래된 데이터, 가장 적게 사용된 데이터 등을 대체 대상으로 선택하여 캐시를 최적화한다.
약한 참조 사용

약한 참조(Weak Reference)나 소프트 참조(Soft Reference)를 사용하여 가비지 컬렉터가 캐시의 데이터를 적절하게 처리하도록 한다.

import java.lang.ref.WeakReference;

public class WeakReferenceExample {
    public static void main(String[] args) {
        // 객체 생성
        String data = new String("This is a weak reference example");
        
        // 약한 참조 생성
        WeakReference<String> weakRef = new WeakReference<>(data);
        
        // data 참조를 해제
        data = null;
        
        // 가비지 컬렉터 실행하면 data 객체가 GC에 의해 수거 당함
        System.gc();
    }
}

import java.lang.ref.SoftReference;

public class SoftReferenceExample {
    public static void main(String[] args) {
        // 객체 생성
        String data = new String("This is a soft reference example");
        
        // 소프트 참조 생성
        SoftReference<String> softRef = new SoftReference<>(data);
        
        // data 참조를 해제
        data = null;
        
        // 가비지 컬렉터 실행 (메모리가 충분한 경우에는 수거되지 않을 수 있음)
        System.gc();
    }
}

import java.lang.ref.SoftReference;
import java.util.HashMap;
import java.util.Map;

public class SoftReferenceCache<K, V> {
    private final Map<K, SoftReference<V>> cache = new HashMap<>();

    public V get(K key) {
        SoftReference<V> softRef = cache.get(key);
        if (softRef != null) {
            V value = softRef.get();
            if (value != null) {
                return value; // 캐시에서 유효한 객체 반환
            }
        }
        return null; // 캐시에 해당 객체가 없거나 더 이상 유효하지 않을 때
    }

    public void put(K key, V value) {
        SoftReference<V> softRef = new SoftReference<>(value);
        cache.put(key, softRef);
    }

    public static void main(String[] args) {
        SoftReferenceCache<String, String> cache = new SoftReferenceCache<>();
        cache.put("key1", "value1");
        cache.put("key2", "value2");

        // 캐시에서 데이터 가져오기
        System.out.println("key1: " + cache.get("key1"));
        System.out.println("key2: " + cache.get("key2"));

        // 메모리 부족 상황 시 가비지 컬렉터가 동작하면서 소프트 참조가 수거될 수 있음
        System.gc();

        // 가비지 컬렉터에 의해 수거된 데이터는 null이 반환됨
        System.out.println("key1: " + cache.get("key1"));
        System.out.println("key2: " + cache.get("key2"));
    }
}

4**. 다중 스레드 처리**

스레드를 효율적으로 사용하고 관리하여 CPU 및 메모리 리소스를 효율적으로 활용해야 한다. 스레드가 너무 많거나 무한 대기 상태에 있다면 성능 문제가 발생할 수 있다.

+ GC 튜닝의 과정 간략하게…

일반적으로 GC 튜닝은 다음과 같은 단계를 거친다.

성능 목표 설정
GC 로그 분석
메모리 사용 분석
GC 튜닝 옵션 설정
메모리 할당 및 객체 라이프사이클 관리
GC 이벤트 최적화
테스트 및 모니터링
반복 및 개선

0 replies

KIMSEI1124 · 2024-09-04T03:24:00Z

KIMSEI1124
Sep 4, 2024
Maintainer Author

시작하며

세상에 벌써 책 한 권이 끝났다! 이번 이슈에서는 참고자료인 하나의 메모리 누수를 잡기까지 를 함께 살펴보며 주요 개념들을 다시 한 번 살펴볼 수 있도록 노력해보자!

에러 발생의 시작

Out of Memory 오류 발생 JVM의 메모리 영역은 어떻게 구성되어 있을까? SSARTEL-10th/JPTS_bookstudy#6

자바는 Java8부터 PermGen 영역을 없애고 이를 Meta Space로 변경해 메모리 관리에 대한 개발자의 부담을 줄여주고자 노력했다. 그럼에도 불구하고 우리는 Out of Memory 에러를 만날 수 있다.

이러한 OOME의 경우 대부분 개발이 대부분 완료된 후 사용자 테스트 혹은 인수 테스트 단계에서 많이 발생한다. 즉 개발 단계에서 수행하는 단위 테스트의 경우 목적 기능에 대한 검증 위주로 진행 되기 때문에 식별이 어렵고 가동 초기 단계 혹은 이와 유사한 테스트 환경에서 주로 발생하게 되는 것이다. 때문에 OOME가 발생하는 시점에서는 빠르게 대응해야 하는데 경험에 의한 JVM Option을 통한 처리 방법과 Dump 파일의 분석을 통해 대응을 하게 된다.

JVM Option을 통한 처리 방법에서는 실제로 서비스가 안정적으로 돌아가기 위해서 필요한 메모리 사이즈에 비해서 설정되어 있는 메모리 사이즈가 작은 경우에 JVM의 옵션에서 디폴트 사이즈 옵션이 아니라 더 큰 용량의 메모리를 할당할 수 있다. 예시로 command-line option들을 사용해서 힙 메모리를 늘릴 수 있다.
```
-Xms : To set an initial java heap size
-Xmx: To set maximum java heap size
-Xss: To set the Java thread stack size
-Xmn : For setting the size of young generation, rest of the space goes for old generation
```
또 다른 해결 방법으로는 Dump를 분석해 해결하는 방법이 있다. Thread dump, heap dump 분석을 통해서 문제가 발생하는 위치(쓰레드나 객체)를 추적하고 원인이 되는 부분에 대해서 수정할 수 있도록 할 수 있다. 이를 위해서는 jstack과 jmap 명령어를 이용해서 각각 thread dump와 heap dump를 얻을 수 있다.

JVM 옵션을 통해서 OutOfMemory를 해결하는 방식은 서비스 초기에는 도움이 될 수 있으나, 결정적인 해결책이 되기는 어려울 수 있다. 구현 로직이 잘못되어 있다면 근본적인 해결은 하지 못하고 눈가리고 아웅하는 꼴이 되기 쉽상이다. 계속해서 발생하는 OOME에 대해서는 반드시 덤프를 분석해서 그 원인을 찾는 것이 중요하다.
DBCP(DataBase Connection Pool) DB Connection Pool 그것이 알고싶다 SSARTEL-10th/JPTS_bookstudy#12

참고자료에서는 1번의 과정을 DBCP에서 관리하는 커넥션의 수가 부족한 것에 문제가 있다는 것을 확인하고 DBCP 라이브러리와 Apache Commons Pool 라이브러리를 업데이트했다고 한다. 여기서 이야기하는 DBCP는 Database Connection Pool, 즉 DB에 연결해 SQL문을 실행할 수 있는 Statement 객체인 Connection을 관리하는 Pool을 의미한다.

DBCP를 이용해 우리는 미리 생성된 Connection을 쓸 수 있어 생성에 필요한 시간을 소비하지 않을 수 있다. 또한 DB Connection 수를 제한을 통한 과도한 접속으로 인한 서버 자원 고갈 방지, DB 서버 환경 변화에 대한 쉬운 유지보수, Connection 객체 생성에 대한 비용 절감의 효과를 누릴 수 있다.

하지만 이렇게 참고자료에서도 확인할 수 있듯이, 커넥션 풀에서의 커넥션은 한정된 자원이기 때문에 동시 접속자가 많은 경우 클라이언트는 커넥션을 얻지 못하고 대기 상태로 기다려야 한다는 단점이 존재하기도 한다.

이러한 대기 상태나 데드락을 방지하기 위해서는 적절한 커넥션 풀 사이즈를 유지하는 것이 중요하다. 특히 멀티 쓰레드 환경에서 하나의 쓰레드가 여러 개의 커넥션 풀 사이즈를 사용한다고 할 때, 최대 동시 사용 개수만큼의 커넥션이 필요할 것이다.(이와 관련해서는 이슈 12에서 더 자세히)

모니터링 개선 SSARTEL-10th/JPTS_bookstudy#20

그럼 이제 문제가 해결됐는가? (아니다) 그렇다면 우리가 어떤 부분을 놓치고 있었는지 제대로 확인해보기 위해서는 모니터링 개선이 필요하다. 모니터링 개선에 대해서는 지난 이슈들에서 다뤘던 로그와 모니터링 도구에 대해서 생각해보고자 한다.

로그

먼저 문제 발생 원인을 쉽게 파악하기 위해서는 로그를 잘 남기는 것이 중요하다. 이전 이슈였던 로그 어디까지 써봤니? SSARTEL-10th/JPTS_bookstudy#8 에서 우리는 로그 레벨에 대해서 살펴본 적이 있다. log4j 기준으로 ALL, DEBUG, INFO, WARN, ERROR, FATAL, OFF, TRACE의 8단계의 로그 레벨이 존재하는데, 로그를 남기면서 내가 어느 정도 선 까지 로그를 남겨야 하는지, 그리고 지금 내가 중점적으로 봐야 하는 부분은 어디인지 생각하면서 로그를 남겨야 한다. 깔끔한 로그를 위해서 Log4j, slf4j, Lock Back과 같은 로거를 사용하고 예외 처리 시 필요한 내용만을 처리할 수 있도록 노력하는 것이 중요하다.(참고: 책 ch10. 로그는 반드시 필요한 내용만 찍자)
모니터링 도구

또한 모니터링 도구를 이용해서 일정 상황 발생 시 개발자에게 알림을 보내 빠른 트래킹 및 복구를 도울 수 있는데, 모니터링 도구 파헤치기 with. 프로메테우스 ,그라파나 SSARTEL-10th/JPTS_bookstudy#20 에서 살펴본 프로메테우스 를 이용해서도 이러한 알람을 사용할 수 있다. 자세한 과정은 이 글 을 참고하도록 하고, 결론만 이야기해보자면 프로메테우스의 Alertmanager와 서버에서의 알람 규칙 설정을 통해서 알람을 보낼 수 있다. 하지만 그 과정에서 운영되고 있는 환경에 맞춰 이를 적용하기 위해서 관련된 문법과 프로세스에 대해서 공부하는 것이 필요하더라….

문제 원인 파악

그럼 이제 앞의 단계를 통해서 예외 처리나 서비스에서 제외된 장비나 쓰레드 등의 로그를 분석할 수 있다.

스레드 덤프 분석

웹 서버에서는 많은 수의 동시 사용자를 처리하기 위해 수십 ~ 수백 개정도의 스레드를 사용한다. 두 개 이상의 스레드가 같은 자원을 이용할 때는 필연적으로 스레드 간에 경합이 발생하고, 경우에 따라서는 데드 락이 발생할 수도 있다.

스레드 경합때문에 다양한 문제가 발생할 수 있으며, 이런 문제를 분석하기 위해서는 스레드 덤프를 이용해야 한다. 이를 통해 각 스레드의 상태를 정확히 알 수 있다.

따라서 jps -v 를 통해서 Java 애플리케이션 프로세스의 PID를 확인하고, jstack [PID] 를 통해서 스레드 덤프를 획득한다. 분석 과정에서 덤프를 그대로 읽기 어려운 경우 분석툴을 이용하기도 한다.
- 경합과 데드락
  
  경합은 어떤 스레드가 다른 스레드가 획득하고 있는 락(lock)이 해제되기를 기다리는 상태를 말한다. 웹 애플리케이션에서 여러 스레드가 공유 자원에 접근하는 일은 매우 빈번하다. 대표적으로 로그를 기록하는 것도 로그를 기록하려는 스레드가 락을 획득하고 공유 자원에 접근하는 것이다.
  
  데드락은 스레드 경합의 특별한 경우인데, 두 개 이상의 스레드에서 작업을 완료하기 위해서 상대의 작업이 끝나야 하는 상황을 말한다.
메모리 릭 발생 확인 메모리 릭(Memory leak)과 GC SSARTEL-10th/JPTS_bookstudy#16

앞에서도 이야기 했듯이 JVM의 Option을 조정하는 것으로는 완벽한 해결이 되지 않을 수도 있다. 이러한 메모리 릭 상황이 있기 때문이다. 아무리 큰 메모리를 가지고 있어도 메모리 릭이 발생하고 있다면 언젠가는 OOME가 발생하는 시한폭탄을 안고 있는 것일지도 모른다.

하지만 메모리 릭이 어디서 발생하는지 쉽게 알 수 있다면 처음에 짤 때부터 그렇게 안짰겠지..?

그래서 우리는 FULL GC가 일어난 뒤 메모리 공간의 변화를 확인하기 위해서 -Xloggc 옵션을 사용해서 메모리 변화를 확인할 수도 있다.
```
java -Xloggc:/path/to/gc.log -XX:+PrintGCDetails -XX:+PrintGCDateStamps YourMainClass
```
프로메테우스 경고 규칙을 설정해 이 로그가 발생했을 때 alert manager에 해당 메세지를 전달하고 사용자에게 알람을 보낼 수 있다.

이러한 방식 외에도 jstat -gc 옵션, JVM -verbosegc 시작 옵션을 통해서 GC를 모니터링 해볼 수 있다. (참고: https://d2.naver.com/helloworld/6043, 책 ch18.GC가 어떻게 수행되고 있는지 보고 싶다 p.354~358)

비 정상적인 메모리 변화가 관찰된다면 이후 힙 덤프 분석을 통해 어떤 객체가 비정상적으로 행동하는지 확인할 수 있다.

힙 덤프 분석

앞에서 GC 로그를 통해서 메모리 릭이 발생하는 장치를 찾았다. 이제는 Object의 변동을 추적하고 힙 영역의 내용을 확인해야 한다.

jmap: 힙 덤프나 히스토그램을 출력하는 프로그램
jhat: 힙 덤프를 이용해 각 객체를 볼 수 있는 프로그램
VisualVM: 실행되고 있는 JVM의 힙 내용을 볼 수 있는 프로그램

jmap 실행 결과(히스토그램이나 힙 덤프를 분석)

$ jmap -histro:live 8825 | more
num    # instances    #bytes    class name  
----------------------------------------------
1:    3062256    677810312    [C  
2:    3176949    76246776        java.lang.String  
3:    29959    32072704        [I  
4:    380080    27365760        xxx.xxx.common.model.xxxx  
5:    100476    12792648        <constMethodKlass>  
6:    113714    11254840        [Ljava.lang.Object;  
7:    453459    11883016        java.util.HashMap$Entry  
8:    100476    8043896        <methodKlass>  
9:    16052        6917504        [B  
10:    412877    6606032        java.lang.Integer  
11:    141665    6546672        <symbolKlazss>  
12:    10410    5282344        <const PoolKlass>  
13:    12577    4451720        [Ljava.util.HashMap$Entry;  
14:    10410    4351624        <instanceKlassKlass>  
15:    9166    3134352        <constantPoolCacheKlass>  
16:    105039    2520936        java.util.ArrayList  
17:    58627    1876064        xx.xxx.xxx.xxxListEntry  
18:    58027    1856864        java.util.LinkedHashMap$Entry  
19:    21897    1751760        java.lang.reflect.Method

→ 하지만 이러한 방식은 서비스 중인 서버의 히스토그램을 확보해야 하는데, 서비스 중인 서버에서 받지 못했고, 숫자로는 접근이 어려울 수 있어 분석이 어려울 수 있다.

jhat을 이용한다면 다음과 같이 class meta 정보와 생성된 객체 정보를 확인할 수 있다.

c8/469865d0-daa0-467c-abf7-be29e61967dc/Untitled.png)

e9e8c76-9ba9-4b71-a2ea-e2f2a046d32f/Untitled.png)

98-3cbe21a09c85/Untitled.png)

하지만 jhat의 경우 힙 덤프 파일이 크다면 분석이 어려울 수 있다는 단점이 있다.(아예 응답이 없을 수도 있음) (참고: https://soft.plusblog.co.kr/51)

이외에도 VisualVM을 통한 heap dump 분석에서는 프로세스가 진행 중에 Monitoring 에서 Heap Dump 버튼을 클릭하면 실제 Heap Dump 가 생기고 아래 그림과 같이 CPU, Memory, Classes, Thread를 확인할 수 있으며 Visual GC 플러그인을 통해 GC에 대한 현황을 볼 수 있다.

출처: https://liltdevs.tistory.com/167

각 클래스 별 정보도 확인할 수 있으며 비정상적으로 메모리를 많이 차지하고 있는 클래스에 대해서 먼저 접근해 원인을 확인해볼 수 있다.

문제 해결

위의 과정을 통해서 문제가 발생한 Class 를 찾을 수 있었다. 지금부터는 내부 구현에서 어떤 부분에 문제가 있는지를 찾아야 한다.

메모리 릭을 발생 시키는 패턴 메모리 릭(Memory leak)과 GC SSARTEL-10th/JPTS_bookstudy#16
- GC 메모리 영역 밖의 잘못 설계된 객체 참조
  - Static 변수에 의한 객체 참조
  - 현재 자바 스레드 스택 내의 모든 지역 변수 및 매개 변수에 의한 객체 참조
  - JNI 프로그램에 의해 동적으로 만들어지고 제거되는 JNI global 객체 참조
- Autoboxing
  - Integer, Long 같은 래퍼 클래스(Wrapper)를 이용하여, 무의미한 객체를 생성하는 경우
- Using Cache
  - 맵에 캐쉬 데이터를 선언하고 해제하지 않는 경우
- Closing Connections
  - 스트림 객체를 사용하고 닫지 않는 경우
- Using CustiomKey
  - 맵의 키를 사용자 객체로 정의하면서 equals(), hashcode()를 재정의 하지 않아서 같은 키로 착각하여 데이터가 계속 쌓이게 되는 경우
- Mutable Custiom Key
  - 맵의 키를 사용자 객체로 정의하면서 equals(), hashcode()를 재정의 하였지만, 키값이 불변(Immutable) 데이터가 아니라서 데이터 비교시 계속 변하게 되는 경우
- Internal Data Structure
  - 자료구조를 생성하여 사용하면서, 구현 오류로 인해 메모리를 해제하지 않는 경우
위의 패턴들은 주로 발생하는 메모리릭을 발생시키는 패턴이다. 알아두면 이러한 부분이 있는지 먼저 의심해볼 수 있다.
Synchronized (참고: ch08. synchronized는 제대로 알고 써야 한다)

참고자료에서는 멀티 쓰레드 환경에서 Cache 관리에 대해서 Synchronized의 중요성을 보여준다.

웹 기반의 시스템에서 스레드 관련 부분 중 가장 많이 사용하는 것은 synchronized일 것이다. synchronized를 통해서 한번에 하나의 스레드에서만 해당 기능(함수나 블록)에 접근할 수 있도록 만들어준다. synchronized가 제대로 적용되지 않으면 다른 객체를 접근하는 등 참조 및 메모리 해제에 문제가 생길 수 있다. 하지만 Synchronized 키워드를 너무 남발하면 오히려 프로그램 성능저하를 일으킬 수 있으므로 꼭 필요한 부분에서만 Synchronized를 사용해야 한다.
- 하나의 객체를 여러 스레드에서 동시에 사용할 경우
- static으로 선언한 객체를 여러 스레드에서 동시에 사용할 경우
(동기화 적용에 대한 예시: https://coding-start.tistory.com/68)

이러한 문제 해결의 과정은 경험에 의해 학습하는 부분이 크다. 따라서 많은 사례를 접하고 적용해볼 수 있는 능력이 필요하다.

마무리

이렇게 서비스에서 에러발생의 시작에서부터 해결까지 일련의 과정을 살펴보았다. 물론 성능테스트나 부하 테스트를 통해서 이러한 에러 발생을 미연에 방지할 수 있다면 좋겠지만(SSARTEL-10th/JPTS_bookstudy#21) 언제나 클라이언트는 개발자의 생각을 벗어날 수 있다. 그리고 그런 상황에서 성능 개선 및 트러블 슈팅에 대해서 지금까지의 학습 내용이 도움이 될 수 있으면 좋겠다!

0 replies

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Study-Diary

9. Java의 GC에 대해 설명해 주세요. #47

{{title}}

Replies: 5 comments

{{title}}

{{editor}}'s edit

{{editor}}'s edit

{{title}}

{{title}}

{{title}}

{{title}}

Select a reply

Study-Diary

9. Java의 GC에 대해 설명해 주세요. #47

KIMSEI1124 Sep 4, 2024 Maintainer

Replies: 5 comments

KIMSEI1124 Sep 4, 2024 Maintainer Author

G1 GC

GC의 종류

왜 이름이 G1일까?

G1은 어떤 안정성 문제가 있었을까?

G1은 어떻게 기본 GC가 될 수 있었을까?

Ref. #

KIMSEI1124 Sep 4, 2024 Maintainer Author

들어가며

알고리즘

참조 횟수 카운팅 GC ( Reference Counting Garbage Collection )

장점

단점

추적 기반 GC ( Tracing Garbage Collection )

Mark-Sweep Algorithm

Mark-Sweep-Compact Algorithm

점진적 GC ( Incremental GC )

Tri-color Marking Algorithm

Copying Algorithm

Generational Algorithm

정리

결론

Ref

KIMSEI1124 Sep 4, 2024 Maintainer Author

1. 들어가며

GC 란?

Java 의 GC

Stop-The-World

2. Stop-The-World가 발생하는 이유

(1) 메모리 파편화 (Memory fragmentation)

(2) 객체 일관성

3. Compaction

4. Concurrent Mark & Sweep GC (= CMS Collector)

참고자료

KIMSEI1124 Sep 4, 2024 Maintainer Author

서론

본론

KIMSEI1124 Sep 4, 2024 Maintainer Author

시작하며

에러 발생의 시작

모니터링 개선 SSARTEL-10th/JPTS_bookstudy#20

문제 원인 파악

문제 해결

마무리

KIMSEI1124
Sep 4, 2024
Maintainer

KIMSEI1124
Sep 4, 2024
Maintainer Author

KIMSEI1124
Sep 4, 2024
Maintainer Author

KIMSEI1124
Sep 4, 2024
Maintainer Author

KIMSEI1124
Sep 4, 2024
Maintainer Author

KIMSEI1124
Sep 4, 2024
Maintainer Author