기능적 요구사항
- 고객이 도서를 주문한다.
- 고객이 주문을 취소할 수 있다.
- 주문이 성공하면 배송을 시작한다.
- 주문이 취소되면 배송을 취소한다.
- 관리자가 신규도서를 등록한다.
- 관리자가 도서 재고를 추가한다.
- 고객은 회원가입을 한다.
- 도서 주문 실적에 따라 고객의 마일리지 및 등급을 관리한다.
- 신규 도서가 등록되면 기존 고객에게 알려준다.
- 도서가 재입고되면 재고부족으로 못 구매한 고객에게 알려준다.
비기능적 요구사항
- 트랜잭션
- 주문 시 재고가 부족할 경우 주문이 되지 않는다. (Sync 호출)
- 장애격리
- 고객/마케팅/배달 관리 기능이 수행되지 않더라도 주문은 365일 24시간 받을 수 있어야 한다 Async (event-driven), Eventual Consistency
- 재고시스템이 과중되면 사용자를 잠시동안 받지 않고 재접속하도록 유도한다 Circuit breaker, fallback
- MSAEz 로 모델링한 이벤트스토밍 결과:
1. 고객이 도서를 주문한다.
2. 고객이 주문을 취소할 수 있다.
3. 주문이 성공하면 배송을 시작한다.
4. 주문이 취소되면 배송을 취소한다.
1. 관리자가 신규도서를 등록한다.
2. 신규 도서가 등록되면 기존 고객에게 알려준다.
3. 관리자는 도서 재고를 추가한다.
4. 도서 재고가 추가되면 재고부족으로 못 구매한 고객에게 알려준다.
1. 고객은 회원가입을 한다.
2. 도서 주문 실적에 따라 고객의 마일리지 및 등급을 관리한다.
1. 신규 주문이 들어올 시 재고를 Sync 호출을 통해 확인하여 결과에 따라 주문 성공 여부가 결정.
2. 고객/마케팅/배달 각각의 기능은 Async (event-driven) 방식으로 통신, 장애 격리가 가능.
3. MyPage 를 통해 고객이 주문의 상태를 확인.
- Chris Richardson, MSA Patterns 참고하여 Inbound adaptor와 Outbound adaptor를 구분함
- 호출관계에서 PubSub 과 Req/Resp 를 구분함
- 서브 도메인과 바운디드 컨텍스트의 분리: 각 팀의 KPI 별로 아래와 같이 관심 구현 스토리를 나눠가짐
분석/설계 단계에서 도출된 헥사고날 아키텍처에 따라, 각 BC별로 대변되는 마이크로 서비스들을 스프링부트로 구현하였다. 구현한 각 서비스를 로컬에서 실행하는 방법은 아래와 같다 (각자의 포트넘버는 8081 ~ 808n 이다)
cd gateway
mvn spring-boot:run
cd Book
mvn spring-boot:run
cd customer
mvn spring-boot:run
cd CustomerCenter
mvn spring-boot:run
cd Delivery
mvn spring-boot:run
cd Order
mvn spring-boot:run
- 각 서비스내에 도출된 핵심 Aggregate Root 객체를 Entity 로 선언하였다: (예시는 Order 마이크로 서비스). 이때 가능한 현업에서 사용하는 언어 (유비쿼터스 랭귀지)를 그대로 사용하려고 노력했다.
package onlinebookstore;
import javax.persistence.*;
import org.springframework.beans.BeanUtils;
import java.util.Date;
@Entity
@Table(name="Order_table")
public class Order {
@Id
@GeneratedValue(strategy=GenerationType.IDENTITY)
private Long orderId;
private Long bookId;
private Integer qty;
private Integer price;
private Integer paymentId;
private Long customerId;
private Date orderDt;
private String status;
public Long getOrderId() {
return orderId;
}
public void setOrderId(Long orderId) {
this.orderId = orderId;
}
public Long getBookId() {
return bookId;
}
public void setBookId(Long bookId) {
this.bookId = bookId;
}
public Integer getQty() {
return qty;
}
public void setQty(Integer qty) {
this.qty = qty;
}
public Integer getPrice() {
return price;
}
public void setPrice(Integer price) {
this.price = price;
}
public Integer getPaymentId() {
return paymentId;
}
public void setPaymentId(Integer paymentId) {
this.paymentId = paymentId;
}
public Long getCustomerId() {
return customerId;
}
public void setCustomerId(Long customerId) {
this.customerId = customerId;
}
public Date getOrderDt() {
return orderDt;
}
public void setOrderDt(Date orderDt) {
this.orderDt = orderDt;
}
public String getStatus() {
return status;
}
public void setStatus(String status) {
this.status = status;
}
}
- Entity Pattern 과 Repository Pattern 을 적용하여 JPA 를 통하여 다양한 데이터소스 유형 (MySQL or h2) 에 대한 별도의 처리가 없도록 데이터 접근 어댑터를 자동 생성하기 위하여 Spring Data REST 의 RestRepository 를 적용하였다. (로컬개발환경에서는 MySQL/H2를, 쿠버네티스에서는 SQLServer/H2를 각각 사용하였다)
package onlinebookstore;
import org.springframework.data.repository.PagingAndSortingRepository;
import org.springframework.data.rest.core.annotation.RepositoryRestResource;
@RepositoryRestResource(collectionResourceRel="orders", path="orders")
public interface OrderRepository extends PagingAndSortingRepository<Order, Long>{
}
- 적용 후 REST API 의 테스트
# Order 서비스의 주문처리
http POST localhost:8088/orders bookId=1 qty=1 customerId=1
# Book 서비스의 재입고
http PATCH http://localhost:8088/books/reStock bookId=1 stock=1000
# 주문 상태 확인
http GET localhost:8088/myPages/
- 고객이 도서를 주문한다.
- 고객이 주문을 취소할 수 있다.
- 주문이 성공하면 배송을 시작한다.
- 주문이 취소되면 배송을 취소한다.
--> 주문과 배송 시스템에서 각각 취소되었음을 확인하였음
- 관리자가 신규도서를 등록한다.
- 관리자가 도서 재고를 추가한다.
- 고객은 회원가입을 한다.
- 도서 주문 실적에 따라 고객의 마일리지 및 등급을 관리한다.
--> 주문했던 고객의 등급과 마일리지가 올라간 것을 알 수 있다.
- 신규 도서가 등록되면 기존 고객에게 알려준다.
- 도서가 재입고되면 재고부족으로 못 구매한 고객에게 알려준다.
- 트랜잭션
주문 시 재고가 부족할 경우 주문이 되지 않는다. (Sync 호출)
--> 재고보다 많은 양(qty)을 주문하였을 경우 OutOfStock으로 처리한다.
- 장애격리 고객/고객센터/배달 관리 기능이 수행되지 않더라도 주문은 365일 24시간 받을 수 있어야 한다 Async (event-driven), Eventual Consistency
--> 고객/고객센터/배달 마이크로서비스를 모두 내리고 주문을 생성했을때, 정상적으로 주문됨을 확인함
- 재고시스템이 과중되면 사용자를 잠시동안 받지 않고 재접속하도록 유도한다 Circuit breaker, fallback
--> 뒤의 Hystrix를 통한 Circuit Break 구현에서 검증하도록 한다.
분석/설계 및 구현을 통해 이벤트를 Publish/Subscribe 하도록 구현하였다. [Publish]
Materialized View 를 구현하여, 타 마이크로서비스의 데이터 원본에 접근없이(Composite 서비스나 조인SQL 등 없이) 도 내 서비스의 화면 구성과 잦은 조회가 가능하게 구현해 두었다.
본 프로젝트에서 View 역할은 CustomerCenter 서비스가 수행한다.
CQRS를 구현하여 주문건에 대한 상태는 Order 마이크로서비스의 접근없이 CustomerCenter의 마이페이지를 통해 조회할 수 있도록 구현하였다.
- 주문(ordered) 실행 후 myPage 화면
- 주문취소(OrderCancelled) 후 myPage 화면
위와 같이 주문을 하게되면 Order -> Book -> Order -> Delivery 로 주문이 Assigend 되고
주문 취소가 되면 Status가 "Delivery Cancelled"로 Update 되는 것을 볼 수 있다.
각 이벤트 건(메시지)이 어떤 Policy를 처리할 때 어떤건에 연결된 처리건인지를 구별하기 위한 Correlation-key를 제대로 연결하였는지를 검증하였다.
API GateWay를 통하여 마이크로 서비스들의 진입점을 통일할 수 있다. 다음과 같이 GateWay를 적용하여 모든 마이크로서비스들은 http://localhost:8088/{context}로 접근할 수 있다.
server:
port: 8088
---
spring:
profiles: default
cloud:
gateway:
routes:
- id: CustomerCenter
uri: http://localhost:8081
predicates:
- Path= /myPages/**
- id: Book
uri: http://localhost:8082
predicates:
- Path=/books/**
- id: Order
uri: http://localhost:8083
predicates:
- Path=/orders/**
- id: Delivery
uri: http://localhost:8084
predicates:
- Path=/deliveries/**
- id: customer
uri: http://localhost:8085
predicates:
- Path=/customers/**
globalcors:
corsConfigurations:
'[/**]':
allowedOrigins:
- "*"
allowedMethods:
- "*"
allowedHeaders:
- "*"
allowCredentials: true
---
spring:
profiles: docker
cloud:
gateway:
routes:
- id: customercenter
uri: http://customercenter:8080
predicates:
- Path= /marketingTargets/**,/outOfStockOrders/**,/myPages/**
- id: Book
uri: http://Book:8080
predicates:
- Path=/books/**
- id: Order
uri: http://Order:8080
predicates:
- Path=/orders/**
- id: Delivery
uri: http://Delivery:8080
predicates:
- Path=/deliveries/**
- id: customer
uri: http://customer:8080
predicates:
- Path=/customers/**
globalcors:
corsConfigurations:
'[/**]':
allowedOrigins:
- "*"
allowedMethods:
- "*"
allowedHeaders:
- "*"
allowCredentials: true
server:
port: 8080
각 마이크로서비스의 다양한 요구사항에 능동적으로 대처하고자 최적의 구현언어 및 DBMS를 선택할 수 있다. OnlineBookStore에서는 다음과 같이 2가지 DBMS를 적용하였다.
- MySQL(쿠버네티스에서는 SQLServer) : Book, CustomerCenter, Customer, Delivery
- H2 : Order
# (Book, CustomerCenter, Customer, Delivery) application.yml
spring:
profiles: default
datasource:
driver-class-name: com.mysql.cj.jdbc.Driver
url: jdbc:mysql://localhost:3306/bookdb?useSSL=false&characterEncoding=UTF-8&serverTimezone=UTC&allowPublicKeyRetrieval=true
username: *****
password: *****
spring:
profiles: docker
datasource:
driver-class-name: com.microsoft.sqlserver.jdbc.SQLServerDriver
url: jdbc:sqlserver://skccteam2.database.windows.net:1433;database=bookstore;encrypt=true;trustServerCertificate=false;hostNameInCertificate=*.database.windows.net;loginTimeout=30;
username: ${SQLSERVER_USERNAME}
password: ${SQLSERVER_PASSWORD}
...
# (Order) application.yml
spring:
profiles: default
datasource:
driver-class-name: org.h2.Driver
url: jdbc:h2:file:/data/orderdb
username: *****
password:
분석단계에서의 조건 중 하나로 주문(Order)->책 재고 확인(Book) 간의 호출은 동기식 일관성을 유지하는 트랜잭션으로 처리하기로 하였다. 호출 프로토콜은 RestController를 FeignClient 를 이용하여 호출하도록 한다.
- 재고 확인 서비스를 호출하기 위하여 Stub과 (FeignClient) 를 이용하여 Service 대행 인터페이스 (Proxy) 를 구현
# (Order) BookService.java
package onlinebookstore.external;
@FeignClient(name="Book", url="${api.url.book}")
public interface BookService {
@RequestMapping(method= RequestMethod.GET, path="/books/chkAndModifyStock")
public boolean chkAndModifyStock(@RequestParam("bookId") Long bookId,
@RequestParam("qty") int qty);
}
- 주문을 받은 직후 재고(Book) 확인을 요청하도록 처리
# BookController.java
package onlinebookstore;
@RestController
public class BookController {
@Autowired BookRepository bookRepository;
@RequestMapping(value = "/books/chkAndModifyStock",
method = RequestMethod.GET,
produces = "application/json;charset=UTF-8")
public boolean chkAndModifyStock(@RequestParam("bookId") Long bookId,
@RequestParam("qty") int qty)
throws Exception {
boolean status = false;
Optional<Book> bookOptional = bookRepository.findByBookId(bookId);
if (bookOptional.isPresent()) {
Book book = bookOptional.get();
// 현 재고보다 주문수량이 적거나 같은경우에만 true 회신
if( book.getStock() >= qty){
status = true;
book.setStockBeforeUpdate(book.getStock());
book.setStock(book.getStock() - qty); // 주문수량만큼 재고 감소
bookRepository.save(book);
}
}
return status;
}
- 동기식 호출에서는 호출 시간에 따른 타임 커플링이 발생하며, 재고 관리 시스템이 장애가 나면 주문도 못받는다는 것을 확인:
# 책 재고 관리 (Book) 서비스를 잠시 내려놓음 (ctrl+c)
#주문처리
http POST localhost:8088/orders bookId=1 qty=10 customerId=1 #Fail
http POST localhost:8088/orders bookId=2 qty=20 customerId=2 #Fail
#재고 관리 서비스 재기동
cd Book
mvn spring-boot:run
#주문처리
http POST localhost:8088/orders bookId=1 qty=10 customerId=1 #Success
http POST localhost:8088/orders bookId=2 qty=20 customerId=2 #Success
추후 운영단계에서는 Circuit Breaker를 이용하여 재고 관리 시스템에 장애가 발생하여도 주문 접수는 가능하도록 개선할 예정이다.
주문이 이루어진 후에 배송 시스템으로 이를 알려주는 행위는 동기식이 아니라 비 동기식으로 처리하여 배송 시스템의 처리를 위하여 주문이 블로킹 되지 않도록 처리한다.
- 이를 위하여 주문이력에 기록을 남긴 후에 곧바로 주문이 완료되었다는 도메인 이벤트를 카프카로 송출한다(Publish)
package onlinebookstore;
@Entity
@Table(name="Order_table")
public class Order {
...
@PostPersist
public void onPostPersist(){
if(this.status.equals("Ordered"))
{
Ordered ordered = new Ordered();
BeanUtils.copyProperties(this, ordered);
ordered.publishAfterCommit();
System.out.println("** PUB :: Ordered : orderId="+this.orderId);
}
else
{
OutOfStocked outOfStocked = new OutOfStocked();
BeanUtils.copyProperties(this, outOfStocked);
outOfStocked.publish();
System.out.println("** PUB :: OutOfStocked : orderId="+this.orderId);
}
}
}
- 배송관리 서비스에서는 주문 완료 이벤트에 대해서 이를 수신하여 자신의 정책을 처리하도록 PolicyHandler 를 구현한다:
package onlinebookstore;
...
@Service
public class PolicyHandler{
@StreamListener(KafkaProcessor.INPUT)
public void wheneverOrdered_Delivery(@Payload Ordered ordered){
if(!ordered.validate()) return;
System.out.println("\n\n##### listener Delivery : " + ordered.toJson() + "\n\n");
Delivery delivery = new Delivery();
delivery.setOrderid(ordered.getOrderId());
delivery.setDeliverystatus("Order-Delivery");
deliveryRepository.save(delivery);
}
}
배송 시스템은 주문/재고관리와 완전히 분리되어있으며, 이벤트 수신에 따라 처리되기 때문에, 배송 시스템이 유지보수로 인해 잠시 내려간 상태라도 주문을 받는데 문제가 없다:
# 배송관리 서비스 (Delivery) 를 잠시 내려놓음 (ctrl+c)
#주문처리
http POST localhost:8088/orders bookId=1 qty=10 customerId=1 #Success
http POST localhost:8088/orders bookId=2 qty=20 customerId=2 #Success
#주문상태 확인
http localhost:8088/orders # 주문상태 안바뀜 확인
#배송 서비스 기동
cd Delivery
mvn spring-boot:run
#주문상태 확인
http localhost:8080/orders # 모든 주문의 상태가 "Delivery Started"로 확인
- git에서 소스 가져오기
git clone https://github.com/aramidhwan/OnlineBookStore.git
- Build 하기
cd /book
mvn package
cd ../customer
mvn package
cd ../customercenter
mvn package
cd ../order
mvn package
cd ../delivery
mvn package
cd ../gateway
mvn package
- Docker Image build/Push/
cd ../gateway
docker build -t skccteam2acr.azurecr.io/gateway:latest .
docker push skccteam2acr.azurecr.io/gateway:latest
cd ../book
docker build -t skccteam2acr.azurecr.io/book:latest .
docker push skccteam2acr.azurecr.io/book:latest
cd ../customer
docker build -t skccteam2acr.azurecr.io/customer:latest .
docker push skccteam2acr.azurecr.io/customer:latest
cd ../customercenter
docker build -t skccteam2acr.azurecr.io/customercenter:latest .
docker push skccteam2acr.azurecr.io/customercenter:latest
cd ../order
docker build -t skccteam2acr.azurecr.io/order:latest .
docker push skccteam2acr.azurecr.io/order:latest
cd ../delivery
docker build -t skccteam2acr.azurecr.io/delivery:latest .
docker push skccteam2acr.azurecr.io/delivery:latest
- yml파일 이용한 deploy
kubectl apply -f deployment.yml
- OnlineBookStore/Order/kubernetes/deployment.yml 파일
apiVersion: apps/v1
kind: Deployment
metadata:
name: order
namespace: onlinebookstore
labels:
app: order
spec:
replicas: 1
selector:
matchLabels:
app: order
template:
metadata:
labels:
app: order
spec:
containers:
- name: order
image: skccteam2acr.azurecr.io/order:latest
ports:
- containerPort: 8080
readinessProbe:
httpGet:
path: '/actuator/health'
port: 8080
initialDelaySeconds: 10
timeoutSeconds: 2
periodSeconds: 5
failureThreshold: 10
livenessProbe:
httpGet:
path: '/actuator/health'
port: 8080
initialDelaySeconds: 120
timeoutSeconds: 2
periodSeconds: 5
failureThreshold: 5
env:
- name: configmap
valueFrom:
configMapKeyRef:
name: resturl
key: url
resources:
requests:
cpu: 300m
# memory: 256Mi
limits:
cpu: 500m
# memory: 256Mi
- deploy 완료
-
시스템별로 변경 가능성이 있는 설정들을 ConfigMap을 사용하여 관리
-
OnlineBookStore에서는 주문에서 책 재고 서비스 호출 시 "호출 주소"를 ConfigMap 처리하기로 결정
-
Java 소스에 "호출 주소"를 변수(api.url.book) 처리(/Order/src/main/java/onlinebookstore/external/BookService.java)
- application.yml 파일에서 api.url.book을 ConfigMap과 연결
- ConfigMap 생성
kubectl create configmap resturl --from-literal=url=http://Book:8080
- Deployment.yml 에 ConfigMap 적용
- DBMS 연결에 필요한 username 및 password는 민감한 정보이므로 Secret 처리하였다.
- deployment.yml에서 env로 설정하였다.
- 쿠버네티스에서는 다음과 같이 Secret object를 생성하였다.
- Spring FeignClient + Hystrix를 사용하여 구현함
시나리오는 주문(Order)-->재고(Book) 확인 시 주문 요청에 대한 재고확인이 3초를 넘어설 경우 Circuit Breaker 를 통하여 장애격리.
- Hystrix 를 설정: FeignClient 요청처리에서 처리시간이 3초가 넘어서면 CB가 동작하도록 (요청을 빠르게 실패처리, 차단) 설정 추가로, 테스트를 위해 1번만 timeout이 발생해도 CB가 발생하도록 설정
# application.yml
- 호출 서비스(주문)에서는 재고API 호출에서 문제 발생 시 주문건을 OutOfStock 처리하도록 FallBack 구현
# (Order) BookService.java
- 피호출 서비스(책재고:Book)에서 테스트를 위해 bookId가 2인 주문건에 대해 sleep 처리
# (Book) BookController.java
- 서킷 브레이커 동작 확인:
bookId가 1번 인 경우 정상적으로 주문 처리 완료
# http POST http://52.141.32.129:8080/orders bookId=1 customerId=4 qty=1
bookId가 2번 인 경우 CB에 의한 timeout 발생 확인 (Order건은 OutOfStocked 처리됨)
# http POST http://52.141.32.129:8080/orders bookId=2 customerId=4 qty=1
time 아웃이 연달아 2번 발생한 경우 CB가 OPEN되어 Book 호출이 아예 차단된 것을 확인 (테스트를 위해 circuitBreaker.requestVolumeThreshold=1 로 설정)
일정시간 뒤에는 다시 주문이 정상적으로 수행되는 것을 알 수 있다.
- 운영시스템은 죽지 않고 지속적으로 CB 에 의하여 적절히 회로가 열림과 닫힘이 벌어지면서 Thread 자원 등을 보호하고 있음을 보여줌.
주문 서비스가 몰릴 경우를 대비하여 자동화된 확장 기능을 적용하였다.
- 주문서비스에 대한 replica 를 동적으로 늘려주도록 HPA 를 설정한다. 설정은 테스트를 위해 CPU 사용량이 50프로를 넘어서면 replica 를 3개까지 늘려준다:
hpa.yml
- deployment.yml에 resource 관련 설정을 추가해 준다.
deployment.yml
- 100명이 60초 동안 주문을 넣어준다.
siege -c100 -t60S -r10 --content-type "application/json" 'http://52.141.32.129:8080/orders POST {"bookId":"1","customerId":"1","qty":"1"}
- 오토스케일이 어떻게 되고 있는지 모니터링을 걸어둔다:
kubectl get deploy -l app=order -w
- 어느정도 시간이 흐른 후 스케일 아웃이 벌어지는 것을 확인할 수 있다.
- siege 의 로그를 보면 오토스케일 확장이 일어나며 주문을 100% 처리완료한 것을 알 수 있었다.
** SIEGE 4.0.4
** Preparing 100 concurrent users for battle.
The server is now under siege...
Lifting the server siege...
Transactions: 2904 hits
Availability: 100.00 %
Elapsed time: 59.64 secs
Data transferred: 0.90 MB
Response time: 2.02 secs
Transaction rate: 48.69 trans/sec
Throughput: 0.02 MB/sec
Concurrency: 98.52
Successful transactions: 2904
Failed transactions: 0
Longest transaction: 13.62
Shortest transaction: 0.11
-
Zero-downtime deploy 확인을 위해 seige 로 1명이 지속적인 고객등록 작업을 수행함
siege -c1 -t180S -r100 --content-type "application/json" 'http://localhost:8080/customers POST {"name": "CUSTOMER99","email":"[email protected]"}'
새 버전으로 배포(이미지를 v2.0으로 변경)
kubectl set image deployment customer customer=skccteam2acr.azurecr.io/customer:v2.0
customer 이미지가 변경되는 과정 (POD 상태변화)
customer 이미지가 v2.0으로 변경되었임을 확인
- seige 의 화면으로 넘어가서 Availability가 100% 인지 확인 (무정지 배포 성공)
** SIEGE 4.0.4
** Preparing 1 concurrent users for battle.
The server is now under siege...
Lifting the server siege...
Transactions: 15793 hits
Availability: 100.00 %
Elapsed time: 179.41 secs
Data transferred: 3.31 MB
Response time: 0.01 secs
Transaction rate: 88.03 trans/sec
Throughput: 0.02 MB/sec
Concurrency: 0.99
Successful transactions: 0
Failed transactions: 0
Longest transaction: 0.29
Shortest transaction: 0.00
- Self-healing 확인을 위한 Liveness Probe 옵션 변경 (Port 변경)
onlinebookstore/delivery/kubernetes/deployment.yml
- Delivery pod에 Liveness Probe 옵션 적용 확인
- Liveness 확인 실패에 따른 retry발생 확인
이상으로 12가지 체크포인트가 구현 및 검증 완료되었음 확인하였다.