가상 면접 사례로 배우는 대규모 시스템 설계 기초 16

6장. 키-값 저장소 설계

키-값 저장소(key-value store)는 비관계형 데이터베이스이다. 일반 텍스트 키: "last_loggred_in_at"해시 키: 253DDEC4 키-값 저장소에서 값은 무엇이 오든 상관하지 않는다. 1. 단일 서버 키-값 저장소가장 직관적인 방법 키-값 쌍 전부를 메모리에 해시 테이블로 저장하는 것모든 데이터를 메모리 안에 두는 것이 불가능할 수도 있다는 약점도 있음.해결 방법데이터 압축자주 사용하는 데이터만 메모리에 두고 나머지는 디스크에 저장이렇게 해도, 한대 서버로 부족한 때가 온다. 분산 시스템으로 가자. 2. 분산 키-값 저장소분산 키-값 저장소는 분산 해시 테이블이라고 한다.키-값 쌍을 여러 서버에 분산시키는 탓인데, CAP를 이해해야한다. CAP 정리일관성(consistency): ..

5장. 안정 해시 설계

수평적 규모 확장성을 달성하기 위해서는 요청 또는 데이터를 서버에 균등하게 나누는 것이 중요하다. 해시 키 재배치 문제N개의 개키 서버가 있으면 부하를 균등하게 나누는 보편적 방법은 아래 함수이다. serverIndex = has(key) % N (N은 서버의 개수이다) 장점: 해당 방법은 서버 풀의 크기가 고정되어 있을 때, 그리고 데이터 분포가 균등할 때 잘 동작한다.단점: 서버 하나가 오류가 발생하면, 다른 클라이언트가 데이터가 없는 엉뚱한 서버에 접속하게 된다.  안정 해시안정해시는 해시 테이블 크기가 조정될 때 평균적으로 오직 k/n 개의 키만 재배치하는 해시 기술이다.전통적인 해시 테이블은 슬롯의 수가 바뀌면 거의 대부분 키를 재배치한다.k는 키의 개수n은 슬롯의 개수 > 해시 공간과 해시 링..

4장. 처리율 제한 장치의 설계

네트워크 시스템에서 처리율 제한 장치(rate limiter)는 클라이언트 또는 서비스가 보내는 트래픽의 처리율(rate)을 제어하기 위한 장치다. 예를 들어 특정 기간 내에 전송되는 클라이언트의 요청 횟수를 제한한다.API 요청 횟수가 제한 장치에 정의된 임계치(threshold)를 넘어서면 추가로 도달한 모든 호출은 처리가 중단된다. 사용자는 초당 2회 이상 새 글을 올릴 수 없다.같은 IP 주소로는 하루에 10개 이상의 계정을 생성할 수 없다.같은 디바이스로는 주당 5회 이상 리워드를 요청할 수 없다. 처리율 제한 장치를 두면 좋은 점DOS 공격에 의한 자원 고갈을 방지할 수 있다.비용 절감을 한다. 추가 요청에 대한 처리를 제한하면 서버를 많이 두지 않아도 되고, 우선순위가 높은 API에 더 많은..

3장. 시스템 설계 면접 공략법

시스템 설계 면접에서 "널리 알려진 제품 X를 설계해 보라"는 문제가 나온다. 이는 수천 명의 엔지니어들이 참여하여 개발한 제품을 한 시간 안에 설계할 수 없다.즉, 정말로 설계하라는 것이 아니라 모호한 문제를 풀기 위해 협력하여 해결책을 찾아내는 과정에 대한 시뮬레이션이다. 설계 기술을 시연하는 자리이고, 설계 과정에서 내린 결정들에 대한 방어 능력을 보이는 자리이다. 효과적 면접을 위한 4단계 접근법 1단계 문제 이해 및 설계 범위 확정 답부터 들이밀지 말고, 깊이 생각하며 질문하여 요구사항과 가정들을 분명히 해라. 면접관이 질문을 던지면 질문에 대한 답을 바로 내놓거나, 아니면 스스로 어떤 가정도록 주문할 것이다. 요구사항을 정확히 이해하는데 필요한 질문을 아래와 같이 하자. 구체적으로 어떤 기능을..

1장. 사용자 수에 따른 규모 확장성 - 2편

※  내용이 많아서 1편과 2편으로 나눴습니다. ※ 데이터센터아래는 두 개의데이터 센터를 이용하는 사례이다. 징애가 없는 상황에서 사용자는 가장 가까운 데이터 센터로 안내되는데, 이 절차를 지리적 라우팅(geoDNS-routing)이라고 부른다. 지리적 라우팅에서의 geoDNS는 사용자의 위치에 따라 도메인 이름을 어떤 IP 주소로 변환할지 결정할 수 있도록 해 주는 DNS 서비스이다. 데이터 센터 중 하나에 심각한 장애가 발생하면 모든 트래픽은 장애가 없는 데이터 센터로 전송된다.다중 데이터센터 아키텍처를 만들려면 몇 가지 기술적 난제를 해결해야 한다. 트래픽 우회올바른 데이터 센터로 트래픽을 보내는 효과적인 방법을 찾아야한다.데이터 통기화(synchronization)데이터 센터마다 별도의 데이터베이..

1장. 사용자 수에 따른 규모 확장성 - 1편

※  내용이 많아서 1편과 2편으로 나눴습니다. ※ 느낀점현재 다니고 잇는 회사는 B2B 구조로 고객 사의 서버에 들어가기 때문에 고객 사의 서버 성능이나 할당 받은 자원에 의존해야한다.즉, 서버를 여러 개로 구성하거나 스케일 아웃이나 스케일 업하기 어렵다.그래서 현재 책에서 제시하는 방법들을 적용하기 불가능하기 때문에 애플리케이션 내부 로직으로 성능 및 구조를 개선하는 방안에 대해 고민을 해야겠다.단일서버모든 컴퍼넌트가 단 한대의 서버에서 실행되는 간단한 시스템 설계.웹, 앱, 데이터베이스, 캐시 등이 전부 서버 한 대에서 실행된다.데이터베이스사용자가 늘면 서버 하나로는 충분하지 않아서 여러 서버를 두어야 한다. 하나는 웹/모바일 트랙픽 처리용이고, 다른 하나는 데이터베이스 용이다. 어떤 데이터베이스를..