목차

개요


순차성에서 벗어나야 하고 컴퓨터에 제한을 가하지 않아야 한다는 것은 분명하다. 데이터의 정의를 명시하고 데이터의 우선순위와 데이터에 관한 설명을 제공해야 한다. 절차가 아니라 관계를 명시해야 한다.

⚠️데이터셋이 매우 크거나 질의 처리량이 매우 높은 경우 복제로는 부족하다.

그렇기에 데이터를 파티션으로 쪼갤 필요가 있는데, 이러한 작업을 샤딩이라 한다.

왜 데이터 파티셔닝을 하는가?

주된 이유는 확장성이다.

**비공유 클러스터(shared-nothing cluster)**에서 다른 파티션은 다른 노드에 저장될 수 있기에 대용량 데이터셋이 여러 디스크에 분산될 수 있고 질의 부하는 여러 프로세서에 분산될 수 있다.

크고 복잡한 질의는 어렵지만 여러 노드에서 병렬 실행도 가능하다.

파티셔닝 지원 데이터베이스

파티셔닝 지원 데이터베이스는 과거 다음 제품들에서 개척되었다.