분산 데이터베이스란 무엇이며, 장점과 단점은 무엇인가요?
1. 분산 데이터베이스는 데이터베이스의 일종으로 데이터베이스 기술과 네트워크 기술이 결합된 것입니다.
2. 각각의 장점과 단점이 있습니다. 분산 데이터베이스는 논리적으로 분할된 데이터베이스와 물리적으로 분산된 데이터베이스, 논리적으로 분산된 데이터베이스와 물리적으로 중앙 집중화된 데이터베이스로 구분됩니다.
예, 분산된 데이터 파일은 데이터베이스 관리 및 유지 관리를 용이하게 합니다.
분산 데이터베이스 시스템은 일반적으로 더 작은 컴퓨터 시스템을 사용합니다. 각 컴퓨터는 별도의 장소에 배치될 수 있습니다. 각 컴퓨터는 DBMS의 전체 복사본을 가지며 서로 다른 위치에 있는 자체 로컬 데이터베이스를 갖습니다. 네트워크를 통해 서로 정보를 공유하고 함께 완전한 글로벌 대규모 데이터베이스를 형성합니다.
이러한 데이터베이스 구성 방식은 물리적 중심의 데이터베이스 구성의 약점을 극복합니다.
1. 우선, 대부분의 데이터베이스 액세스 작업이 다른 위치의 데이터베이스 액세스가 아닌 로컬 데이터베이스에 대한 것이므로 데이터 전송 비용이 절감됩니다. 네트워크에 장애가 발생하더라도 로컬 데이터베이스에 대한 작업은 여전히 허용되며, 한 위치의 장애는 해당 위치의 데이터에 액세스할 때만 다른 위치의 처리 작업에 영향을 미치지 않기 때문에 시스템의 신뢰성이 많이 향상되었습니다.
3. 시스템을 확장하기가 쉽습니다. 새로운 로컬 데이터베이스를 추가하거나 특정 위치에 적절한 소형 컴퓨터를 확장하는 것이 쉽습니다. 그러나 일부 기능은 가격이 더 높습니다.
예를 들어 여러 위치에서 활동을 조정하기 위해 트랜잭션 관리 성능은 중앙 데이터베이스보다 비용이 더 많이 들고 다른 많은 이점도 상쇄됩니다.
분산형 데이터베이스 시스템의 주요 특징:
1. 대부분의 처리는 로컬에서 완료됩니다.
2. 다양한 장소의 컴퓨터가 데이터 통신 네트워크로 연결됩니다.
3. 중앙 데이터베이스의 약점을 극복: 데이터 전송 비용을 줄입니다.
4. 시스템의 일부가 실패하면 다른 부분이 계속될 수 있습니다.
5. 각 데이터베이스의 위치가 투명하여 시스템 확장이 용이합니다.
6. 트랜잭션 관리 수준이 높습니다;
데이터 샤딩
유형:
(1) 수평 샤딩: 전역 관계의 모든 튜플을 다음에 따라 여러 개의 분리된 하위 집합으로 나눕니다. 특정 조건에 대한 하위 집합은 관계의 일부입니다.
(2) 수직 샤딩: 전역 관계의 속성 세트를 여러 하위 세트로 나누고 이러한 하위 세트에 대해 프로젝션 작업을 수행합니다. 각 프로젝션을 수직 샤딩이라고 합니다.
(3) 파생된 샤딩: 파생된 수평 샤딩이라고도 합니다. 즉, 수평 샤딩의 조건은 이 관계 속성의 조건이 아니라 다른 관계 속성의 조건입니다.
(4) 하이브리드 샤딩: 위의 세 가지 방법을 혼합한 것입니다. 가로로 나눈 다음 세로로 나누거나, 세로로 나눈 다음 가로로 나누는 등의 형태로 나눌 수 있지만 결과는 다릅니다.
조건:
(1) 완전성 조건: 글로벌 관계의 모든 데이터는 프래그먼트에 매핑되어야 하며, 글로벌 관계에 속하지만 속하지 않는 데이터는 매핑되지 않아야 합니다. 조각은 허용되지 않습니다.
(2) 재구성 가능성 조건: 동일한 전역 관계의 다양한 단편에서 전역 관계를 재구성할 수 있음이 보장되어야 합니다. 수평 샤딩의 경우 통합 작업을 사용하여 전역 관계를 재구성할 수 있으며, 수직 샤딩의 경우 조인 작업을 사용하여 전역 관계를 재구성할 수 있습니다.
(3) 분리 조건: 전역 관계가 분할된 후 얻은 데이터 조각이 서로 겹치지 않아야 합니다(수직 샤딩의 기본 키 제외).
데이터 배포 방법
(1) 중앙 집중식: 모든 데이터 조각이 동일한 사이트에 배열됩니다.
(2) 분할 유형: 모든 데이터의 복사본은 하나만 있으며 여러 논리적 조각으로 나뉘며 각 논리적 조각은 특정 사이트에 할당됩니다.
(4) 전체 복제: 데이터가 각 사이트에 반복적으로 저장됩니다. 즉, 각 장소에는 데이터의 완전한 사본이 있습니다.
(5) 하이브리드: 분할 복제와 전체 복제 간의 할당 방법입니다.
현재 분산 데이터베이스 할당 설계에서는 유전자 알고리즘, 어닐링 메커니즘 등과 같은 최적의 솔루션을 찾기 위해 점점 더 많은 알고리즘이 사용됩니다.