데이터 중복이란 무엇인가요?
데이터 중복이란 데이터 간의 중복을 의미하며, 이는 동일한 데이터가 다른 데이터 파일에 저장되는 현상이라고도 할 수 있습니다. 데이터 독립성을 높이고 데이터 중복성을 줄이는 것은 전사적 정보 자원 관리 및 대규모 정보 시스템의 성공을 위한 전제 조건이라고 할 수 있습니다.
메시지를 전송하는 데 사용된 데이터 비트 수와 메시지에 포함된 실제 정보의 데이터 비트 수의 차이입니다. 데이터 압축은 불필요한 중복성을 제거하기 위해 사용하는 방법이고, 체크섬은 채널 용량이 제한된 잡음이 많은 채널에서의 통신에서 오류 정정을 위해 중복성을 추가하는 데 사용되는 방법입니다.
추가 정보:
1. 데이터 목적
(1) 처리 속도를 높이기 위해 동일한 데이터가 다른 위치에 저장됩니다. 예를 들어, 동일한 정보의 다른 내용이 병렬로 처리될 수도 있고, 동일한 정보가 다른 방식으로 처리될 수도 있습니다.
(2) 처리를 용이하게 하기 위해 동일한 정보가 위치에 따라 다르게 표현됩니다. 예를 들어, 다양한 언어로 된 책 버전이 있습니다.
2. 데이터 중복에 대한 관련 공식
(1) 무작위 과정의 가장 일반적인 형태는 n으로 나누는 첫 번째 기호의 결합 엔트로피입니다. 무한대의 한계:
(2) 소스의 절대 정보 비율:
(3) 절대 정보 중복성은 다음과 같이 정의됩니다.
Baidu Encyclopedia - 데이터 중복