컴퓨터 지식 네트워크 - 컴퓨터 지식 - GB2312로 인코딩된 문자는 컴퓨터에 저장될 때 여러 바이트를 사용합니다.

GB2312로 인코딩된 문자는 컴퓨터에 저장될 때 여러 바이트를 사용합니다.

각 한자는 2바이트를 차지합니다. 컴퓨터에서 GB2312 문자의 저장은 지역 코드를 기준으로 합니다. 한자의 지역 코드와 비트 코드는 각각 하나의 저장 단위를 차지하며, 각 한자는 두 개의 저장 단위를 차지합니다. GB2312는 일반적으로 사용되는 6763개의 중국어 문자와 682개의 비한자 문자로 구성된 간체 중국어 문자 집합입니다. 한자는 사용빈도에 따라 두 가지 등급으로 나누어진다.

문자 수가 상대적으로 많기 때문에 GB2312는 2차원 매트릭스 인코딩 방법을 사용하여 모든 문자를 인코딩합니다. 먼저 94개의 행과 94개의 열로 구성된 정사각형 행렬을 구성합니다. 각 행을 "영역"이라고 하고 각 열을 "비트"라고 합니다. 그런 다음 아래 표의 규칙에 따라 정사각형 행렬에 모든 문자를 채웁니다.

이렇게 모든 문자는 정사각형 행렬에서 고유한 위치를 가지며, 이 위치는 지역 코드와 비트 번호의 조합으로 표시될 수 있으며 이를 문자의 지역 코드라고 합니다. 위치코드는 캐릭터의 위치와 완전히 일치하므로, 위치코드와 캐릭터 사이에도 일대일 대응이 존재합니다. 이러한 방식으로 모든 문자는 해당 위치 코드를 통해 디지털로 인코딩된 정보로 변환될 수 있습니다.

확장 정보:

GB2312 코딩 범위: A1A1-FEFE, 그 중 한자 코딩 범위: B0A1-F7FE. GB2312 인코딩은 1980년 중국 국가 표준 관리국에서 발표한 최초의 중국어 문자 인코딩 국가 표준입니다. 동시에 GB2312 인코딩에는 라틴 문자, 그리스 문자, 일본어 히라가나 및 가타카나 문자, 러시아어 키릴 문자를 포함한 682개의 전자 문자가 포함됩니다.

파티션 표현: GB2312 인코딩은 수집된 문자에 대해 최대 94개 영역으로 "파티셔닝" 처리를 수행하며 각 영역에는 94비트 및 최대 8836개의 코드 포인트가 포함됩니다. 이 표현을 위치 코드라고도 합니다.

01-09 영역에는 한자를 제외하고 682자가 포함되어 있습니다.

10~15번 영역은 공백 영역으로 사용되지 않습니다.

영역 16-55에는 병음별로 정렬된 1급 중국어 문자 3,755개가 포함되어 있습니다.

영역 56-87에는 부수/획을 기준으로 정렬된 3008개의 2급 한자가 포함되어 있습니다.

88~94번 영역은 공백 영역으로 사용되지 않습니다.

바이두 백과사전-문자 인코딩

上篇: 1 iPhone 6S가 때때로 정전기로 인해 충전되지 않는 이유는 무엇입니까? 下篇: 2017 년 국가 법정 휴가
관련 내용