컴퓨터 지식 네트워크 - 컴퓨터 프로그래밍 - GBK 글꼴이란 무엇입니까? 일반 서체와 어떤 차이가 있나요?

GBK 글꼴이란 무엇입니까? 일반 서체와 어떤 차이가 있나요?

GBK 는 또 다른 한자 코딩 표준인' 한자 내부 코드 확장 사양 (GBK)', 영어 이름 Chinese internal code specification, 중화 인민 * * * 및 국가 정보 기술 표준화 기술위원회 국가기술감독국 표준화사, 전자공업부 과학기술 및 품질감독사는 1995 년 12 월 15 일 공동으로 기술감독서 [1995] 229 호 문건 형식으로 기술규범지도문서로 확정해 발표와 실시를 진행했다. 이 버전의 GBK 사양은 버전 1.0 입니다. GB 는' 국가 표준' 이고, K 는' 확장' 된 한어병음의 첫 글자이다.

GBK 는 GB 2312 인코딩과 역호환되며 ISO 10646.1 국제 표준을 지원합니다. 이는 후자로의 전환 과정에서 계승된 표준입니다.

ISO 10646 은 국제 표준화기구 ISO 가 발표한 코딩 표준인 UCS (universal multilpe-octet coded character set) 로 대륙은' 범용 8 비트 인코딩 문자 세트' 로 번역된다 ISO 10646.1 은 이 표준의 첫 번째 부분인' 아키텍처 및 기본 다국어 평면' 입니다. 우리나라는 1993 년 GB 13000.1 국가 표준으로 인정받았다 (즉, GB 13000.1 은 ISO 10646.1 과 동일).

ISO 10646 은 전 세계 다양한 언어의 서면 형식과 추가 기호가 포함된 코딩 시스템입니다. 이 중 한자 부분은' 한중일 통일한자' (c 는 중국, j 는 일본, k 는 북한) 라고 불린다. 그 중 중국 부분에는 중국 본토의 GB 2312, GB 12345,' 현대한어 공통자표' 등 법정표준에서 유래한 한자와 기호, 대만의 CNS 11643 표준에서 1, 2 글자 (기본적으로 BIG-5 인코딩과 동일), 14 번째 글자 그대로의 한자와 기호가 포함되어 있다.

하나, 단어

GBK 사양에는 ISO 10646.1 의 모든 한중일 한자와 기호가 포함되어 있으며 보완됩니다. 구체적으로

1.gb 2312 의 모든 한자, 한자가 아닌 기호가 포함됩니다.

2. GB 13000.1 의 추가 한중일 한자. 이상 합계 20902 GB 한자입니다.

3.' 단순화자총표' 에서 미수입 GB 13000.1 의 한자 52 자.

4.' 강희사전' 과' 사직' 에서 미수입 GB 13000.1 의 28 개 부수 및 중요한 구성 요소.

5. 13 자 한자 구조자.

6. BIG-5 에서는 GB 2312 수익에는 없지만 GB 13000.1 에는 있는 139 개의 그래픽 기호가 있습니다.

7. GB 12345 에 추가된 6 개의 병음 기호.

8. 한자' ○' 입니다.

9. GB 12345 에 추가된 19 개의 수직 구두점 (GB 12345 는 GB 2312 보다 29 개, 그 중 10 개는 GB 13000.1 수입에 맞지 않으므로 GBK 도 받지 않음).

10. GB 13000.1 의 한중일 호환 영역에서 선택한 한자 21 자.

11. GB 13000.1 수익에 대한 31 개의 IBM OS/2 전용 기호.

2, 코드 비트 할당 및 순서

GBK 도 전체 인코딩 범위는 8140-FEFE, 첫 번째 바이트는 81-FE 사이, 마지막 바이트는 40-FE 사이인 2 바이트로 표시됩니다. 총 23940 야드, * * * 소득 21886 한자 및 그래픽 기호, 한자 (부수와 구성요소 포함) 21003 개, 그래픽 기호 883 개.

모든 인코딩은

1. 한자 영역의 세 부분으로 나뉩니다. 포함:

a. GB 2312 한자 영역. Gbk/2: b0a1-f7fe 입니다. GB 2312 한자 6763 개를 수록하여 원래 순서로 배열하다.

B. GB 13000.1 한자 영역 확장. 포함:

(1) gbk/3: 8140-a0fe. GB 13000.1 의 한중일 한자 6080 개를 수록하다.

(2) gbk/4: aa40-fea0. 한중일 한자와 보충된 한자 8160 개를 수록하다. 한중일 한자는 앞에 UCS 코드 크기에 따라 정렬됩니다. 보완된 한자 (부수와 구성 요소 포함) 는' 강희사전' 의 페이지/자석에 따라 배열된다.

2. 그래픽 기호 영역. 포함:

a. GB 2312 한자가 아닌 기호 영역. Gbk/1: a1a1-a9fe 입니다. GB 2312 기호 외에도 소문자 로마 숫자 10 개와 GB 12345 보충 기호가 있습니다. 계표 717 개.

B. GB 13000.1 은 한자가 아닌 영역을 확장합니다. Gbk/5: a840-a9a0 입니다. BIG-5 는 한자가 아닌 기호, 구조자, 그리고' 0' 이 이 지역에 배열되어 있다. 계표 166 개.

3. 사용자 정의 영역: (1)(2)(3) 세 개의 섹션으로 나뉩니다.

(1) AAA1-AFFE, 코드 비트 564 개.

(2) F8A1-FEFE, 코드 비트 658 개.

(3) A140-A7A0, 코드 비트 672 개.

섹션 (3) 은 사용자에게 개방되어 있지만 향후 이 영역에 새 문자를 추가할 가능성을 배제하지 않기 때문에 사용을 제한합니다.

3, 상형 문자

gbk 는 상형 문자에 대해

1. 원칙적으로 GB 13000.1 G 열 (중국 본토의 법정 표준에서 파생된 한자) 에 따라 다음과 같이 규정했다

2. 한중일 한자 인식 규칙의 전체 프레임워크 내에서 모든 GBK 인코딩 한자에 대해' 무중코드 정형' ('GB 화') 을 실시한다. 즉, 무거운 코드를 만들지 않고 가능한 한 중국의 새로운 글리프를 채택하는 것이다.

3. 한중일 한자 승인 규칙을 초과하거나 승인 규칙이 명시적으로 지정되지 않은 한자의 경우 GBK 코드 비트에 기존 글리프를 잠시 배치합니다. 이렇게 많은 경우 GBK 는 같은 한자의 신구 두 가지 글리프를 수입했다.

4. 한자가 아닌 기호의 글리프로, GB 2312 에 이미 포함되어 있는 모든 글리프는 GB 2312 와 일치합니다. GB 2312 를 초과하는 부분은 GB 13000.1 과 일치합니다.

5. 성조가 있는 병음 글자는 반각 형태를 취한다.

上篇: 단테의 지옥 금손가락 下篇: 2선식 멀티탭 연결 방법
관련 내용