대만, 홍콩 등 지역에서 사용되는 번체 한자의 코딩 표준은 ()코드인가요?
대만, 홍콩 등 지역에서 사용되는 중국어 번체 문자의 인코딩 표준은 Big5 코드입니다.
Big Five 또는 Big Five라고도 알려진 Big5는 중국어(번체) 커뮤니티에서 가장 일반적으로 사용되는 컴퓨터 한자 집합 표준으로, 총 13,060개의 한자가 포함되어 있습니다. 빅5는 대만, 홍콩, 마카오 등 중국어 번체권 지역에서 인기가 높다.
2003년 Big5는 CNS11643 중국어 표준 교환 코드의 부록에 포함되어 더욱 공식적인 지위를 얻었습니다. 이 최신 버전은 Big5-2003이라고 합니다.
확장 정보
Big5 코드의 바이트 구조 소개
Big5 코드는 더블 옥텟 코드 저장 방법을 사용하는 더블 바이트 문자 집합입니다. 한 단어를 담는 데 2바이트입니다. 첫 번째 바이트를 "상위 바이트"라고 하고 두 번째 바이트를 "낮은 바이트"라고 합니다.
"상위 바이트"는 0x81-0xFE를 사용하고, "하위 바이트"는 0x40-0x7E 및 0xA1-0xFE를 사용합니다. Big5 파티션에서:
Big5에는 "兀, 兀" (0xA461[U+5140] 및 0xC94A[U+FA0C]), " "嗀, 같은 두 단어가 반복적으로 포함되어 있다는 점에 주목할 가치가 있습니다. "(0xDCD1[U+55C0] 및 0xDDFC[U+FA0D]). 또한 기호 영역에도 "십"과 "서른"이 반복되어 검색 시스템에서 단어가 누락되는 경우가 많습니다.