컴퓨터 지식 네트워크 - 컴퓨터 프로그래밍 - 호스트의 CPU 는 무엇입니까?

호스트의 CPU 는 무엇입니까?

CPU 는 중앙 처리 장치입니다. 중앙 처리 장치 (Central Processing Unit) 는 영어' central processing unit' 의 약자인 CPU 로, 일반적으로 논리 연산 장치, 제어 장치 및 저장 장치로 구성됩니다. 논리 연산 및 제어 장치에는 CPU 가 데이터를 처리하는 동안 데이터의 임시 저장을 위한 레지스터가 포함되어 있습니다. 간단히 말해서 컨트롤러와 연산자의 두 부분으로 구성됩니다.

CPU 의 주요 성능 지표는 다음과 같습니다.

전원 주파수

클럭 속도 (MHz) 라고도 하는 클럭 속도는 CPU 의 작동 속도를 나타냅니다. CPU 클럭 속도 = 외부 주파수 × 멀티플라이어 계수. 많은 사람들은 클럭 속도가 CPU 의 작동 속도를 결정한다고 생각하는데, 이는 일방적인 이해일 뿐만 아니라 서버에게도 편향이다. 지금까지 클럭 속도와 실제 작동 속도 간의 정량적 관계를 실현할 수 있는 확실한 공식은 없습니다. Intel 과 AMD 의 두 주요 프로세서 공급업체도 이 점에 대해 큰 논란을 갖고 있습니다. 인텔 제품의 발전 추세를 보면 인텔은 자신의 클럭 속도를 높이는 것을 매우 중요하게 생각합니다. 다른 프로세서 공급업체와 마찬가지로 1G 의 전미다를 비교한 적이 있는데, 운영 효율성은 2G 의 인텔 프로세서와 맞먹는다.

따라서 CPU 의 클럭 속도는 CPU 의 실제 연산 능력과 직접적인 관련이 없습니다. 클럭 속도는 CPU 의 디지털 펄스 신호 진동 속도를 나타냅니다. 인텔의 프로세서 제품 중에서도 1 GHz 의 아이테니엄 칩은 거의 2.66 GHz 의 제온/드래곤만큼 빠르거나 1.5 GHz 의 아이테니엄 2 는 약 4 GHz 의 제온/드래곤만큼 빠릅니다. CPU 의 작동 속도는 CPU 라인의 모든 측면에 대한 성능 지표에 따라 달라집니다.

물론 클럭 속도는 실제 작동 속도와 관련이 있습니다. 클럭 속도는 CPU 성능의 한 측면이라고 할 수 있지만 CPU 의 전체 성능을 나타낼 수는 없습니다.

외부 주파수

외부 주파수는 CPU 의 참조 주파수로, 단위는 MHz 입니다. CPU 의 외부 주파수에 따라 전체 마더보드의 작동 속도가 결정됩니다. 분명히, 바탕 화면에서, 우리가 말하는 오버클러킹은 슈퍼 CPU 의 외부 주파수 (물론, CPU 의 멀티플라이어는 잠김) 입니다. 나는 이것이 이해하기 쉽다고 믿는다. 그러나 서버 CPU 의 경우 오버클럭킹은 절대 허용되지 않습니다. 앞서 언급했듯이 CPU 는 마더보드 실행 속도를 결정하고 둘 다 동시에 실행됩니다. 서버 CPU 를 오버클럭킹하고 외부 주파수를 변경하면 비동기식 실행 (많은 데스크탑 보드의 경우 비동기 실행 지원) 이 발생하여 전체 서버 시스템이 불안정해집니다.

현재 대부분의 컴퓨터 시스템의 외부 주파수도 메모리와 마더보드가 동시에 실행되는 속도다. 이렇게 하면 CPU 의 외부 주파수가 메모리에 직접 연결되어 두 가지를 동시에 실행할 수 있다는 것을 알 수 있습니다. 외부 주파수와 프런트 사이드 버스 (FSB) 주파수는 혼동하기 쉽다. 프런트 사이드 버스 소개에서 두 가지의 차이점을 말씀드리겠습니다.

프런트 사이드 버스 (FSB) 주파수

FSB (front side bus) 주파수는 CPU 와 메모리 직접 데이터 교환 속도에 직접적인 영향을 미칩니다. 한 가지 공식은 데이터 대역폭 = (버스 주파수 × 데이터 비트 폭) /8 이며, 데이터 전송의 최대 대역폭은 동시에 전송되는 모든 데이터의 너비와 전송 빈도에 따라 달라집니다. 예를 들어, 현재 800MHz 프런트 사이드 버스를 갖춘 64 비트 Xeon Nocona 를 지원합니다. 공식에 따르면 최대 데이터 전송 대역폭은 6.4GB/ s 입니다 .....

외부 주파수와 FSB 주파수의 차이: FSB 속도는 데이터 전송 속도이고, 외부 주파수는 CPU 와 마더보드가 동시에 실행되는 속도입니다. 즉, 100MHz 의 외부 주파수는 디지털 펄스 신호가 초당 1000 만 회 진동한다는 것을 의미합니다. 100MHz FSB 는 CPU 가 초당 허용할 수 있는 데이터 전송 능력이100mhz × 64bit ÷ 8 bit/byte = 800mb/s 임을 의미합니다.

사실,' HyperTransport' 아키텍처의 출현은 실제로 FSB 의 주파수를 변화시켰다. 이전에는 IA-32 아키텍처에 메모리 컨트롤러 허브 (MCH), I/O 컨트롤러 허브 및 PCI 허브 (예: 인텔의 전형적인 칩셋 Intel 750 1 및 Intel7505) 의 세 가지 중요한 구성 요소가 있어야 한다는 것을 알고 있었습니다. 여기에는 CPU 에 533MHz 주파수의 프런트 사이드 버스를 제공하는 MCH 가 포함되어 있으며 DDR 메모리와 함께 프런트 사이드 버스 대역폭은 최대 4.3GB/ 에 달할 수 있습니다. 그러나 프로세서 성능이 지속적으로 향상됨에 따라 시스템 아키텍처에 많은 문제가 발생합니다. "HyperTransport" 아키텍처는 문제를 해결할 뿐만 아니라 AMD Opteron 프로세서와 같은 버스 대역폭을 더욱 효율적으로 향상시킵니다. 유연한 HyperTransport I/O 버스 아키텍처를 통해 메모리 컨트롤러를 통합할 수 있으므로 프로세서가 시스템 버스를 통해 칩셋으로 전송하지 않고도 메모리와 직접 데이터를 교환할 수 있습니다. 이 경우 AMD Opteron 프로세서의 FSB (front side bus) 주파수는 어디서부터 시작해야 할지 알 수 없습니다.

CPU 의 비트 및 문자 길이

비트: 디지털 회로 및 컴퓨터 기술에서 이진 인코딩은' 0' 과' 1' 만 인코딩합니다. 여기서' 0' 과' 1' 은 모두 CPU 중 하나입니다.

글자 길이: 컴퓨터 기술에서 CPU 가 단위 시간 동안 한 번에 처리할 수 있는 이진수의 자릿수를 글자 길이라고 합니다. 따라서 문자 길이가 8 비트인 데이터를 처리할 수 있는 CPU 를 일반적으로 8 비트 CPU 라고 합니다. 마찬가지로 32 비트 CPU 는 단위 시간 동안 32 비트 이진 데이터를 처리할 수 있습니다. 바이트와 글자 길이의 차이: 일반적으로 사용되는 영어 문자는 8 비트 이진수로 표시할 수 있기 때문에 8 비트는 일반적으로 1 바이트라고 합니다. 글자 길이의 길이는 고정되어 있지 않고 CPU 와 글자 길이에 따라 다릅니다. 8 비트 CPU 는 한 번에 1 바이트만 처리할 수 있는 반면 32 비트 CPU 는 한 번에 4 바이트를 처리할 수 있습니다. 마찬가지로 문자 길이가 64 비트인 CPU 는 한 번에 8 바이트를 처리할 수 있습니다.

멀티플라이어 계수

멀티플라이어 계수는 외부 주파수에 대한 CPU 클럭 속도의 상대 비율입니다. 외부 주파수가 같은 경우 멀티플라이어가 높을수록 CPU 주파수가 높아집니다. 그러나 실제로 외부 주파수가 같은 경우 멀티플라이어가 높은 CPU 자체는 의미가 없습니다. CPU 와 시스템 간의 데이터 전송 속도가 제한되어 있기 때문에 고주파 CPU 를 얻기 위해 높은 멀티플라이어를 추구하는 것은 상당한 "병목 현상" 효과를 낼 수 있기 때문입니다. CPU 가 시스템에서 데이터를 가져오는 한계 속도는 CPU 작동 속도를 충족시키지 못하기 때문입니다. 일반 인텔의 CPU 는 엔지니어링 버전을 제외한 멀티플라이어로 잠겨 있는데, AMD 는 이전에는 잠기지 않았다.

숨겨진 물건

캐시 크기도 CPU 의 중요한 지표 중 하나이며 캐시의 구조와 크기는 CPU 속도에 큰 영향을 미칩니다. CPU 의 캐시 작동 주파수는 매우 높으며, 일반적으로 프로세서와 같은 주파수로 시스템 메모리 및 하드 드라이브보다 훨씬 효율적입니다. 실제로 CPU 는 동일한 데이터 블록을 반복적으로 읽어야 하는 경우가 많으며, 캐시 용량이 증가하면 메모리나 하드 드라이브를 찾지 않고도 CPU 내부에서 데이터를 읽는 적중률이 크게 높아져 시스템 성능이 향상됩니다. 그러나 CPU 칩 면적과 비용 요인으로 인해 캐시가 작습니다.

L 1 캐시는 CPU 의 첫 번째 계층 캐시로 데이터 캐시와 명령 캐시로 구분됩니다. 내장형 L 1 캐시의 용량과 패브릭은 CPU 성능에 큰 영향을 미칩니다. 그러나 고속 버퍼 메모리는 정적 RAM 으로 구성되며 구조가 복잡합니다. CPU 의 코어 면적이 너무 클 수 없는 경우 L 1 레벨 캐시의 용량을 너무 크게 할 수 없습니다. 일반 서버 CPU 의 L 1 캐시 용량은 일반적으로 32-256 KB 입니다.

L2 캐시는 CPU 의 보조 캐시로 내부 및 외부 칩으로 구분됩니다. 내부 칩 L2 캐시는 클럭 속도와 동일한 속도로 실행되는 반면 외부 L2 캐시는 클럭 속도의 절반에 불과합니다. L2 캐시 용량도 CPU 성능에 영향을 미칩니다. 원칙은 CPU 가 클수록 좋다는 것이다. 현재 국내 최대 CPU 용량은 5 12KB 이고 서버와 워크스테이션은 최대 256KB- 1MB, 일부는 최대 2MB 또는 3MB 의 CPU L2 캐시를 사용합니다.

L3 캐시 (L3 캐시) 는 두 가지 종류로 나뉘는데, 초기의 외부는 현재 내장되어 있습니다. 실제로 L3 캐시 응용 프로그램은 메모리 대기 시간을 더욱 줄이고 대용량 데이터를 계산할 때 프로세서 성능을 향상시킬 수 있습니다. 메모리 대기 시간을 줄이고 대용량 데이터의 컴퓨팅 능력을 높이면 게임에 도움이 됩니다. 그러나 서버 영역에 L3 캐시를 추가하여 성능이 크게 향상되었습니다. 예를 들어 L3 캐시가 큰 구성은 물리적 메모리를 더 효율적으로 사용할 수 있으므로 느린 디스크 I/O 하위 시스템에서 더 많은 데이터 요청을 처리할 수 있습니다. L3 캐시가 더 큰 프로세서는 보다 효율적인 파일 시스템 캐시 동작과 짧은 메시지 및 프로세서 대기열 길이를 제공합니다.

사실 가장 오래된 L3 캐시는 AMD 가 발표한 K6-III 프로세서에 적용되었습니다. 당시 L3 캐시는 칩에 통합되지 않고 제조 공정의 이유로 마더보드에 통합되었다. L3 캐시는 시스템 버스 주파수와만 동기화할 수 있으며 주 메모리와 크게 다르지 않습니다. 이후 L3 캐시는 인텔이 서버 시장을 위해 내놓은 아이테니엄 프로세서입니다. 그런 다음 P4EE 와 제온 MP 가 있습니다. 인텔은 또한 향후 9MB L3 캐시 아이태니엄 2 프로세서와 24MB L3 캐시 듀얼 코어 아이태니엄 2 프로세서를 출시할 계획입니다.

그러나 L3 캐시는 프로세서 성능을 향상시키는 데 별로 중요하지 않습니다. 예를 들어 1MB L3 캐시가 장착된 제온 MP 프로세서는 여전히 용의 상대가 아닙니다. 이는 프런트 사이드 버스 증가가 캐시 증가보다 더 효과적인 성능 향상을 가져올 수 있음을 의미합니다.

CPU 확장 명령 집합

CPU 는 명령을 사용하여 시스템을 계산하고 제어하며, 각 CPU 는 하드웨어 회로와 일치하는 일련의 명령 시스템을 설계합니다. 명령어의 강약도 CPU 의 중요한 지표로, 명령어는 마이크로프로세서의 효율을 높이는 가장 효과적인 도구 중 하나이다. 현재의 주류 아키텍처에서 볼 때, 명령어는 복잡한 명령어 세트와 단순화 명령어의 두 부분으로 나눌 수 있는데, 이는 인텔의 MMX (멀티미디어 확장), SSE, SSE 2 (스트리밍-단일 명령어 멀티 데이터-확장 2), SEE3, AMD 의 3DNow 와 같은 특정 어플리케이션에서 볼 수 있습니다! 이들은 CPU 의 멀티미디어, 그래픽 이미지 및 인터넷의 처리 능력을 향상시키는 CPU 의 확장 명령 세트입니다. 우리는 일반적으로 CPU 의 확장 명령 세트를 "CPU 명령 세트" 라고 부릅니다. SSE3 스크립트도 현재 가장 작은 스크립트입니다. 이전에는 MMX 에 57 개의 명령, SSE 에 50 개의 명령, SSE2 에 144 개의 명령, SSE3 에 13 개의 명령이 포함되었습니다. 현재 SSE3 도 최고급 명령어 세트입니다. 인텔 Prescott 프로세서는 이미 SSE3 명령어를 지원합니다. AMD 는 향후 듀얼 코어 프로세서에 SSE3 명령어에 대한 지원을 추가할 예정이며, America 프로세서도 이를 지원할 예정입니다.

上篇: 아크릴 패널에서 탭을 제거하는 방법 下篇: 호스트 벨소리 카드
관련 내용