컴퓨터 지식 네트워크 - 컴퓨터 학습 - 최신 그래픽 카드는 DDR3 또는 DDR5 메모리 모델만 사용하고 DDR4 메모리를 사용하는 그래픽 카드는 많지 않은 이유는 무엇입니까? 하드웨어 전문가의 조언을 구하십시오.

최신 그래픽 카드는 DDR3 또는 DDR5 메모리 모델만 사용하고 DDR4 메모리를 사용하는 그래픽 카드는 많지 않은 이유는 무엇입니까? 하드웨어 전문가의 조언을 구하십시오.

제목을 보자마자 작가가 기술적인 사람이라는 느낌이 들었다. 일반 사기꾼은 아마도 기술 파일을 게시하고 시간을 투자할 수 있습니다. 도움이 되길 바랍니다.

재현된 내용은 다음과 같습니다.

GDDR3: GDDR3 세대의 왕은 DDR2 기술에서 파생됩니다

GDDR이든 GDDR2든 상관없이, DDR/DDR2와의 기술적 차이 큰 차이가 있기 때문에 결국 GDDR은 주파수 측면에서 DDR보다 그다지 높지 않습니다. GDDR2의 실패를 경험한 후, 두 거대 그래픽 회사인 NVIDIA와 ATI는 JEDEC 조직의 느린 표준 설정 프로세스에 점점 더 좌절감을 느꼈습니다. 그들은 자신들이 만든 그래픽 메모리가 빠르게 진행되는 제품에 적응할 수 없다고 믿었습니다. 따라서 NVIDIA와 ATI 직원은 JEDEC 조직에 적극적으로 참여하여 비디오 메모리 표준의 초안 작성 및 공식화를 가속화했습니다.

메모리 코어 주파수(커패시터 새로 고침 주파수)를 늘릴 수 없는 경우 단순히 I/O를 늘리는 것은 매우 어렵습니다. 높은 대역폭 현실을 얻기 위한 주파수. 따라서 고속 지점 간 환경을 위해 재정의된 I/O 인터페이스가 있어야 합니다. 그래서 완전히 GPU용으로 설계된 최초의 메모리인 GDDR3이 탄생했습니다.

GDDR3은 GDDR2/DDR2와 마찬가지로 4비트 프리패치 아키텍처입니다. GDDR3은 주로 GDDR2의 높은 전력 소비 및 발열의 단점을 개선하고 전송 효율성을 향상하여 높은 대기 시간으로 인한 부정적인 영향을 완화합니다. 지점 간 DQS, 읽기 및 쓰기를 기다릴 필요 없음

GDDR2에는 단일 및 양방향인 데이터 선택 펄스(DQS)가 하나만 있는 반면, GDDR3에는 읽기 및 쓰기를 위한 두 개의 독립적인 DQS가 있습니다. 포인트 투 포인트 디자인입니다. 이것의 장점은 읽은 후 바로 쓰면 DQS의 방향이 바뀔 때까지 기다리지 않아도 되므로 읽기와 쓰기 작업의 신속한 전환이 가능하다는 것입니다.

GDDR2/DDR2와 비교하여 GDDR3의 읽기 및 쓰기 전환 작업은 하나의 클럭 사이클을 덜 소요할 수 있습니다. 동시에 연속 블록에 데이터를 읽고 써야 하는 경우 GDDR3의 속도는 GDDR2보다 2배 빠릅니다.

저장 장치 자체의 특성으로 인해 메모리 파티클의 논리적 뱅크가 동시에 데이터를 읽고 쓸 수는 없지만 "전이중"이라는 것은 없지만 GDDR3에서는 이러한 개선이 이루어졌습니다. 순차적 읽기 및 쓰기가 가능합니다. GPU 자체는 매우 작은 캐시를 갖고 있으며, 비디오 메모리와의 데이터 교환이 매우 빈번하고 읽기 및 쓰기 작업이 산재되어 있으므로 GDDR3 포인트 투 포인트로 설계된 DQS는 비디오의 저장 효율성을 크게 높일 수 있습니다. 메모리. 하지만 CPU의 경우 읽기-쓰기 전환이 GPU만큼 빈번하지 않고, CPU에는 대용량 2차 및 3차 캐시가 있기 때문에 GDDR3 설계로는 메모리 대역폭을 크게 향상시킬 수 없어 아직 도입되지 않았습니다. 차세대 DDR3로

동시에 GDDR3은 I/O 제어 회로와 종단 저항도 수정했습니다. 더 이상 GDDR2의 "푸시 풀" 수신기를 사용하지 않고 가상 개방형 논리 방식으로 변경합니다. Pseudo Open Drain Logic), 3상 데이터 신호를 모두 로컬 회로로 전달하여 데이터 처리를 단순화하고 DC 전류를 최소화하며 로직 LOW가 버스로 이동할 때만 전력을 소비하므로 소비 전력 및 발열이 잘 제어됩니다.

GDDR3의 빈도가 이렇게 높은 수준에 도달할 수 있다는 사실에는 실제로 비밀이 없습니다. 빈도를 급격히 늘리려면 프로세스를 지속적으로 개선해야 합니다. 2004년 GDDR3가 출시되었을 때 6600GT의 메모리 주파수는 1GHz에 불과했으며 이는 GDDR2보다 높지 않았습니다. 5년 후 GDDR3은 1GHz에서 2GHz, 심지어 2.5GHz로 올라갔고 활력이 사라졌습니다. . 계속하다.

GDDR3의 원리와 기술을 이해한 후, 실물을 살펴보겠습니다. GDDR3은 GDDR1과 유사하며 두 가지 패키징 형태를 가지고 있습니다:

● 144Ball MBGA 패키징, GDDR 및 GDDR2와 역호환 가능

원래 GDDR3은 144Ball MBGA 패키징을 사용했습니다. GDDR 및 GDDR1과 다릅니다. GDDR2의 첫 번째 버전은 완전히 동일하며 세 가지의 전기적 특성이 유사합니다. GDDR3을 지원하는 GPU는 PCB 및 회로를 약간만 조정하면 GDDR 비디오 메모리를 사용할 수도 있습니다. .

144Ball에 패키징된 GDDR3은 256M×32Bit 사양이 딱 하나라서 당시에는 8개의 그래픽 메모리로 256MB 256Bit을 구성하거나 4개의 그래픽 메모리로 128MB 128Bit을 구성하는 것이 주류였습니다. 5700Ultra는 처음으로 GDDR2 대신 GDDR3을 사용합니다.

144Ball 패키지의 GDDR3에는 주로 2.0ns(1000MHz)와 1.6ns(1250MHz)의 두 가지 속도가 있습니다. 1.4ns의 수율은 높지 않으며 최대 주파수는 1400MHz에서 매우 작습니다. 이는 7800GTX/GT, 6800GS, 6600GT, X850/X800/X700 및 기타 그래픽 카드에서 널리 사용되었습니다. 144Ball 패키지와 PCB 회로가 주파수 증가를 제한했기 때문에 GDDR3은 곧 더 나은 전기적 성능을 갖춘 136Ball FBGA 패키지로 전환했습니다.

● 136Ball FBGA 패키지, 주파수 용량 증가

전기적 성능과 환경 보호 수준을 향상시키기 위해 GDDR3는 2005년부터 새로운 136Ball FBGA 패키지를 사용하기 시작했으며, 무선 Lead encapsulation 공정을 사용하였습니다. 새로운 패키지를 사용하려면 그래픽 카드 PCB를 재설계해야 하지만 GDDR3이 성공할 수 있는 길을 열어줍니다.

136Ball 패키지 GDDR3의 장점은 다음과 같습니다. 사양은 더 이상 8M×32Bit에 국한되지 않고, 16M×32Bit가 주류가 되었으며, 현재는 32M×32Bit가 발전하면서 널리 사용되고 있습니다. 제조 기술에 따라 정격 전압은 2.0V에서 1.8V로 더 떨어지지만 일부 고주파 입자는 적절하게 가압될 수 있으며 속도는 1.4ns에서 시작하여 1.2ns, 1.1ns 후에 0.8ns, 0.7ns로 발전합니다. 1.0ns이며 가장 빠른 속도는 2500MHz를 초과할 수 있지만 이는 지연을 희생한 것입니다. 다행히 GPU는 지연에 그다지 민감하지 않습니다.

GDDR3의 주파수가 처음으로 2000MHz에 도달했을 때, 많은 사람들이 한계가 멀지 않다고 생각하여 사전에 GDDR4 사양을 공식화하기 위해 서둘렀지만 DRAM 제조업체의 노력과 새로운 프로세스 지원으로 GDDR3의 수명이 연장될 것이라고는 예상하지 못했습니다. 0.8ns, 0.7ns 모델이 속속 양산되고 있으며, 더 큰 용량의 32M×32Bit 입자도 주류가 되어 기본적으로 하이엔드, 하이엔드, 로우엔드 모두에 대한 필수 요구 사항을 충족할 수 있습니다. 그래픽 카드.

당시 2.2ns GDDR은 최대 900MHz까지 도달할 수 있었고 코어 주파수와 I/O 주파수는 450MHz에서 멈췄습니다. 5년간의 개발 끝에 GDDR3은 새로운 프로세스를 통해 코어 주파수와 I/O 주파수에서 획기적인 발전을 이루었습니다. 이때 코어 주파수는 600MHz 이상, I/O 주파수는 1200MHz를 초과합니다. 새로운 문제가 되었습니다.

GDDR3은 DDR2의 4비트 프리페치 기술을 사용하므로 DDR3의 8비트 프리페치 기술을 사용하는 비디오 메모리는 순서대로 GDDR4로 명명될 수 있습니다. GDDR4는 GDDR3을 기반으로 개발되었지만, 코어는 DDR3의 8비트 프리페치 기술을 사용하고 주파수를 높이기 위해 몇 가지 새로운 기술을 추가했습니다.

● GDDR4의 기술적 특징: DDR3의 8비트 프리페치 기술을 사용하여 더 낮은 코어 주파수에서 더 높은 대역폭을 달성하지만 지연이 증가합니다. 데이터 버스 반전 기술(DBI, Data Bus Inversion, 이하)을 사용합니다. 자세한 소개), 데이터 정확도를 높이고 전력 소비를 줄입니다. 주소 라인은 GDDR3의 절반에 불과하며 추가 라인은 전력 및 접지에 사용되므로 주파수를 높이는 데 도움이 되지만 다중 프리앰블을 사용하면 지연이 증가합니다. GDDR3의 버스트 한계(Burst Limit) 극복을 해결하는 기술로 연속 주소에서 소량의 데이터를 읽을 때의 성능이 크게 향상되었으며, 동일한 주파수 전력 소비가 1.8V에서 1.5V로 감소했습니다. 2400MHz GDDR4의 전력 소비는 2000MHz GDDR3 Half에 불과합니다. 136Ball FBGA 패키지, 단일 32비트를 채택하고 GDDR3과 역호환됩니다.

8비트 프리패치 기술을 사용하므로 GDDR4의 코어 주파수(예: 커패시터 새로 고침) 동일한 주파수에서)는 GDDR3의 절반에 불과합니다. 이론적으로 말하면 GDDR4의 최대 주파수는 GDDR3의 두 배에 달할 수 있습니다. 하지만 8비트 프리페치 기술을 통해 코어 주파수가 절반으로 줄어들었음에도 불구하고 GDDR4와 GDDR3의 I/O 주파수는 정확히 동일하므로 GDDR4 주파수 개선의 병목 현상은 I/O 주파수가 아닌 I/O 주파수에 있다는 점을 주목할 필요가 있습니다. 핵심 주파수.

제조 공정 및 기술 수준의 한계로 인해 삼성은 공식적으로 3GHz 이상의 GDDR4를 생산했다고 주장했지만 실제 출하된 GDDR4는 2GHz~2.5GHz에 불과했습니다. 이후 개선된 기술이 적용된 GDDR3도 이를 묶었습니다. . 동일한 주파수에서 GDDR4는 GDDR3보다 전력과 발열이 적지만 대기 시간이 길고 성능이 약간 떨어지는 문제가 있으며, 높은 비용과 낮은 출력이 결합되어 GDDR4가 제외되는 것은 놀라운 일이 아닙니다.

● GDDR4의 실패를 가져온 비기술적인 이유

GDDR3은 NVIDIA와 ATI가 JEDEC 기구에 참여 후 공동으로 개발한 비디오 메모리 표준으로, GDDR4는 ATI가 개발한 것입니다. 표준 개발 과정에서 양측에는 큰 차이가 있었습니다. NVIDIA는 보다 보수적이며 DDR2 4비트 프리페치 기술은 변경되지 않고 I/O 컨트롤러를 지속적으로 개선하여 주파수를 높여야 한다고 생각하는 반면, ATI는 보다 급진적이며 DDR3 8비트 프리페치 기술을 직접 사용할 계획입니다.

두 당사자 간의 논쟁 결과는 JEDEC 조직 내에서 높은 평가를 받는 ATI가 승리한 반면(ATI에는 JEDEC에서 중요한 직책을 맡고 있는 고위 임원이 있다고 한다) NVIDIA는 GDDR4를 지원하지 않는다는 점을 분명히 했습니다. 따라서 GDDR4는 실제로 ATI가 계획한 것이었습니다. 그러나 NVIDIA의 지원을 받지 못했다면 GDDR4는 즉시 시장의 60% 이상을 잃게 되므로 DRAM 공장에서는 감히 이를 생산에 투입하지 못할 것입니다.

결국 삼성만이 GDDR4 비디오 메모리를 소량 생산했고, 나머지는 기다리고 지켜봤다. 물론 다른 DRAM 제조업체들도 GDDR3의 잠재력을 탐구하는 데 모든 에너지를 투자했기 때문에 GDDR3의 주파수가 꾸준히 상승하는 것을 볼 수 있었습니다. 시간 여러 세대의 A 카드는 성능 이점이 없으며 GDDR4는 당연히 막 다른 골목입니다.

ATI만이 GDDR4를 탑재한 그래픽 카드를 생산했습니다. 숫자는 많지 않지만 3세대에 걸쳐 동일합니다. 엔비디아는 워털루를 만난 뒤 과감히 GDDR2를 포기했고, ATI는 GDDR4를 포기하기 어려웠다. 3년 만에 3세대 제품에 사용됐지만 늘 비주류였다.

GDDR4의 실패는 기술적인 이유 때문이 아니라, 올해의 GDDR2에 비해 훨씬 더 성숙해졌고, 승격되지 못한 가장 큰 이유는 상대가 너무 강하기 때문이다: ATI의 상대. NVIDIA는 매우 강력하며 GDDR4의 상대인 GDDR3는 생명력이 매우 강합니다.

8비트 프리페치 기술을 사용하더라도 GDDR4는 병목 현상이 코어가 아닌 I/O 컨트롤러에 있기 때문에 여전히 GDDR3과 주파수 격차가 없으며 이를 해결하기 위해 GDDR5가 사용됩니다. 병목.

● GDDR5: 무서운 주파수를 달성하는 방법

GDDR5는 GDDR4와 마찬가지로 DDR3의 8비트 프리페치 기술을 사용합니다. 코어 주파수는 분명히 병목 현상이 아닙니다. 아 주파수가 최우선인가요? 그러나 GDDR5는 I/O 주파수를 두 배로 늘리지 않고 두 개의 병렬 DQ 버스를 사용하여 인터페이스 대역폭을 두 배로 늘립니다.

듀얼 DQ 버스의 결과로 GDDR5의 핀 수가 GDDR3/4의 136Ball에서 170Ball로 크게 늘어났고, 해당 GPU 메모리 컨트롤러도 재설계가 필요합니다. GDDR5 비디오 메모리에는 최대 16개의 물리적 뱅크가 있습니다. 듀얼 DQ 버스는 4개의 뱅크 그룹을 교차 제어하여 실시간 읽기 및 쓰기 작업을 수행하여 데이터 전송 속도를 한 번에 4GHz 이상으로 높입니다. 떨어졌다!

과거에는 GDDR1/2/3/4, DDR1/2/3의 데이터 버스가 모두 DDR 기술(차동 클럭을 통해 상승 에지와 하강 에지에서 데이터가 한 번 전송됨)이었는데, 공식 공칭 주파수는 X2였습니다. 이것은 우리가 일반적으로 등가 주파수라고 부르는 데이터 전송 속도입니다. GDDR5는 다릅니다. Rambus의 QDR 기술과 동일한 두 개의 데이터 버스가 있으므로 공식 공칭 주파수 X4는 데이터 전송 속도입니다. 예를 들어 HD4870의 공식 메모리 주파수는 900MHz이지만 모두가 3600MHz라고 부르는 데 익숙합니다.

● 실패는 성공의 어머니, GDDR5를 사용하여 RV770이 GTX200에 도전하도록 돕는 위험

GDDR4의 실패는 GDDR4 주파수 개선의 병목 현상을 깨달은 후에도 ATI의 전진을 막지 못했습니다. , GDDR5 초안 작성이 의제로 상정되었고 ATI와 NVIDIA 기술 직원이 재결합하여 주요 계획을 논의하기 위한 두 번째 협력을 시작했습니다. GDDR5는 최고라 할 수 있는 전작의 장점을 많이 흡수하고, 더 이상 I/O 개선 측면에서 양측 간 갈등이 많지 않다.

기술적인 문제는 해결하기 어렵지 않지만 가장 어려운 것은 시간과 진행입니다. ATI는 메모리 대역폭을 늘리기 위해 R600에 512비트 비디오 메모리 컨트롤러를 사용하는 위험을 감수했으나 처참하게 실패해 RV670은 256비트로 돌아가야 했고, 이로 인해 성능은 정체 상태에 머물렀다. GDDR4는 GDDR3에 비해 주파수 이점이 없으므로 ATI는 차세대 GPU의 요구 사항을 충족하기 위해 GDDR5를 신속하게 생산해야 합니다. RV770은 256비트만 지원하며 고주파 메모리 지원이 시급합니다.

라이벌 NVIDIA는 물론 GDDR5에 많은 관심을 갖고 있지만 전혀 서두르지 않습니다. 보수적인 NVIDIA는 GTX200 코어가 대역폭을 늘리기 위해 512Bit 메모리 컨트롤러를 사용하기로 결정했습니다. R600의 링 버스에 비해 256Bit에서 384Bit, 512Bit까지 단계별로 개발된 NVIDIA의 크로스오버 버스는 확실히 더 성숙해졌습니다.

512Bit에 대한 256Bit의 경우 ATI는 모든 칩을 GDDR5에만 탑재할 수 있었습니다. 따라서 GDDR5 표준이 완전히 확립되기 전에 ATI는 이미 성능을 집중적으로 테스트하고 DRAM 공장에 생산을 촉구하고 있었습니다. GDDR5도 GDDR2/4처럼 미숙아라고 할 수 있지만, 실패는 성공의 어머니다. 완벽한 기술 사양과 제조 공정을 바탕으로 GDDR5는 탄생하자마자 사람들에게 깊은 인상을 남겼다.

데이터 전송 속도를 두 배로 늘린 GDDR5를 통해 HD4870은 256비트로 448비트 GTX260을 능가했으며 NVIDIA는 가격 인하, 사양 업그레이드, 프로세스 개선 및 기타 여러 수단을 통해 반격을 가할 수 있었습니다. 128비트 HD4770의 성능도 256비트 9600GT를 능가하며 9800GT에 가깝다.

上篇: 어떤 OnePlus 휴대폰이 더 비용 효율적인가요? 추천해주세요 下篇: 삼성 N9500이 고장나서 벽돌이 되어 켜지지 않을 경우 대처방법과 벽돌을 보관하는 방법
관련 내용