-
GPU(Graphics Processing Unit) & GPGPU(General Purpose GPU)CA&자료구조 2022. 1. 4. 08:53728x90반응형
0. Why
- Data Mining, 인공지능 학습 과정 대규모 병렬 연산 지원 가능
1. GPU(Graphics Processing Unit) & GPGPU(General Purpose GPU) 개요
- GPU
* 정의 : 광원효과와 객체의 변형 등에 의해 매번 다시 그려지는 컴퓨터 그래픽스(Computer Graphics)
영상구현에 필요한 수학적 연산이 집약된 작업을 수행하는 특수 목적 프로세서로 그래픽 처리작업 시 CPU의 부담 경감
- GPGPU
* 정의 : GPU 를 그래픽스 전용 처리뿐만 아니라 범용적인 데이터 병렬 처리가 가능한 그래픽 처리 유닛
* 구성요소 : WARP, SM(Stream Multiprocessor), SP(Streaming Processor), SFU(Special Function Units), Shared Memory, Global Memory
2. GPU 설계 목표
- 3D 그래픽스를 위한 대규모 데이터 병렬 연산과 throughput 최적화, 연산 담당하는 기능블록(ALU: Arithmetic Logic Unit)이 대규모로 존재/캐시는 소량 분산 구조
3. CPU vs. GPU
- 목적 : 순차적 명령 처리 <> 병렬성 명령어 스트림 빠른 수행
- 자원배분 : 슈퍼스칼라, 명령어재배역, 명령어 대기열, 분기예측 <> 수천개 쓰레드 지원, 스레드간 통신, 광대역 메모리 인터페이스 지원, 공유메모리
- 캐시역할 : 엑세스 속도 줄여 성능향상 <> 메모리 대역폭 확대위해 공유메모리형태로 운영
- Latency 관리 : 대용량캐시/분기예측, 상당한 면적과 전력소비 <> 수천개의 쓰레드 지원, 지연시간 없이 Latency hiding]
- 멀티쓰레딩[쓰레드 수위칭에 수십~수백 사이클 소요 <> 즉각적인 쓰레드 스위칭
- 메인메모리대역폭[높은 메모리 대역폭 <> CPU의 10배이상의 대역폭
4. 관련토픽
- GPGPU 기반 CUDA, OpenCL, C++ AMP, OpenACC 플랫폼
728x90반응형'CA&자료구조' 카테고리의 다른 글
Heap 자료구조 (0) 2022.03.29 무어의 법칙과 길더의 법칙 (0) 2022.01.07