ABOUT ME

-

Today
-
Yesterday
-
Total
-
  • GPU(Graphics Processing Unit) & GPGPU(General Purpose GPU)
    CA&자료구조 2022. 1. 4. 08:53
    728x90
    반응형

    0. Why

     - Data Mining, 인공지능 학습 과정 대규모 병렬 연산 지원 가능

     

    1. GPU(Graphics Processing Unit) &  GPGPU(General Purpose GPU) 개요

    - GPU 

    * 정의 : 광원효과와 객체의 변형 등에 의해 매번 다시 그려지는 컴퓨터 그래픽스(Computer Graphics)

    영상구현에 필요한 수학적 연산이 집약된 작업을 수행하는 특수 목적 프로세서로 그래픽 처리작업 시 CPU의 부담 경감

     

    - GPGPU 

    * 정의 : GPU 를 그래픽스 전용 처리뿐만 아니라 범용적인 데이터 병렬 처리가 가능한 그래픽 처리 유닛

    * 구성요소 : WARP, SM(Stream Multiprocessor), SP(Streaming Processor), SFU(Special Function Units), Shared Memory, Global Memory

    2. GPU 설계 목표

     - 3D 그래픽스를 위한 대규모 데이터 병렬 연산과 throughput 최적화, 연산 담당하는 기능블록(ALU: Arithmetic Logic Unit)이 대규모로 존재/캐시는 소량 분산 구조

     

    3. CPU vs. GPU

     - 목적 : 순차적 명령 처리 <> 병렬성 명령어 스트림 빠른 수행

     - 자원배분 : 슈퍼스칼라, 명령어재배역, 명령어 대기열, 분기예측 <> 수천개 쓰레드 지원, 스레드간 통신, 광대역 메모리 인터페이스 지원, 공유메모리

     - 캐시역할 : 엑세스 속도 줄여 성능향상 <> 메모리 대역폭 확대위해 공유메모리형태로 운영

     - Latency 관리 : 대용량캐시/분기예측, 상당한 면적과 전력소비 <> 수천개의 쓰레드 지원, 지연시간 없이 Latency hiding]

     - 멀티쓰레딩[쓰레드 수위칭에 수십~수백 사이클 소요 <> 즉각적인 쓰레드 스위칭

     - 메인메모리대역폭[높은 메모리 대역폭 <> CPU의 10배이상의 대역폭

     

    4. 관련토픽

     - GPGPU 기반 CUDA, OpenCL, C++ AMP, OpenACC 플랫폼

    728x90
    반응형

    'CA&자료구조' 카테고리의 다른 글

    Heap 자료구조  (0) 2022.03.29
    무어의 법칙과 길더의 법칙  (0) 2022.01.07
Designed by Tistory.