XNA Math 라이브러리와 XMVECTOR

Direct3D 11의 D3DX 라이브러리에는 Direct3D 9와 10의 D3DX와는 다르게 개별적으로 개발된

XNA Math 라는 벡터 수학 라이브러리가 제공된다. 

 

 

 

 

 

 

SIMD의 명령들은 128비트 너비의 SIMD(Single instruction multiple data) 레지스터들을 이용해서 한 명령에서 32비트 float나 int 네 개를 한 번에 처리할 수 있다. 이는 벡터 계산에 아주 유용하다.

SIMD가 아닌 경우에는 32-비트의 실수를 4번 더해야 하지만 벡터의 덧셈 시 SIMD를 이용하면 두 개의 4요소 벡터(Vector4) 를 더할 경우 한 번의 덧셈 명령으로 처리가 가능하다는 것이다. 

 

SIMD?

더보기

병렬 프로세서의 한 종류로, 하나의 명령어로 여러 개의 값을 동시에 계산하는 방식, 컴퓨터를 일컫는다.

SSE (Streaming SIMD Extensions)는 이런 SIMD 구조의 명령을 프로세서에 도입한 것으로 128bit짜리 SIMD 전용 레지스터가 추가된 것이다. 

 

 

 

 

 

◎ 사용

코드에서 이 라이브러리를 사용하려면 헤더파일 xnamath.h를 추가하기만 하면 된다.

#include <xnamath.h>

모든 코드가 헤더 파일 안에 inline으로 구현되어 있으므로 라이브러리 파일을 따로 링크할 필요가 없다. 

물론 <d3dx10.h>를 포함시키고 <d3dx10.lib>를 링크해서 XNA Math 라이브러리 대신에 D3DX10 Math 함수들을 사용하는 것도 여전히 가능하다. 

 

 

 

 

 

◎ 벡터 형식들

XNA Math에서 핵심 벡터 형식은 SIMD 하드웨어 레지스터들에 대응되는 XMVECTOR이다.

XMVECTOR는 하드웨어 레지스터에 대응하는 32-비트의 실수 벡터로 32-비트 실수 또는 정수 요소들의 벡터를 표현하기 위한 '자료형'이다. (구조체가 아니다.) 

추가로 덧붙이자면 뒤에 나오는 XMMATRIX는 구조체이다.

 

XMVECTOR는 128비트짜리 형식으로 하나의 SIMD 명령으로 처리되는 네 개의 32비트 부동소수점 값들로 이루어져있다.

SSE2를 사용할 수 있는 경우에서 XMVECTOR는

typedef __m128 XMVECTOR;

위와 같이 정의되어 있다.

 

__m128?

더보기

특별한 SIMD 형식으로 계산을 수행할 때 이 형식의 벡터들은 반드시 SIMD의 장점을 갖고 연산을 할 수 있다. 

이 XMVECTOR는 사용할 때 16바이트 경계에 정렬되어야 한다.

 

왜냐하면 정렬이 되어있어야 SIMD 명령어를 이용해 데이터를 벡터에 패킹하여 한 번의 명령으로 동시에 처리할 수 있기 때문이다.

이 정렬은 지역 변수와 전역 변수에는 정렬이 자동으로 이루어지게 된다.

그러나  class의 멤버나 구조체의 멤버변수의 경우에는 이것 보다는 XMFLOAT를 사용하는 것이 더 바람직하다. 

 

 

 

왜?

더보기

(Microsoft Docs의 DirectXMath 中)

SIMD 처리는 데이터를 SIMD 레지스터에 load하고 결과를 추출하기 전에 완전히 처리할 때 가장 효율적이다.

SIMD processing is most efficient when data is loaded into the SIMD registers and fully processed before extracting the results. 

스칼라와 벡터 형식 간의 변환은 비효율적이므로 필요할 때만 수행하는 것이 좋다.

Conversion between scalar and vector forms is inefficient, so we recommend that you do it only when required. 

이러한 이유로 스칼라 값을 생성하는 DirectXMath 라이브러리의 함수는 스칼라 결과가 결과 벡터에 복제되는 벡터 형태로 리턴된다. 

For this reason, functions in the DirectXMath library that produce a scalar value are returned in a vector form where the scalar result is replicated across the resulting vector

 

그래서 스칼라 값이 필요한 경우에 이와 같은 내용을 수행하는 방법에 대한 몇 가지 선택사항으로 XMFLOAT를 이용해 벡터를 메모리 구조에 저장하고 다시 읽어오는 방식을 사용. 

 

 

 

typedef struct _XMFLOAT3 
{
	FLOAT x;
	FLOAT y;
	FLOAT z;
} XMFLOAT3;

예를 들면 XMFLOAT3(3차원)은 위와 같이 정의한 후 사용한다. 

XMVECTOR나 XMMATRIX는 operator(연산자)들이 오버로드 되어있지만 XMFLOAT를 이용해 사용하는 경우 추가로 생성자들이나 연산자 관련 함수를 추가해 준다. 

 

이 XMFLOAT를 이용한 형식은 계산할 때 SIMD의 장점을 갖고 연산할 수가 없으므로 SIMD를 이용하고 싶으면 이 형식의 인스턴스를 XMVECTOR 형식으로 변환해줘야 한다. 

 

이를 위해 XNA Math는 여러 함수를 제공한다.

또한 XNA Math는 XMVECTOR 인스턴스에 담긴 자료를 XMFLOAT* 형식들로 변환하는 저장 함수들도 제공한다.

 

 

 

간략정리

더보기

간략정리

1. 지역 변수와 전역 변수에서는 XMVECTOR를 이용

2. 클래스 자료 멤버에는 XMFLOAT2나 XMFLOAT3, XMFLOAT4를 사용

3. 계산 수행 전 함수들을 이용해 XMFLOAT*를 XMVECTOR로 변환

4. '계산'은 XMVECTOR 인스턴스들을 이용해서 수행

5. XMVECTOR를 XMFLOAT*로 변환하려면 저장 함수들을 이용

 

 

 

 

 

◎ 적재 및 저장 함수

- XMFLOAT*의 자료를 XMVECTOR로 적재(Load)하는 함수

XMVECTOR XMLoadFloat2 (Const XMFLOAT2 *pSource);

XMVECTOR XMLoadFloat3 (Const XMFLOAT3 *pSource);

XMVECTOR XMLoadFloat4 (Const XMFLOAT4 *pSource);

이외에도 Color나 UINT 배열을 XMVECTOR에 load하는 함수들도 존재한다.

 

 

- XMVECTOR의 자료를 XMFLOAT*로 저장(Store)하는 함수

FLOAT XMVectorGetX (FXMVECTOR V);
FLOAT XMVectorGetY (FXMVECTOR V);
FLOAT XMVectorGetZ (FXMVECTOR V);
FLOAT XMVectorGetW (FXMVECTOR V);

XMVECTOR XMVectorSetX (FXMVECTOR V, FLOAT x);
XMVECTOR XMVectorSetY (FXMVECTOR V, FLOAT y);
XMVECTOR XMVectorSetZ (FXMVECTOR V, FLOAT z);
XMVECTOR XMVectorSetW (FXMVECTOR V, FLOAT w);

 

 

 

 

 

◎ 매개변수 전달과 상수 벡터 

SIMD의 장점을 이용하려면 함수에 XMVECTOR 형식의 매개변수를 전달할 때 지켜야 할 규칙이 있다.

이 규칙들은 플랫폼바다 다른데 플랫폼 독립적 코드를 위해 XMVECOTR 형식의 매개변수에 대해 CXMVECTOR, FXMVECTOR 형식을 사용한다.

 

Windows의 경우

// 32비트 Windows
typedef const XMVECTOR FXMVECTOR;
typedef const XMVECTOR& CXMVECTOR;

//64비트 Windows
typedef const XMVECTOR& FXMVECTOR;
typedef const XMVECTOR& CXMVECTOR;

 

이 둘의 차이는 XMVECTOR의 복사본을 직접 전달할 수 있는지, 참조를 전달해야 하는지이다.

구체적인 또 하나의 규칙은 한 함수의 처음 세 개의 XMVECTOR 매개변수는 반드시 FXMVECTOR형식이어야 한다. 그 외의 XMVECTOR 매개변수는 반드시 CXMVECOTR 형식이여야 한다. 

 

예를 들어 7개의 매개변수를 받는 함수가 있으면 위의 규칙에 따라 처음 세 개는 FXMVECTOR, 나머지 네 개는 CXMVECOTR 형식이어야 하며 XMVECTOR 매개변수들 사이에 다른 매개변수가 끼어있을 경우에도 처음 세 개의 XMVECTOR 매개변수는 반드시 FXMVECTOR 형식이고 나머지 XMVECTOR 매개변수는 CXMVECOTR 형식이어야 한다. 

 

 

또한 상수(const) XMVECTOR 인스턴스에는 반드시 XMVECTORF32 형식을 사용해야 한다.

초기화 구문을 사용하고자 할 때에는 항상 XMVECTORF32를 사용해야 한다.

XMVECTORF32는 16바이트 경계로 정렬된 구조체로, XMVECTOR로의 변환 연산자를 지원한다. 

 

 

 

 

 

◎ 기타 제공 함수

XNA Math 라이브러리는 XMVECTOR를 이용한 벡터 덧셈, 뺄셈, 스칼라 곱셈을 위해 중복적재된 연산자들을 제공한다.

또한 XNA Math 라이브러리는 벡터의 길이, 벡터 길이의 제곱, 두 벡터의 내적, 두 벡터의 외적, 벡터 정규화를 위한 편의용 함수들도 제공한다.

 

XMVECTOR XMVector3Length(FXMVECTOR V);
XMVECTOR XMVector3LengthSq(FXMVECTOR V);
XMVECTOR XMVector3Dot (FXMVECTOR V1, FXMVECTOR V2);
XMVECTOR XMVector3Cross (FXMVECTOR V1, FXMVECTOR V2);
XMVECTOR XMVector3Normalize (FXMVECTOR V);

 

 

 

 

 

 

 

 

 

참고 출처;


https://docs.microsoft.com/ko-kr/windows/win32/dxmath/pg-xnamath-getting-started?redirectedfrom=MSDN#type_usage_guidelines_

 

 

Getting started (DirectXMath) - Win32 apps

Getting started (DirectXMath) In this article --> The DirectXMath Library implements an optimal and portable interface for arithmetic and linear algebra operations on single-precision floating-point vectors (2D, 3D, and 4D) or matrices (3×3 and 4×4). The l

docs.microsoft.com


- https://ko.wikipedia.org/wiki/SIMD

 

SIMD - 위키백과, 우리 모두의 백과사전

위키백과, 우리 모두의 백과사전. 둘러보기로 가기 검색하러 가기

ko.wikipedia.org


- Direct11을 이용한 3D게임프로그래밍 (저; 프랭크 D. 루나, 역; 류광, 출판사; 한빛미디어)


 

 

 

벡터(Vector) 下

 

 

 

 

◎벡터의 크기

기하학적으로 한 벡터의 크기는 해당 방향이 있는 선분의 길이이다.

벡터의 크기는 이중 수직선으로 표기한다.

Ex ) 벡터 u의 크기는 ||u||이다. 

 

3차원 벡터의 크기는 피타고라스의 정리를 두 번 적용해 구할 수 있다.

 

어떻게 ||u||가 저 식이 될까?

더보기

우선 u의 크기를 빗변으로, y축을 높이 y로 두고 원점으로부터 y까지 직각이 되는 거리를 a라고 둔다.

그러면 ||u|| (빗변) 은 피타고라스의 정리를 통해 y제곱과 a제곱에 루트를 씌운 값이 된다. 

그리고 거기서 a를 구하기 위해 피타고라스의 정리를 한 번 더 사용한다.

a를 빗변으로 두고 x를 밑변, z축의 값을 높이 z로 두어 계산한다.

그러면 ||u||가 위와 같은 식이 된다. 

 

 

벡터를 순수하게 방향을 나타내는 용도로만 사용하면 벡터의 길이는 그다지 중요하지 않을 수 있다.

그런 방향 전용 벡터에서는 벡터의 길이를 정확히 단위 길이인 1로 맞추어 두는 것이 편리하다. 

따라서 벡터의 길이를 단위 길이가 되게 해서 단위 벡터로 만드는 것을 가리켜 벡터의 정규화(normalization)라고 부른다.

벡터의 각 성분을 벡터의 크기로 나누면 벡터가 정규화 된다. 

 

벡터의 정규화

왜 벡터의 크기로 각 성분을 나누는지 이해가 되지 않는다면 이렇게 생각하면 쉽다. 

 

 

 

 

벡터의 곱셈에는 두 가지 종류가 있다. 내적과 외적이다.

 내적

스칼라 값을 나타내는 벡터 곱셈의 일종으로 점곱(dot product)라고도 한다.

 

내적은 결과 값이 뒤에 나올 외적의 결과와 달리 스칼라 값으로 나온다.

 

u = (u1, u2, u3), v = (v1, v2, v3)라고 가정했을 때 내적은

u · v = u1v1 + u2v2 + u3v3

즉, 대응되는 성분들의 곱들의 합이다.

 

 

코사인 법칙을 이용하면 내적의 기하학적 의미를 알아낼 수 있다.

u · v = ||u|| ||v|| cosθ

여기서 θ는 벡터 u와 v 사이의 각도이다. 0 θ π 사이의 값.

따라서 위의 식은 두 벡터의 내적이 두 벡터 사이의 각도의 코사인을 벡터 크기들로 비례 시킨 것이다. 

특히 u와 v가 둘 다 단위 벡터이면 u, v의 내적은 두 벡터 사이의 각도의 코사인이다. 

u · v = 1 * 1 * cosθ = cosθ

 

1. u·v = 0 이면 u ⊥ v이다. ( = 두 벡터는 직교한다. )

2. u·v > 0 이면 두 벡터 사이의 각도 θ는 90˚보다 작다. ( = 두 벡터는 예각을 이룬다.)

3. u·v < 0 이면 두 벡터 사이의 각도 θ90˚보다 크다. ( = 두 벡터는 둔각을 이룬다. )

 

 

 

 

 외적

결과 값이 스칼라 값을 나타내는 내적과는 달리 외적의 결과는 또 다른 벡터가위곱(cross product)라고도 한다. 

 

외적은 오직 3차원 벡터에 대해서만 정의된다.

두 3차원 벡터 u와 v의 외적을 구하면 u와 v 모두에 직교(수직)인 또 다른 벡터 w가 나온다.

 

즉, w는 u와 직교이고 v와도 직교이다.

 

 

u = (u1, u2, u3), v = (v1, v2, v3)라고 가정했을 때 외적은 다음과 같이 구한다. 

w = u x v = (u2v3 - u3v2, u3v1 - u1v3, u1v2 - u2v1) 

w = u x v 

 

 

 

 

 

 

 

 

참고 출처

Direct11을 이용한 3D게임프로그래밍 (저; 프랭크 D. 루나, 역; 류광, 출판사; 한빛미디어)

 

 

 

벡터(Vector) 上

 

 

 

 

 

 

벡터(Vector)는 크기와 방향을 모두 가지고 있다. 이 크기와 방향을 모두 가진 수량을 벡터 값 수량이라고 부른다.

 

벡터 값 수량의 예로는 (force; 힘은 특정 방향과 세기, 즉 크기로 가해진다.) 변위(displacement: 한 입자의 최종적 이동 방향 및 거리), 속도(빠르기와 방향)가 있다. 

 

따라서 벡터는 힘이나 변위, 속도를 나타내는 데 쓰인다.

 

 

또한 벡터는 게임에서 플레이어가 바라보는 방향이나 한 다각형이 향한 방향, 광선이 이동하는 방향, 한 표면에서 광선이 반사되는 방향 등 순수한 방향만 나타내는 경우에도 벡터를 사용한다. 

 

 

벡터를 기하학적으로 나타내 본다면 벡터는 시각적으로 방향이 있는 선분으로 표시한다.

 

 

2차원 평면에 그린 벡터

 

선분의 길이벡터의 크기를, 화살표가 향하는 방향벡터의 방향을 의미한다. 

벡터가 그려져 있는 위치는 중요하지 않다

왜?

위치를 바꿔도 벡터의 크기나 방향은 변하지 않기 때문이다. 벡터가 가진 두 가지 속성인 크기와 방향은 위치와 상관없다. 

따라서 두 벡터는 오직 길이가 같고 같은 방향을 가리킬 때에만 같다고 한다. 

 

w와 v벡터는 길이가 같고 가리키는 방향이 같으므로 같은 벡터이다.

 

 

우리는 이렇게 알 수 있지만 컴퓨터는 벡터들을 기하학적으로 다루지 못한다. 따라서 벡터들을 수치적으로 지정하는 방법이 필요하다.

이를 위해 공간에 하나의 3차원 좌표계를 도입하고 모든 벡터를 그 꼬리가 원점과 일치하도록 이동시켜준다. 그러면 하나의 벡터를 그 머리(화살표의 끝)의 좌표로 정할 수 있으며 벡터를 v=(x, y, z)로 표기할 수 있다. 

 

 

v의 꼬리를 좌표계의 원점으로 이동시켰으며 벡터의 꼬리가 원점과 일치하는 경우 그 벡터가 "표준 위치에 있다"고 말한다. 

 

 

 

 

◎기본적인 벡터 연산

u = (u1, u2, u3)이고 v = (v1, v2, v3) 라고 가정했을 때

 

◑ 벡터의 상등 

두 벡터는 오직 해당 좌표성분들이 모두 같을 때만 같다.

즉 u1=v1, u2=v2, u3=v3일 경우에만 u = v이다.

 

 

◑ 벡터의 덧셈

벡터 덧셈은 성분별로 이루어지며

    w = u+v일 때,  w = (u1+v1, u2+v2, u3+v3)이다. 

 

w = u+v

 

u와 v를 더하기 위해서는 v를 평행이동 해 u의 꼬리에 v의 머리를 일치시켜 준다. 

그리고 그 결과값인 w는 원점에서부터 v의 머리까지 향하는 벡터가 된다. 

 

 

 

◑ 스칼라 곱셈

벡터에는 상수, 실수를 곱할 수 있으며 그 결괏값도 벡터이다. 

보통 벡터에 곱하는 실수 값을 스칼라라고 부르는데 스칼라 값을 k라고 할 때 ku = (ku1, ku2, ku3)이다.

이를 스칼라 곱셈이라고 부른다. 

 

 

w에 2를 곱했을 때

 

 

 

◑ 벡터의 뺄셈

벡터의 뺄셈벡터의 덧셈과 스칼라 곱셈을 통해서 정의 된다.

   w = u - v일 경우 정확하게 말하면 u에 -1의 스칼라 값을 곱한 v를 더하는 것이다. 

   w = u + (-1 * v) 

 

 

w = u-v

 

뺄셈은 v의 머리에서부터 u의 머리까지의 벡터를 구하는 것이다. 

 

이 벡터의 뺄셈을 통해서 방향을 알 수 있다.

 

 

 

 

 

참고 출처

Direct11을 이용한 3D게임프로그래밍 (저; 프랭크 D. 루나, 역; 류광, 출판사; 한빛미디어)

 

 

 

 

렌더링 파이프라인(Rendering Pipeline)

 

GPU를 사용해 리소스를 2D 이미지로 렌더링 하는 과정이다.

파이프라인은 여러 개의 파이프라인 단계로 구성되어 있으며 프로그램 가능 단계와 고정 프로그램 단계로 구분된다. 

 

 

 

 

렌더링 파이프라인을 구성하는 단계들과 관련 GPU 메모리 자원들

 

 

고정 프로그램 단계?

Direct3D에서 모든 처리가 진행되며 응용 프로그램에서 변경할 수 없는 단계

- 입력 조립(IA) 단계, 테셀레이터 (TS) 단계, 스트림 출력(SO) 단계, 래스터라이저(RS) 단계, 출력 병합(OM) 단계

 

프로그램 가능 단계?

응용 프로그램에서 쉐이더 프로그램을 통해 제공해야 하는 단계

- 정점 쉐이더(VS) 단계, 헐 쉐이더(HS) 단계, 도메인 쉐이더(DS) 단계, 기하 쉐이더(GS) 단계, 픽셀 쉐이더(PS) 단계

 

 

위의 파이프라인에서 오른쪽은 자원 메모리 풀을 뜻한다. 자원 메모리 풀에서 파이프라인의 단계로 가는 화살표는  그 단계가 자원을 입력으로 사용할 수 있음을 뜻하고 파이프라인의 단계에서 자원으로 가는 화살표는 그 단계가 GPU 자원에 자료를 기록할 수 있음을 뜻한다. 

 

 

 

◎ 입력 조립기 (Input Assembler) 단계

고정 함수 단계이다. 응용 프로그램에서 제공받은 정점 버퍼의 정점 데이터(프리미티브 데이터 : 점, 선, 삼각형)를 다른 파이프라인 단계에서 사용할 프리미티브(선 리스트, 삼각형 리스트, 삼각형 스트립, 인접성을 가지는 프리미티브 등)로 조립한다. 

즉, 메모리에서 기하 자료(정점 데이터와 Index(색인))를 읽어 기하학적 기본도형(삼각형, 선분 등)을 조립한다. 

 

그럼 정점이란 무엇일까?

더보기

Direct3D에서의 정점은 공간적 위치, 즉 위치 값 이외의 정보를 담고 있으며 이를 통해 좀 더 복잡한 렌더링 효과를 구현할 수 있다. 예를 들면 조명 구현을 위해 정점에 법선 벡터를 추가하거나 텍스처를 적용하기 위해 텍스처 좌표를 추가하는 식으로 사용할 렌더링 효과에 따라 특정 정보를 추가할 수 있는 유연성을 갖고 있다. 

 

 

 

◎ 정점 쉐이더 (Vertext Shader) 단계

이 단계에서는 입력 조립 단계에서 출력되는 Primitive의 각 정점에 대한 연산을 수행한다. 

이 정점 쉐이더는 항상 모든 정점들에 대해 한 번씩 실행된다. 또한 하나의 정점에 대해 한 번만 호출되며 하나의 출력 정점을 생성될 뿐 아니라 파이프라인 단계에서 항상 수행이 되어야 하는 단계이다. 따라서 정점에 대한 변환이 필요하지 않아도 정점 쉐이더를 생성해 연결해야 한다. 

 

이 정점 셰이더 함수의 구체적인 내용은 프로그래머가 구현해서 GPU에 전달하게 된다. 그 함수는 각 정점에 대해 GPU에서 실행되기 때문에 속도가 빠르다. 

변환(Transformation), 스키닝(Skinning), 조명(Vertex Lighting) 등 수많은 특수 효과를 정점 쉐이더에서 수행할 수 있다. 정점 쉐이더에서 입력 정점 자료는 텍스쳐라든가 변환 행렬, 장면 광원 정보 등 GPU 메모리에 담긴 다른 자료에도 접근할 수 있다. 

 

더보기

이 단계에서 일어나는 작업 중 변환이 어느 물체의 로컬 좌표를 월드 좌표로, 월드 좌표를 뷰 스페이스 좌표로 바꿔주고 투영 변환등이 일어나는 변환 작업이다.

 

 

 

 

◎ 테셀레이션 단계

테셀레이션이란 한 메시의 삼각형들을 더 잘게 쪼개서 새로운 삼각형들을 만드는 과정을 말한다.

 

테셀레이션의 장점은

  1.  LOD 구현이 가능하다.
    더보기
    LOD란 Level-of-detail를 말한다.
    카메라에 가까운 삼각형들은 테셀레이션을 적용해 더욱 세밀한 구현을 적용하고 멀리 있는 삼각형들은 테셀레이션을 적용하지 않는 방식의 세부 수준 메커니즘을 구현해 눈에 띄는 부분에 대해서만 삼각형을 더 투여할 수 있게 된다. 
  2.  Low-poly 메시, 적은 수의 삼각형들로 이루어진 메시를 담아두고 즉석에서 삼각형들을 추가해 메모리를 적용할 수 있다.
  3.  애니메이션, 물리 처리 같은 연산들을 단순한 Low-Poly 메시에 대해 수행하고, 테셀레이션 된 High-Poly 메시는 렌더링에만 사용해 계산량을 줄일 수 있다. 

 

 

 

◎ 기하 셰이더 (Geometry Shader) 단계

이 단계는 정점 셰이더의 처리를 거친 정점 데이터를 입력받는다. 그리고 입력받은 정점에 정보를 추가하거나 삭제해 입력 기본도형을기본 도형을 다른 여러 기본 도형들로 확장할 수도, 특정 조건에 따라서는 입력된 기본 도형을 출력하지 않고 버릴 수도 있다. 

기하 셰이더의 흔한 용도는 하나의 점이나 선분을 하나의 사각형으로 확장하는 것이다. 

 

 

 

◎ 래스터라이저(Rasterizer) 단계

이 단계는 투영된 3차원 삼각형으로부터 픽셀 색상들을 계산해 내는 것이다. 

Rasterization을 하는 동안 각 프리미티브를 구성하는 정점은 픽셀로 변환되고 프리미티브의 내부에 해당하는 점들은 보간을 통해 픽셀로 변환된다.

 

과정

1. 원근 투영 나누기(z 나누기)

2. 카메라 절두체를 벗어나는 점(Pixel)들을 클리핑(Clipping)

3. Primitive를 2차원 Viewport로 매핑

4. Primitive의 모든 픽셀들에 대해 픽셀 쉐이더를 호출

 

 

 

 

◎ 픽셀 셰이더 (Pixel Shader) 단계

각 픽셀의 데이터(기본적으로 색상)를 생성한다. 프로그래머가 작성해서 GPU에서 실행하는 프로그램으로 각각의 필셀 단편(pixel fragment)마다 실행된다. 

상수 변수, 텍스처 데이터, 또는 픽셀 출력 데이터 등을 결합해 출력 색상을 결정한다.

이 단계에서 픽셀 조명 계산 또는 픽셀에 대한 후처리를 할 수 있다. 

 

하나의 프리미티브를 구성하는 각 픽셀에 대해 픽셀 쉐이더를 한 번씩 호출한다. 

다중 샘플링을 사용한다면 깊이/스텐실 테스트는 각 서브픽셀에 대해 한 번씩만 수행되며 다중 샘플링을 사용해도 이 픽셀 쉐이더는 하나의 픽셀에 대해 한 번만 호출된다.

 

 

 

 

◎ 출력 병합기 (Output Merge) 단계

픽셀 셰이더가 생성한 픽셀 단편들은 이 단계로 입력된다. 최종적으로 픽셀의 색상을 생성해 렌더 타깃으로 출력하는 단계이다. 이 단계에서 일부 픽셀 단편들이 깊이 판정이나 스텐실 판정에 의해 버려지게 되며 버려지지 않은 픽셀 단편은 후면 버퍼에 기록된다.

흔히 말하는 블렌딩도 이 단계에서 일어난다.

더보기

블렌딩은 새 픽셀이 후면 버퍼의 기존 픽셀을 완전히 덮어 쓰는 것이 아니라 두 픽셀을 일정한 공식에 따라 혼합한 결과를 기록하는 것을 말한다. 

렌더 타겟의 픽셀 색상과 출력(픽셀 쉐이더) 색상을 결합한다. 

 

- 깊이-스텐실 검사(Depth-Stencil Testing)

픽셀이 그려져야 하는지를 결정하기 위해 깊이 값과 스텐실 값 데이터를 사용한다.

하나의 깊이/스텐실 버퍼만 활성화 되며 깊이-스텐실 버퍼에 스텐실 요소가 없으면 스텐실 검사는 항상 성공한다.

또한 깊이-스텐실 버퍼가 파이프라인에 연결되지 않으면 스텐실 검사는 항상 성공한다. 

 

깊이 검사?

더보기

z = min(Viewport.MaxDepth, max(Viewport.MinDepth, z))

출력 픽셀의 깊이 값을 깊이 버퍼의 같은 위치의 깊이 값과 비교한다. 

비교의 결과에 따라 출력 픽셀을 렌더 타깃에 출력하거나 출력하지 않는다.

 

 

 

 

 

 

 

 

참고 출처

Direct11을 이용한 3D게임프로그래밍 (저; 프랭크 D. 루나, 역; 류광, 출판사; 한빛미디어)

+ Recent posts