ddx와 ddy

반응형

ddx와 ddy가 하는일은 무었인가?

DDX : 윈도우 공간 X에 대한 근사 편도 함수를 반환한다.

DDY : 윈도우 공간 Y에 대한 근사 편도 함수를 반환한다.

 

말이 어렵다. 

그냥 ddx와 ddy는 그냥 화면 공간 좌표에 대해 값의 변화를 계산하는데 사용된다.

 

좀 더 풀어 써보면..

현재 픽셀셰이더 에서 처리하려고 하려고 하는 픽셀이 있다.

이 픽셀 위치가 1920x1024 에서 0,0 번째 위치라고 한다면 ddx(current pixel's  depth)의 의미는

0,0번 픽셀의 depth값과 0,1번 픽셀의 깊이값의 차이값을 나타낸다.

 

이 기능이 의미가 있는 이유는 기본적으로 픽셀 셰이더에서는 현재 픽셀에 대한 정보 외에

다른 픽셀에 대한 정보를 알 수가 없는데, gpu 특성상 처리 자체를 2x2로 하기 때문에

바로 옆의 픽셀과의 차이값은 ddx, ddy를 통해 얻어 올 수 있기 때문이다.

 

수학적으로 봤을 때 미분은 함수의 변화율 이며 기하학적으로 봤을 때는 표면에 있는 점의 기울기다.

GPU는 한번에 많은 픽셀을 처리하기 위해 2x2 픽셀 블럭을 구성한다.

이때 ddx는 2x2 블럭에서 가로 픽셀의 오른쪽과 왼쪽의 차이를 반환한다.

 

원본 이미지 출처 : http://www.aclockworkberry.com/shader-derivative-functions/

 

ddx와 ddy가 왜 필요한가?

ddx와 ddy는 결국 좀 쉽고 대충 말하면 픽셀값 차이 반환하는 함수라고 이해할 수 있다.

그런데 이게 왜 필요할까?

1. 밉맵

2. Flat Shader

3. Sharpening the edge of the texture

4. the edge artifacts of ddx/ddy reconstruction normal

https://www.programmersought.com/article/71564489650/

대표적인 예로 나는 밉맵 구현을 들 수 있다.

예제는 이곳을 참고하면 된다.

간단하게 설명하자면 텍스쳐는 여러개의 밉으로 만들어지며 렌더링시

어느 밉을 선택할지 gpu에서 선택해야 하는데 이 때 해당 텍스쳐가 매핑된 물체가

화면상에서 어느정도의 크기를 가지는지를 판별하여 밉을 선택한다.

(텍스쳐의 캐시 일관성, 텍셀과 픽셀의 1대1비율 등의 내용이 있지만 적당히 적당히.)

해당 물체가 화면에서 크기가 작다면 작은 밉을 선택하게 되고 반대의 경우 큰 밉을 선택한다.

이로 인해 에일리어싱을 줄일 수 있다.

 

또한 미분은 픽셀 셰이더에서 현재 삼각형의 face normal(면 법선)을 계산하는 데 사용할 수 있다.

현재 픽셀의 월드 위치의 수평 및 수직 미분은 삼각형의 표면에 놓인 두개의 벡터다.

이들의 외적은 표면에 직교하는 벡터가 되며 이것은 삼각형의 법선벡터이다. 

normalize(cross(ddx(Input.PosN), ddy(Input.PosN)))

 

test ddx_1.rfx
다운로드

 

그렇다면 미분이 아니라 분기를 사용하면 되지 않을까?

미분과 분기의 차이는 뭘까?

미분 계산은 여러 셰이더 인스턴스의 GPU 하드웨어에서 병렬실행을 기반으로 한다.

스칼라 연산은 2x2 픽셀의 블록을 4개의값으로 구성된 벡터를 가지는 레지스터에서 SIMD 아키텍처로 실행된다.

즉, 모든 실행 단계에서, 각 2x2블록에 속하는 셰이더 인스턴스가 동기화 되어 미분 계산을 하드웨어에서

빠르고 쉽게 구현할 수 있으므로 동일한 레지스터에 포함 된 값을 간단히 뺼 수 있다.

조건부 분기는 어떤가?

코어의 모든 스레드가 동일한 분기를 사용하지 않으면 코드 실행에 차이가 있다.

아래 이미지에서 8개의 셰이더 인스턴스가 있는 GPU코어에서 조건부 분기 실행인 분기를 예를 보여준다.

3개의 인스턴스가 첫번째 분기(노란색)을 사용하는데 다른 5개의 분기는 비활성 상태다.

노란색 분기 후에 실행마스크가 반전되고 나머지 5개의 인스턴스가 파란색 분기를 실행한다.

원본 이미지 출처 : http://www.aclockworkberry.com/shader-derivative-functions/

분기의 효율 및 성능손실 외에도 분기는 미분연산을 정의하지 않도록 하는 블럭에서 픽셀간의 동기화를차단한다.

이는 밉맵레벨 선택, 이방성 필터링 등의 미분연산을 필요로 하는 텍스쳐 샘플링에 대한 문제다.

이러한 문제에 직면 할 때 셰이더 컴파일러는 분기를 [flatten]을 사용하여 피하거나, 

텍스쳐를 읽는 코드를 분기 바깥으로 옮겨서 수행한다.

이 문제는 텍스쳐를 샘플링 할 때 명시적으로 미분이라 밉맵 레벨을 사용하면 피할 수 있다.

 

분기안에 미분이 있다면 어떻게 될까?

아래의 의사코드가 gpu에서 실행된다고 생각해 보자.

float tmp = 10000;

float color;

[branch]

if(xpos > side)

{

tmp = xpos * xpos;

float dx = ddx(tmp);

color = float3(dx,0,0);

}

else

{

tmp = xpos*xpos;

float dx = ddx(tmp)

color = float3(0,dx,0);

}

return color * 100;

2x2블럭의 픽셀에서 내부 픽셀이 첫번째 분기문으로 들어갈 때 

두번째 분기 실행을 기다리는 비활성 픽셀의 tmp값은 여전히 10000이어야 한다.

하지만 해당 코드는 오류를 발생시키는데 오류의 내용은 분기문 내에 미분 연산을 

가질수 없다는 내용이며 [branch]속성을 제거하면 컴파일이 되지만 분기가 평평해진다.(flat)

 

셰이더 미분의 내부블럭 정렬을 보여주는 간단한 실험을 해 보자.

ddx 테스트.

화면의 절반을 0, 나머지 절반을 1이라 했을때(step)이 값을 ddx로 테스트 해 보자.

미분 계산은 2x2픽셀 블럭에 대해 수행되므로 단계전환이 발생하는 위치에 따라 두가지 다른 결과가 예상된다.

1. 단계 전환이 2x2픽셀 블럭의 중간에 빠지면 2픽셀 두께의 수직선이 표시된다.

2. 단계 전환이 2개의 인접한 2x2픽셀 블럭 사이에 속한다.

   이 경우 두 블럭 모두 0과 같은 도함수를 계산하기 때문에 세로선이 표시 되지 않는다.

 

img1. 982 위치에서 변경됨.

 

img2. 983 위치에서 변경됨. (odd_step 값 1)

 

img3. 981과 983 위치에서 바뀜. (show derivative 값 1)

test_ssp.rfx
다운로드

 

위 렌더몽키 파일에 hlsl 버전과 opengl 버전 이렇게 두개의 버전을 만들어 두었다.

코드 내용은 같은데 이상하게 odd 값이 틀리다.

dx에서는 짝수에서, gl에서는 홀수에서 미분선이 표시된다.

이 차이는 뭘까? (누가 답변해주면 참 좋을 텐데....)

 

 

 

https://www.opengl.org/pipeline/article/vol003_6/

 

http://www.iquilezles.org/www/articles/checkerfiltering/checkerfiltering.htm

https://developer.nvidia.com/gpugems/gpugems2/part-iii-high-quality-rendering/chapter-28-mipmap-level-measurement

https://www.scratchapixel.com/lessons/3d-basic-rendering/introduction-to-shading/shading-normals

https://www.enkisoftware.com/devlogpost-20150131-1-Normal-generation-in-the-pixel-shader

Reference Link

- 미분 도함수 개념 원리 활용 증명 철저하게 이해하기

- 적분 구분 구적법 dx dy 개념과 원리 이해하기

An introduction to shader derivative functions

- What Is Ddx And Ddy

- 밉맵 텍스쳐링

- Texture LOD calculation

- Derivatives

- shader에서 if와 ler의 성능은?

- HLSL Flow Control

- 편미분 전미분 개념과 활용 완전히 이해하기

'정리요망' 카테고리의 다른 글

Texture LOD calculation (useful for atlasing)  (0) 2019.12.06
wrapped diffuse  (2) 2013.12.24
TAGS.

Comments