[0312 조진현] good bye dx9

영원할 것 같았던~~ DX9 와의 시간은…

Good bye~~ DX9! 이제 너랑 안놀아~~

어려운 걸로 준비했습니다! 오늘의 내용 DevRookie 199회 특집이라서…

DirectX 의 변화를 요구하다… 멀티 코어 GPU 발전

DirectX 10 그래서 등장했습니다!!!

DirectX11 API는… DirectX 10.1 기반입니다!!

DirectX11 의 특징들 Dynamic Shader Linkage ,[object Object]

interface construct works on older profilesHardware Tessellation ,[object Object],HLSL Shader Model 5 ,[object Object]

Some new constructs emulated on older profilesMultithreaded Rendering & Resource Creation ,[object Object],DirectCompute ,[object Object]

CS 4.x on some DX10.x h/wBC6H/BC7 Texture Formats ,[object Object],[object Object]

http://blog.naver.com/asesin/130072247615

DirectX9 싱글 코어 기반의 API API 중심의 파이프라인 처리

DirectX10 멀티 코어 기반의 API 하드웨어 중심의 파이 파이프라인 처리

더 이상 게임 목적이 아니다!!! 굴러온 돌 Win32 Application Win32 Application Win32 Application Future Graphics Components Direct3D API GDI Direct3D API User-Mode Driver HAL Device DXGI Device Driver Interface ( DDI ) Kernel-mode Driver. Hardware Graphics Hardware

하드웨어가 변하기 시작!!!

우리가 하는 일은… API 를 통한 하드웨어 제어

하드웨어는 이미 변했다! Rasterizer Rasterizer Tessellator

시대는 점점… Multi-Thread Multi-Core Multi-GPU

DirectX 의 최신 트렌드는? 멀티 코어 활용 GPU 활용

DX11 은 이를 더욱 향상!! DirectX10 API 디자인 목표 ,[object Object],☞ Device와 driver 간의 오버헤드 감소. ,[object Object],☞ 렌더링 작업의 여러 스레드들로 분산. ,[object Object],☞ 한번 기록한 커맨들의 재사용으로 인한 성능 향상.

CPU 처리 최적화! CPU 성능 개선 이슈 Debug Layer Draw Call Management Constant Updates Resource Updates State Management Shader Linkage Asynchronous Queries …

멀티 스레딩 지원 강화 Direct3D API 측면에서의 변화 ID3D11Device ID3D10Device ID3D11DeviceContext

thread-safe Core Interface 분류

이 모든 게 멀티스레딩을 위함! ID3D11DeviceChild 상속 ID3D11ClassInstance ID3D11ClassLinkage ID3D11CommandList ID3D11RasterizerState ID3D11SamplerState ID3D11DepthStencilState ID3D11InputLayout ID3D11BlendState ,[object Object]

사용가능한Device를 검색

리소스들을 생성( POOL ),[object Object]

ID3D10Device 생성( 스왑체인 생성 )

리소스 생성내 블로그에 관련 글 있다!

DX10부터는… Caps 소멸 Device-Lost 걱정 無

그렇다면, 리소스 관리 전략은 어떻게 구상해야 하나요?

리소스 관리 전략 리소스의 업데이트 CPU에서의 접근 권한

D3DX 9 Lib Xbox Math Lib D3DX 10 Lib

XMVerifyCPUSupport() SSE/SSE2 VMX128

XNA Math 를 써야하는 이유 더 많은 inline 더 좋은 SIMD최적화 D3DXMath는 끝!

주의! 혼합해서 사용하지 말 것!

Texture 시대 Pixel 시대 Vertex 시대

Regularly drawn Froblin No tessellation used

FroblinClose-up:No tessellation

폴리곤을 늘리자!!! 어떻게 하면 더욱 정밀한 표현을 할 수 있나요?

High Detail Froblinwith Tessellation and Displacement Mapping

Froblin With Tessellation and Displacement Mapping Close-up

많은 폴리곤은 범죄!!! 왜 게임에서는 폴리곤갯수를 증가시키기 어려운가요?

근본적으로 본 개수가 많음!!! 스키닝 연산의 최적화 각종 수치 데이터를 최대한 활용. 데이터 양을 줄이는 방법. DX10의 경우에는 StreamOut기능 활용.

H/W 테셀레이션 님이 등장! 문제들… 그래픽 퀄리티의 향상 텍스쳐링의 한계 멀티패스 렌더링의 보편화 스키닝 부담

DX11 에서 채택! ATI의 노력 RADEON 8500 시리즈에서 시작. X-Box 360 에서 도입. ATI 제품군에 전면 도입.

제어점들에 의해 정의.

삼각형들은 패치들에 의해서 증가.

패치 단위로 LOD 가 연산.,[object Object]

카메라 기반 or 패치의 크기.

효과적인 렌더링 방법.,[object Object]

DX9 vs DX11 Tessellation Pipeline Input Assembler Vertex Shader Input Assembler HullShader Tessellator Tessellator Vertex Shader Domain Shader Memory / Resources Geometry Shader Stream Output Rasterizer Rasterizer Pixel Shader Pixel Shader Output Merger Output Merger

이미 존재했던 개념! DX9 Tessellation API ,[object Object]

IDirect3DDevice9::SetNPatchMode

DX9의 테셀레이션 문제점 ,[object Object]

별도의 메모리가 필요.,[object Object]

LOD 판정.HullShader Tessellator Domain Shader Geometry Shader Rasterizer Pixel Shader Output Merger

Parallel~~~ DX11 Adaptive Tessellation Input Assembler Vertex Shader HullShader Tessellator Control Points( ID 식별 ) Hull Shader Domain Shader Geometry Shader patch control points from the VS. Rasterizer Patch Constant Data ( Tessellation Factors 포함 ) Pixel Shader Output Merger

DX11 Adaptive Tessellation Input Assembler Vertex Shader HullShader BaryCentric Coordinate 생성 Tessellator Domain Shader Geometry Shader Stream Output Rasterizer Pixel Shader Output Merger

무게 중심 좌표(BaryCentric Coordinate ) C weight = Area of APB / Area of ABC

[domain("tri")] DS_OUTPUT DS( HS_CONSTANT_DATA_OUTPUT input, float3 BarycentricCoordinates : SV_DomainLocation, const OutputPatch<HS_CONTROL_POINT_OUTPUT, 3> TrianglePatch ) { DS_OUTPUT output = (DS_OUTPUT)0; // Interpolate world space position with barycentric coordinates float3 vWorldPos = BarycentricCoordinates.x * TrianglePatch[0].vWorldPos +BarycentricCoordinates.y * TrianglePatch[1].vWorldPos + BarycentricCoordinates.z * TrianglePatch[2].vWorldPos;

Surface evaluation Displacement mapping DX11 Adaptive Tessellation Input Assembler Vertex Shader HullShader Tessellator Hull Shader Output Control Points Domain Shader Domain Shader Vertex Position Geometry Shader Stream Output Rasterizer Tessellator Stage Output Texture Coordinates Pixel Shader Output Merger

H/W Tessellation 의 이점은 ? GPU 의 프로세싱 능력 활용! ( 1PASS ) 메모리 절약! 대역폭 감소! 렌더링퀄리티 향상 성능의 향상

DX11을 활용할 만큼 GPU가 빠른가요?

Rasterizer Geometry Unit( with Tessellator )

의심하지 말라~~ 테셀레이션은 성능 향상이 목적!!!

옛날 그래픽 카드들에서 DX11 실행이 가능한가요?

DX9  DX11 로 업그레이드 하고 싶어요! 오래 걸리나요?

어렵다!!! DX9  DX11 DX9  DX10 으로 포팅하라!  모든 파이프라인 사용 방법 수정  스테이트 오브젝트 사용할 것.  InputLayout으로 쉐이더 연결할 것.  상수 버퍼 사용할 것.  etc..

테셀레이션은렌더링 목적! 테셀레이션 처리된 메시의 경우 충돌체크를 어찌해야 하나요?

테셀레이션 처리된 메시의인스턴싱 처리는어떻게 해야 하나요?

다시 소프트웨어 렌더링 시대로 회귀할 것이다!!

cbuffercbPerFrame : register( b0 ) { matrix g_mViewProjection; float g_fTessellationFactor; }; struct VS_CONTROL_POINT_INPUT { float3 vPosition : POSITION; }; struct VS_CONTROL_POINT_OUTPUT { float3 vPosition : POSITION; };

VS_CONTROL_POINT_OUTPUT VS( VS_CONTROL_POINT_INPUT Input ) { VS_CONTROL_POINT_OUTPUT Output; Output.vPosition = Input.vPosition; return Output; }

struct HS_CONSTANT_DATA_OUTPUT { float Edges[3] : SV_TessFactor; float Inside : SV_InsideTessFactor; }; struct HS_OUTPUT { float3 vPosition : POSITION; };

HS_CONSTANT_DATA_OUTPUT ConstantHS( InputPatch<VS_CONTROL_POINT_OUTPUT, 3> ip, uintPatchID : SV_PrimitiveID ) { HS_CONSTANT_DATA_OUTPUT Output; Output.Edges[0] = Output.Edges[1] = Output.Edges[2] = g_fTessellationFactor; Output.Inside = g_fTessellationFactor; return Output; }

[domain("tri")] [partitioning(HS_PARTITION)] [outputtopology("triangle_cw")] [outputcontrolpoints(3)] [patchconstantfunc("ConstantHS")] HS_OUTPUT HS( InputPatch<VS_CONTROL_POINT_OUTPUT, 3> p, uinti : SV_OutputControlPointID, uintPatchID : SV_PrimitiveID ) { HS_OUTPUT Output; Output.vPosition = p[i].vPosition; return Output; }

struct DS_OUTPUT { float4 vPosition : SV_POSITION; }; [domain("tri")] DS_OUTPUT DS( HS_CONSTANT_DATA_OUTPUT input, float3 UVW : SV_DomainLocation, const OutputPatch<HS_OUTPUT, 3> patched ) { DS_OUTPUT Output; float3 finalPos = UVW.x * patched[0].vPosition + UVW.y * patched [1].vPosition + UVW.z * patched [2].vPosition; Output.vPosition = mul( float4(finalPos,1), g_mViewProjection ); return Output; }

Deferred Cotext!!! 멀티 스레드 기반으로 렌더링 작업을 할 수 있나요?

Multi-Threaded Rendering ID3D11Device Immediate Context ID3D11DeviceContext Deferred Context free thread Rendering Command

DX11의 렌더링 Immediate Context Deferred Context

ID3D11CommandList intm_iRenderThreadCount; HANDLE* m_pDefferredThreadHandleArray; HANDLE* m_pBeginDeferredEventHandleArray; HANDLE* m_pEndDeferredEventHandleArray; ID3D11DeviceContext** m_ippDeferredContextArray; ID3D11CommandList** m_ippCommandListArray

CreateDeferredContext ID3D11DeviceContext* ipResultPointer = 0x00; for( inti = 0; i < m_iRenderThreadCount; ++i ) { ipResultPointer = JinRenderUtil::CreateDeferredContext( this->m_ipGPU ); m_ippDeferredContextPointerArray[ i ] = ipResultPointer; m_pDeferredThreadHandleArray[ i ] = (HANDLE)_beginthreadex ( NULL,0, DeferredProcForRenderPerScene, &i, CREATE_SUSPENDED, NULL ); ResumeThread( this->m_pDeferredThreadHandleArray[ i ] ); }

FinishCommandList for(;;) { ::WaitForSingleObject( GetBeginDeferredEventHandle( iInstance ), INFINITE ); RenderSomething(); hr = ipDeferredContextPtr->FinishCommandList( FALSE, &ipCommandListPtr ); assert( hr == S_OK ); ::SetEvent( Jin3D::GetInstance()->GetEndDeferredEventHandle( iInstance ) ); }

ExecuteCommandList for( inti = 0; I < m_iThreadCount; ++i; ) { m_ipImmediateContext->ExecuteCommandList( m_ippCommandListArray[ I ], TRUE ); }

MTR 이란… 스레드들을 생성 ( 코어 개수만큼 ) 커맨드 생성( 각 스레드별) 렌더링( 메인 스레드) 커맨드 전송( To GPU )

GPGPU ? DirectCompute ? ComputeShader ?

GPGPU General-Purpose computing on Graphics Processing Unit

DirectCompute GPGPU 를 위한 MS의 플랫폼

Applications Media playback or processing, media UI, recognition, etc. Technical Domain Libraries Domain Languages Accelerator, Brook+, Rapidmind, Ct MKL, ACML, cuFFT, D3DX, etc. Compute Languages DirectCompute, CUDA, CAL, OpenCL, LRB Native, etc. Processors CPU, GPU, Larrabee nVidia, Intel, AMD, S3, etc.

ComputeShader DirectCompute를 구현하기 위한 HLSL

CPU vs GPU SIMD SIMD SIMD SIMD SIMD CPU 0 CPU 1 SIMD SIMD SIMD SIMD SIMD SIMD SIMD SIMD SIMD SIMD SIMD SIMD SIMD SIMD SIMD CPU 2 CPU 3 SIMD SIMD SIMD SIMD SIMD SIMD SIMD SIMD SIMD SIMD SIMD SIMD SIMD SIMD SIMD L2 Cache SIMD SIMD SIMD SIMD SIMD L2 Cache

[0312 조진현] good bye dx9

Recommended

Recommended

More Related Content

What's hot

What's hot (20)

Viewers also liked

Viewers also liked (20)

Similar to [0312 조진현] good bye dx9

Similar to [0312 조진현] good bye dx9 (20)

More from 진현 조

More from 진현 조 (12)

[0312 조진현] good bye dx9