... streams with PSO switches and draw calls - Full set of primitive data types in all GPU-visible structures and C++ compatible layouts. 8-bit types etc - Minimal additional metadata to enable tiling - no ahead of time graph declaration, use tile memory as caches ...
-
-
এই থ্রেডটি দেখান
-
... and keep reads/writes transparent - Only specify execution dependencies in API, share caches and storage formats between units - Remove fixed function vfetch (& stream instancing), combined textures&samplers, packed depth&stencil from API - single way to do anything common...
এই থ্রেডটি দেখান -
- Open commonly supported shader IR with open toolchains, fuzzed bytecode tests with days of test coverage - Remove geometry and tessellation shader stages, replace with compute, figure out how to chain compute with raster to reduce bandwidth on the app side
এই থ্রেডটি দেখান -
- CPU and GPU validation, asserts in shader code, cross vendor shader debugging - Cross vendor simplified performance analysis for ALU, TEX, raster etc etc - Open source emulation layers for legacy APIs and features, core API is clean - Fight complexity every step of the way
এই থ্রেডটি দেখান
কথা-বার্তা শেষ
নতুন কথা-বার্তা -
-
-
I would trade all of that for display stack with sub 20ms latency. (e.g. not multiple frames behind) [https://danluu.com/input-lag/ ]
-
Different priorities - my list is for complex real-time graphics workloads. I'd love sub 20ms latency in the display stack as well, VR setups can manage it but it's tricky.
কথা-বার্তা শেষ
নতুন কথা-বার্তা -
-
-
I like your list. I would add gather on volume textures, per pixel masking on hardware filter samples, hw filter offsets (like gnm ), dispatch invokation from GPU.
-
I forgot about dispatch on GPU - some usecases can be solved by generating a command buffer but I agree a more immediate option to launch wavefronts is necessary. Other things are very tactical, not sure about them.
-
The other things would help with image quality / performance. For example any time you do some sample culling of your filtering you have to do it in software. The vgpr and occupancy takes a shit when you have to do software filtering and some techniques cannot be done.
কথা-বার্তা শেষ
নতুন কথা-বার্তা -
-
-
Some way to debug would be nice
-
For some shaders you can make a c# equivalent , debug there then translate to CG, its a pain i know , but better than nothing when the shader is not "behaving friendly"
কথা-বার্তা শেষ
নতুন কথা-বার্তা -
-
-
I support that wish list :)
ধন্যবাদ। আপনার সময়রেখাকে আরো ভালো করে তুলতে টুইটার এটিকে ব্যবহার করবে। পূর্বাবস্থায়পূর্বাবস্থায়
-
-
-
Really good list!
ধন্যবাদ। আপনার সময়রেখাকে আরো ভালো করে তুলতে টুইটার এটিকে ব্যবহার করবে। পূর্বাবস্থায়পূর্বাবস্থায়
-
-
-
(GP)GPU wishlist: - Single-source graphics and compute - Novel C++ in all contexts - Preferably C++AMP-ish API - restrict(gfx) for more constrained graphics context, but have default restrict(auto) to have context deduced - cross-platform, cross-vendor
-
Your list seems somewhat graphics heavy. I'm just looking for an easier way to visualize my computations without having to jump through too many flaming hoops. There's no reason to not have the best of both worlds.
কথা-বার্তা শেষ
নতুন কথা-বার্তা -
-
-
Yes please!
ধন্যবাদ। আপনার সময়রেখাকে আরো ভালো করে তুলতে টুইটার এটিকে ব্যবহার করবে। পূর্বাবস্থায়পূর্বাবস্থায়
-
লোড হতে বেশ কিছুক্ষণ সময় নিচ্ছে।
টুইটার তার ক্ষমতার বাইরে চলে গেছে বা কোনো সাময়িক সমস্যার সম্মুখীন হয়েছে আবার চেষ্টা করুন বা আরও তথ্যের জন্য টুইটারের স্থিতি দেখুন।