流负载和非USWC内存
我刚刚读了这篇相当有趣的文章,《复制加速的视频解码帧缓冲区》。
他们在哪里解释了如何使用流负载尽可能快地从USWC内存中进行复制。
我的问题是,为什么这种技术也不能从非USWC内存中加速普通副本?
流式加载将一次性读取整个缓存行,而不是常规加载一次仅加载16个字节的常规加载。我想念什么?从填充缓冲区复制到将写入缓存的“缓存缓冲区”不会有太多开销吗?
没有找到相关结果
已邀请:
1 个回复
曝匿弄罚