ipad2霓虹浮点数速度相对于ipad1

| 在ipad1和ipad2上测试NEON指令时,我注意到ipad2上的代码几乎没有加快速度,因为ipad2上的大多数功能实际上比ipad1上运行得快得多。 这是针对诸如VMUL,VLD1,VADD和VSUB等指令的,使用诸如q0之类的四字寄存器进行FFT等操作。 此外,我注意到苹果自己的FFT函数vdsp_fft_zrip也无法为ipad2加速。 所以问题是,对于四字SIMD类型的指令,ipad2 NEON的执行速度是否比ipad1 NEON引擎快?     
已邀请:
        与核心的其余部分相比,A4上的NEON单元异常强大。 A5的其余核心与A4相比有很大改进,但NEON单元的性能几乎没有变化。您正在观察的是预期的。 当然,现在有两个核心,因此,如果您可以同时使用这两个核心,则仍然可以看到明显的加速。而且,A5的双精度计算已从A4进行了很大改进,因为它已经完全流水线化。     
        即使在最近推出的64位ARM上,NEON也会保持相当长的一段时间。 NEON不能从提高时钟速度中受益匪浅。 NEON已经非常快,以至于它花费大部分函数执行时间来等待内存中的数据。     

要回复问题请先登录注册