|
发表于 2020-9-4 09:08:38
|
显示全部楼层
首先定个调, 这个 pi 的跑分基本是娱乐, 不过有一点说明意义. 而后面 zip 解压基本就是瞎胡闹, 大家基本第一反应就是 windows 自带解压没用多核或者是机械盘.
那么前者我这边测试了下 Android 的这个所谓 Realpi, 是一个单核的跑分. 不然跑半分钟早就会有明显发热了.
我这里测下来的 855+ 的成绩是:
另外还有台 Pixel 2 XL, 跑出来是 98s.
而 x86 这边的情况:
编译器: Apple clang version 11.0.0 (clang-1100.0.33.17)
i7-7700HQ@3.9GHz: 36s
i7-9900K@4.9Ghz: 27s
其实可以看到, 7700HQ 仅仅是和 865 跑到了一个水平... 9900K 获胜的幅度也不算太大.
而其他几位用 8650U/8550U 的答主, 基本上在 Windows 上用自己编译的版本也就跑出了 40s 的成绩(MSVC -O2), 还不如 865.
那么首先还是得批评小米用了自带那个中古 x87 win32 binary, 80386+x87 能用的通用寄存器少, 而且 x87 的运算精度也就 80 bit...
然后 3900X 跑出来的成绩是:
fstp, x87
LLVM 出来的二进制的结构明显就比刚才那个好看了, 用到了 128bit SSE XMM 寄存器:
所以简单的说, 目前 865 那个 2.84Ghz 在跑通用程序(这个 realpi 真的谈不上好的数学运算代码的水平)的性能其实可以和 8550U 这种中端低压处理器媲美. 这里的前提就是两者的供电能够带的动, 散热上压力也不大, 就看单核跑满的性能.
很显然 7nm 带来了在 2-3GHz 上很大的能效提升, 所以在 SoC 只有个位数功率的时候, 也能和 14nm CPU 的十几瓦功率的性能接近. 另外就是 IPC, skylake IPC 现在既不如 Ice Lake, 也不如隔壁 Zen 2, 峰值单核性能基本依靠跑到 4.5Ghz+ 那种超高频率.
好的水平:
http://www.numberworld.org/y-cruncher/y-cruncher 的 pi 计算器, 这个 1000万位基本上就是 0.x 秒出来的事情.
具体原因:
算法本身更好, 并且对微架构做了优化用了正经 SIMD, 从 SSE 到 AVX/AVX512用了正经多线程
至于另外一个变态的例子:
当然原因就是 A13 单核最高能分到 6W 的功率, 本身 L3 大就能在 Geekbench 里面很多偏向日常应用有优势. 不过如果看 Cinebench R20 那种持续多核心性能, 移动平台终归还是很吃亏的.
<a data-draft-node="block" data-draft-type="mcn-link-card" data-mcn-id="1210654670932586496"> |
|