那些说兆芯 KX-U6780A 的 SSE4.2 比 AVX2 还强的,请 Close your 茅司。
-mavx2和-sse4.2我都跑了一遍,测试报告和编译参数自己看。
节约时间,没有跑三遍,只跑了一遍,测试报告中有Invalid Run水印,请自行忽略。
首先,-m64 -mavx2 -march=native -mtune=native -flto -funroll-all-loops-ftree-vectorize -static -Ofast 这个编译参数,我去年试过的,当时得分是 15.5,也是UOS系统。
刚刚又用这个参数试,得分 15.8,比去年高了 0.3,这应该算是 UOS 一年来的优化进步吧!
然后,把 -mavx2 改成了 -msse4.2 ,其它参数不变,得分15.4,说明兆芯KX-U6780A的SSE4比AVX2还强是不可能的。
![](http://tiebapic.baidu.com/forum/w%3D580/sign=aeec26246bf5e0feee1889096c6134e5/ce72a964034f78f0a9c5b3ce3f310a55b2191c5b.jpg?tbpicau=2024-06-21-05_f03fbbddad4527eb52a495b0f1edc457)
看看下面的单项成绩,AVX2的成绩虽然只好了一点点,但总好了一点点呗!
![](http://tiebapic.baidu.com/forum/w%3D580/sign=9726eb0ed78fa0ec7fc764051696594a/a57074c6a7efce1b68e0e1f7e951f3deb58f6567.jpg?tbpicau=2024-06-21-05_54e5095cc5f2d330680492f96559dca6)
-mavx2和-sse4.2我都跑了一遍,测试报告和编译参数自己看。
节约时间,没有跑三遍,只跑了一遍,测试报告中有Invalid Run水印,请自行忽略。
首先,-m64 -mavx2 -march=native -mtune=native -flto -funroll-all-loops-ftree-vectorize -static -Ofast 这个编译参数,我去年试过的,当时得分是 15.5,也是UOS系统。
刚刚又用这个参数试,得分 15.8,比去年高了 0.3,这应该算是 UOS 一年来的优化进步吧!
然后,把 -mavx2 改成了 -msse4.2 ,其它参数不变,得分15.4,说明兆芯KX-U6780A的SSE4比AVX2还强是不可能的。
![](http://tiebapic.baidu.com/forum/w%3D580/sign=aeec26246bf5e0feee1889096c6134e5/ce72a964034f78f0a9c5b3ce3f310a55b2191c5b.jpg?tbpicau=2024-06-21-05_f03fbbddad4527eb52a495b0f1edc457)
看看下面的单项成绩,AVX2的成绩虽然只好了一点点,但总好了一点点呗!
![](http://tiebapic.baidu.com/forum/w%3D580/sign=9726eb0ed78fa0ec7fc764051696594a/a57074c6a7efce1b68e0e1f7e951f3deb58f6567.jpg?tbpicau=2024-06-21-05_54e5095cc5f2d330680492f96559dca6)