Jan Hubička ze SUSE se zabýval vlivem vektorizace v současném GCC. Konkrétně porovnával -O2 -ftree-vectorize -ftree-slp-vectorize
s -O2
. V SPEC testu na procesorech zen a kabylake byl výkon s vektorizací o 4–10 % lepší. Přitom kompilace se prodloužila maximálně o 3 % a velikost binárního souboru maximálně o 4 %.
Jan by chtěl prosadit -ftree-vectorize
a -ftree-slp-vectorize
do -O2
, podobně jak to má Clang. Dojde k tomu patrně až v GCC 10.
(zdroj: phoronix)