Pro jiné architektury existuje optimalizace taky. V podstatě jde o porovnání dvou vektorů. Na SSE2 se použije _mm_cmpeq_epi8, na ARM zase něco jiného (kombinace shift apod - vyžaduje o něco víc instrukcí, ale pořád mnohem rychlejší než porovnání po bytes). Až se rozšíří RISC-V (standardně s vector extension), tak určitě využijí i tam.