A přidávat jádra taky dost dobře nejde, x86 je takový kolos, že to hezký není (mikrokód, který simuluje na RISCu čílená CISC, prediktory skoků, různý mapovací tabulky,...) . A nakonec to stejně padne na RAMce.
Za sebe, dělal bych multičip SoC s vysokou efektivitou (RAM a CPU v jednom pouzdře), s nativním RISCem. No a hyperrychlou sběrnici (PCI-e x16) na jejich propojení + sdílení periferií. Ono by se tím vyřešila škálovatelnost, teplo by nevznikalo jenom na jednom broukovi (lepší chlazení), žádný úniky v rámci jednoho křemíku, lepší propustnost RAMky, která to stejně brzdí... A do serveru jich nasekat třeba 64 podle potřeby.