By ses divil! V oblasti fyzikalnich simulaci (fem, fdm, bem, cfd, atd) se toci velke penize, a to jak v sw/hw tak i v sluzbach. Jenze resi se to kodem co byl napsan pred 40-50 lety ve fortranu, bez velkejch zmen, protoze kvuli par registrum nema cenu to prepsat.
Jo, kdybych mohl resit alespon sub16x16xQuad (to je jestli se nepletu 4kB) v cpu-registrech, to by bylo neco jinyho. Jenze delat konverzi z Quad na 8x bfloat16 nema smysl, protoze to bych hned o tu rychlostni vyhodu prisel...