Většina těch projektů má základy v akademické sféře - a Java je posledních 15 let standardním jazykem pro výuku - což bych viděl jako primární důvod. Sekundární - všechno už jsou to CAP projekty - s horizontálním škálováním, takže potřebujete pořešit síťovou vrstvu, případně sandboxing. Na to je Java, a její knihovny dobrá - v C, C++ by to bylo dost nepříjemná práce, a GO v době vzniku těchto projektů nebylo nebo bylo v plenkách. Rychlostně to není nic extra, dá se ale horizontálně škálovat, a v základu je nějak řešena dostupnost - a díky Javě experimentování nebylo extra programátorsky náročné, vývoj zlevnilo i reuse relativně komplexních komponent - např. ElasticSearch používá Lucene, atd. Pro práci je to dost rychlé, když máte dost paměti, rovnou je tam nějaké HA, které alespoň, když jsem s tím dělal, bylo docela potřeba, a je to zadarmo. Alternativní bigdata nástroje jsou pekelně drahé.