Ono lze dělat spousty věcí, otázka je jestli to dává nějaký smysl. Technicky je možné kde-co, ale logicky - ano nosql vznikaly právě proto, že použití SQL je extrémně svazující při použití v clusterech. Pokud těch serverů bude 10... 100 a víc?
Zatlouct hřebík lze i šroubovákem, ale asi s ním nepůjdu mlátit hřeby na stavbu a tvářit se, že jsem fakt profesionál.
ale s tím si užiješ také dost práce, cassandra sice umí lineárně škálovat do desítek, stovek nodů, ale už u 60 jsme zažívali poměrně peklo, to udržet stabilní a dodržet SLA. Scylla je super, ale tam škálování je dost v plenkách.
S scyllou jsme ale narazili na omezení počty tabulek, partitions a pak i celkovou velikostí cluster.
U Cassandry si zase musíš být dost jistý co děláš, s pětkou se hodně věcí markantně vylepšilo, ale pořád končíš s tím, že pokud máš pár desítek TB dat, vlastně ten Pg není tak špatný.
Moji práci je právě tyhle uber super databáze připravit na produkci a nastavit ops pro provoz. K Pg se vždy rád vracím právě kvůli tomu, že když něco do dokumentace napíšou, že funguje, tak to i funguje, u scylladb podávají spousty zavádějících informací, u monga lžou atd.
Tady asi jde spíš o to, že vezmou dva koncepty a jejím spojením spojí jejich největší nevýhody. Následně to prodávají jako super cloud řešení.
Cassandra a reimplementace ScyllaDB má alespoň solidní návrh.
Jako upřímně mám z těch distribuovaných systémů docela hrůzu když si člověk představí jak to vlastně funguje, ale nikdy mě to nezklamalo. Odpověď na otázku "a fakt se nemůže nic stát" ve mě vzbuzuje potutelný smích.
mně se líbí u cassandry, že je nějak navrhnutá, autoři to neskrývají, jasně deklarují a dokumentují, horší už je, že to nečtlou klienti, kteří si jí vybírají na projekty, takže věčné problémy s řazením, indexy, mazáním a opakovanou změnu hodnot jsou na světě.
Pak velký problém jsou county a jejich CRDT, při desítkách nodů a občasných problémech na síti/komunikaci to dělá velkou neplechu. Nelze snadno zjistit nějaký rep lag a ops je dost náročné.
Souhlasím s myšlenkou, že extrémní hondba za distribuovanými systémy a pořád novým a novým chybovým SW je úsměvná. Každá rok nasazujeme do produkce novou distribuvanou databázi a přitom pořád vše raději řídíme obstarožním zookeeperem, protože ani po těch letech ve mě etcd nebo consul nevzbuzují dostatečnou důvěru, hlavně nějakou observabilita je ta tam.
Ale co, když klienty baví pořád přicházet s novými nápady, jak jim technologie změní jejich SW, rád jim s tím pomohu, rád se v těch databázích hrabu.