Zrovna dneska jsem si precetl peknou reakci na report o problemech, kteremu celi nasazeni Hadoopu
http://hardware.slashdot.org/comments.pl?sid=7411863&cid=49686651
Dluzno dodat, ze na zkoumani, jak se tam ty data snazi je zajimave, urcite nejeden profesor si na tom honi triko. Skoda ale, ze prakticke vyuziti je trosku problematictejsi.
Problem je, ostatne jak je psano v tom komentari, pouzit nastroje na big data na neco, co big data nejsou. Je to strasny overhead vypocetne, organizacne, z hlediska dev i ops...
Na druhou stranu - pro urcitou velikost dat nebo pro nektere druhy zateze k podobnym nastrojum proste jit musis, protoze ti nic jineho nezbude.
Asi si to zajdu poslechnout.
praktické využití problematické? Hadoop je nenažraná mrdka, když k tomu člověk dá hbase, výkonu není nikdy dost. Na druhou stranu se poměrně snadno dá mít cluster s tisíci TB dat s myšlenkou, že železo je levné a mohu ho mít hodně. Uspravují to celé dva lidé a svět je spokojený :).
Základ je správně zvolit technologie a používat je k tomu, čemu jsou určeny.
Hadoop je super entry point, nejedna společnost u nás v ní má mraky dat, ono totiž ani není moc alternativ. U mnoha podobných hejtů mi to spíše připadá jako propagace nějakého placeného produktu :).
Přednáška se konala v rámci předmětu BI-VZD, asi jste dorazil do špatné místnosti. Záznam bohužel není. Pokud vás zajímají podobné technologie, budeme organizovat summer camp - více na http://datalab.fit.cvut.cz/ a https://eclubprague.com