Existuje linuxové distro rocks, které je vytvořeno pro shlukování a je založeno na CentOS/RHEL.
Silnou stránkou kamenů je, že z větší části zvládne a udělá spoustu drobností za vás.
- Provede automatickou instalaci a přeinstalaci, a pokud lze vaše počítače zavést přes PXE, bude počáteční instalace sestávat z PXE spouštění vašich uzlů. Pokud máte velký počet výpočetních uzlů, používají interně bittorrent k distribuci balíčků, což odstraňuje významné úzké hrdlo pro (re)instalaci celé věci.
- Ve výchozím nastavení vám poskytne velmi homogenní výpočetní prostředí.
- Ve výchozím nastavení nastaví a použije NFS interně a existují možnosti pro použití PVFS2 (které jsem nezkoušel).
- Pokud jde o systémy řazení do fronty/dávky, měl by to nastavit a spravovat za vás, ve výchozím nastavení si myslím, že používá SGE, existuje také role (jejich formát sdružování softwaru) pro točivý moment.
- Zajistí to konzistenci uživatelů/skupin/atd. v celém clusteru
- Zobrazí graf využití zdrojů prostřednictvím ganglií
Pokud bych měl vykopat nevýhody
- Přidání/odebírání softwaru z výpočetních uzlů vyžaduje jejich přeinstalaci (i když zajišťuje homogenitu).
- Přidávání/odebírání softwaru zahrnuje buď přidávání aroll (jejich způsob sdružování rpm/zařízení), nebo úpravu xml-souborů. Nicméně je to docela dobře zdokumentováno, takže pokud jste ochotni vynaložit nějaké úsilí na čtení dokumentace, měli byste být v pořádku. Navíc je tu mailing-list, pokud se zaseknete.
- Je založen na CentOS/RHEL, což je trochu pozadu za "bleedingedge"
- Bude vás to (většinou) nutit dělat věci „po jejich“, drobné změny, které vám možná projdou, možná úpravou některých souborů xml-config, velké změny bude možná nutné implementovat vytvořením, přidáním nebo úpravou rolí (jejich formát SW/doplňku)
Máme malý cluster, který má jako základní distribuci openSUSE, ale nemyslím si, že je to příliš důležité. Ubuntu vypadá jako životaschopná alternativa a má poměrně dost dokumentace a podpory komunity. Kromě linuxu provozujeme Sun Grid Engine (a náš cluster dokonce docela hladce zahrnuje počítače s Mac OS), ale slurm by pravděpodobně fungoval pro jednoduché nastavení. Sdílíme domovské adresáře a /usr/local přes NFS z centrálního serveru. U nás to funguje dobře. Další podrobnosti jsou k dispozici na našich webových stránkách (prostřednictvím internetového archivu).