Pracuji na klastrovém stroji, který používá správce úloh Slurm. Právě jsem spustil vícevláknový kód a chtěl bych zkontrolovat využití jádra a vlákna pro dané ID uzlu. Například,
scoreusage -N 92512
were "scoreusage" je příkaz, kterým si nejsem jistý.
Přijatá odpověď:
Už je to pár let, co jsem provozoval slum cluster, ale squeue
by ti měl dát to, co chceš. Zkuste:
squeue --nodelist 92512 -o "%A %j %C %J"
(to by mělo poskytnout vaše jobid, jobname, cpus a vlákna pro vaše úlohy na uzlu 92512)
BTW, pokud konkrétně nechcete podrobnosti pouze z jednoho konkrétního uzlu, může být lepší hledat podle ID zakázky než podle ID uzlu.
Na webu je k dispozici mnoho dobrých stránek s dokumentací o používání slurmu, které lze snadno najít přes google – většina univerzit atd. provozující cluster HPC si píše své vlastní dokumenty a nápovědu a „cheat-sheets“, přizpůsobené detailům jejich konkrétního clusteru (s) (berte to tedy v úvahu a přizpůsobte případné příklady SVÉMU clusteru). Existuje také dobrá obecná dokumentace o používání slurm
na https://slurm.schedmd.com/documentation.html