GNU/Linux >> Znalost Linux >  >> Linux

Zkontrolujte využití procesoru/vlákna pro uzel ve Slurm Job Manager?

Pracuji na klastrovém stroji, který používá správce úloh Slurm. Právě jsem spustil vícevláknový kód a chtěl bych zkontrolovat využití jádra a vlákna pro dané ID uzlu. Například,

scoreusage -N 92512

were "scoreusage" je příkaz, kterým si nejsem jistý.

Přijatá odpověď:

Už je to pár let, co jsem provozoval slum cluster, ale squeue by ti měl dát to, co chceš. Zkuste:

squeue --nodelist 92512 -o "%A %j %C %J"

(to by mělo poskytnout vaše jobid, jobname, cpus a vlákna pro vaše úlohy na uzlu 92512)

BTW, pokud konkrétně nechcete podrobnosti pouze z jednoho konkrétního uzlu, může být lepší hledat podle ID zakázky než podle ID uzlu.

Na webu je k dispozici mnoho dobrých stránek s dokumentací o používání slurmu, které lze snadno najít přes google – většina univerzit atd. provozující cluster HPC si píše své vlastní dokumenty a nápovědu a „cheat-sheets“, přizpůsobené detailům jejich konkrétního clusteru (s) (berte to tedy v úvahu a přizpůsobte případné příklady SVÉMU clusteru). Existuje také dobrá obecná dokumentace o používání slurm na https://slurm.schedmd.com/documentation.html


Linux
  1. Přečtěte si, jak zkontrolovat využití šířky pásma v cPanel

  2. Jak používat příklady zámku C Mutex pro synchronizaci vláken v Linuxu

  3. Jak vypočítat využití CPU procesu pomocí PID v Linuxu z C?

  1. Jak můžete zjistit číslo procesoru, na kterém běží vlákno?

  2. Kdy zkontrolovat EINTR a opakovat volání funkce?

  3. Jak mohu zkontrolovat počet zásahů pro každé pravidlo v iptables?

  1. Linux top command:What are us, sy, ni, id, wa, hi, si and st (pro využití CPU)?

  2. Je změna priority herního procesu na realtime špatná pro CPU?

  3. Nelze získat přístup SSH pro nového uživatele