Tento příspěvek se hluboce ponoří do správy napájení RHV.
Co je Host Power Management (Fence)?
Když je nakonfigurována správa napájení, může RHV restartovat hostitele, kteří jsou ve stavu NonOperational nebo NonResponsive. RHV podporuje následující zařízení pro řízení spotřeby:
- American Power Conversion (apc)
- IBM Bladecenter (Bladecenter)
- Cisco Unified Computing System (cisco_ucs)
- Karta vzdáleného přístupu Dell 5 (drac5)
- Karta vzdáleného přístupu Dell 7 (drac7)
- Elektronický vypínač (eps)
- HP BladeSystem (hpblade)
- Integrovaný Lights Out (ilo, ilo2, ilo3, ilo4,ilo_ssh)
- Rozhraní pro správu inteligentní platformy (ipmilan)
- Adaptér vzdáleného dohledu (rsa)
- Fujitsu-Siemens RSB (rsb)
- Western Telematic, Inc (wti)
RHV používá agenty plotu ke komunikaci se zařízeními pro správu napájení.
Co je to Auto Fencing?
Pokud hostitel zaznamená neočekávané selhání, stav hostitele se změní na připojení a hostitel bude v tomto stavu po dobu odkladu. Pokud tento časový limit uplyne, hostitel se přepne do stavu „Nereaguje“ nebo „Neprovozuje“. Aby Engine reagoval na tento stav, oplotí problematické hostitele provedením restartu. Engine používá agenta oplocení pro kartu správy napájení na hostiteli k zastavení hostitele, potvrzení, že se zastavil, ke spuštění hostitele a potvrzení, že hostitel byl spuštěn.
Dodatečná lhůta automatického plotu:
Ve výchozím nastavení se Engine dvakrát pokusí požádat vdsm o stav:
option_name | option_value | default_value -------------------------+--------------+--------------- VDSAttemptsToResetCount | 2 | 2 (1 row)
Grace Period = TimeoutToResetVdsInSeconds + DelayResetPerVmInSeconds*(Number of VMs on host) + DelayResetForSpmInSeconds(isSPM)
Pokud je například hostitelem SPM se dvěma virtuálními počítači a výchozí_hodnotou, pak doba odkladu=60+ 0,5*2+20=81 s
option_name | option_value | default_value ----------------------------+--------------+--------------- TimeoutToResetVdsInSeconds | 60 | 60 DelayResetForSpmInSeconds | 20 | 20 DelayResetPerVmInSeconds | 0.5 | 0.5 VDSAttemptsToResetCount | 2 | 2 (4 rows)
Kdump Fence:
Když povolíte „integraci Kdump“, pouze zdrží hard-fence, dokud hostitel nedokončí zápis výpisu paměti v případě selhání.
Soft Fence:
To lze konfigurovat z Cluster Level:
AdminPortal-->Compute-->Cluster-->Edit Cluster-->Fencing Polciy-->Enable Fencing
Před „rebootem“ hostitele se Engine pokusí restartovat VDSM přes SSH na „nereagujících“ hostitelích pomocí „SSH Soft Fencing“.
option_name | option_value | default_value | version -----------------------+-------------------------------------------------+------------------------------------------------+--------- SshSoftFencingCommand | /usr/bin/vdsm-tool service-restart vdsmd | /usr/bin/vdsm-tool service-restart vdsmd | 4.3 (1 row)
Soft-fencing přes SSH lze spustit na hostitelích, kteří nemají nakonfigurovanou správu napájení. To se liší od „šermu“. Oplocení lze spustit pouze na hostitelích, kteří mají nakonfigurovanou správu napájení.
Výběr proxy
Výchozí předvolba Power Management Proxy je cluster, dc. Existuje možnost přidat „other_dc“. Najde hostitele proxy ve stavu „UP“.
# engine-config -g FenceProxyDefaultPreferences FenceProxyDefaultPreferences: cluster,dc version: general
Průtok:
Průtok motoru:
Konfigurační metadata
Zde jsou metadata VdsFenceType, VdsFenceOptionTypes, VdsFenceOptionMapping, FenceAgentMapping a FenceAgentDefaultParams:
-[ RECORD 1 ]+---------------------------------------------------------------------------------------------------------- option_name | VdsFenceType option_value | apc,apc_snmp,bladecenter,cisco_ucs,drac5,drac7,eps,hpblade,ilo,ilo2,ilo3,ilo4,ilo_ssh,ipmilan,rsa,rsb,wti version | 4.3 -[ RECORD 2 ]-+--------------------------------------------------------------------------------------------------------- option_name | VdsFenceOptionTypes option_value | encrypt_options=bool,secure=bool,port=int,slot=int default_value | encrypt_options=bool,secure=bool,port=int,slot=int -[ RECORD 3 ]-+---------------------------------------------------------------------------------------------------------- option_name | VdsFenceOptionMapping option_value | apc:secure=secure,port=ipport,slot=port; apc_snmp:port=port,encrypt_options=encrypt_options; bladecenter:secure=secure,port=ipport,slot=port; cisco_ucs:secure=ssl,slot=port; drac5:secure=secure,slot=port; drac7:;eps:slot=port; hpblade:port=port; ilo:secure=ssl,port=ipport; ipmilan:; ilo2:secure=ssl,port=ipport; ilo3:; ilo4:; ilo_ssh:port=port; rsa:secure=secure,port=ipport; rsb:;wti:secure=secure,port=ipport,slot=port default_value | apc:secure=secure,port=ipport,slot=port; apc_snmp:port=port,encrypt_options=encrypt_options; bladecenter:secure=secure,port=ipport,slot=port; cisco_ucs:secure=ssl,slot=port; drac5:secure=secure,slot=port; drac7:; eps:slot=port; hpblade:port=port; ilo:secure=ssl,port=ipport; ipmilan:; ilo2:secure=ssl,port=ipport; ilo3:; ilo4:; ilo_ssh:port=port; rsa:secure=secure,port=ipport; rsb:; wti:secure=secure,port=ipport,slot=port -[ RECORD 4 ]-+---------------------------------------------------------------------------------------------- option_name | FenceAgentMapping option_value | drac7=ipmilan,ilo2=ilo default_value | drac7=ipmilan,ilo2=ilo -[ RECORD 5 ]-+----------------------------------------------------------------------------------------------- option_name | FenceAgentDefaultParams option_value | drac7:privlvl=OPERATOR,lanplus=1,delay=10;ilo3:power_wait=4;ilo4:power_wait=4;ilo_ssh:secure=1 default_value | drac7:privlvl=OPERATOR,lanplus=1,delay=10;ilo3:power_wait=4;ilo4:power_wait=4;ilo_ssh:secure=1
Výše uvedená metadata lze nakonfigurovat v engine-config:
# engine-config -a |grep 'CustomFence\|CustomVdsFence' CustomFenceAgentMapping: version: general CustomFenceAgentDefaultParams: version: general CustomFenceAgentDefaultParamsForPPC: version: general CustomVdsFenceOptionMapping: version: general CustomVdsFenceType: version: general CustomFencePowerWaitParam: version: general
Jiná konfigurace(Časové limity a opakování):
# engine-config -a |grep 'FenceStart\|FenceStop' FenceStartStatusRetries: 18 version: general FenceStartStatusDelayBetweenRetriesInSec: 10 version: general FenceStopStatusRetries: 18 version: general FenceStopStatusDelayBetweenRetriesInSec: 10 version: general