Tento příspěvek ilustruje, jak RHEVM podrobně monitoruje stav úložiště.
Sledování stavu správce úložiště
Storage Pool Manager (SPM) je role správy přiřazená jednomu z hostitelů v datovém centru, která mu umožňuje spravovat úložné domény datového centra. RHEVM kontroluje dostupnost SPM a integritu metadat při každých 10 sekundách dotazovací frekvence SPM.
Tuto konfiguraci motoru můžete zkontrolovat následovně. Nedoporučuje se měnit níže uvedené parametry, pokud to není doporučeno technikem podpory pro konkrétní případ použití:
$ engine-config -g StoragePoolRefreshTimeInSeconds StoragePoolRefreshTimeInSeconds: 10 version: general $ engine-config -g SpmCommandFailOverRetries SpmCommandFailOverRetries: 3 version: general $ engine-config -g SPMFailOverAttempts SPMFailOverAttempts: 3 version: general $ engine-config -g DelayResetForSpmInSeconds DelayResetForSpmInSeconds: 20 version: general
Sledování stavu úložné domény
Stav domény úložiště je monitorován modulem RHEVM i KVM Vdsm.
1. RHEVM monitoruje doménu úložiště
Časový interval v sekundách pro dotazování stavu hostitele pomocí RHEVM jsou ve výchozím nastavení 3 sekundy. Během procesu bude kontrolovat stav úložiště. Pokud je kód sestavy getRepoStats nenulový nebo je lastcheck(statsGenTime – domStatus.checkTime) vyšší než MaxStorageVdsTimeoutCheckSec (ve výchozím nastavení 30 sekund), pak se doména úložiště stává problematickou a pro doménu se spustí časovač. Časový limit selhání domény úložiště je StorageDomainFailureTimeoutInMinutes (výchozí 5 minut). Pokud se během této doby problémový stav domény úložiště neobnoví, bude hostitel nastaven jako nefunkční. Pokud se problematická doména během doby obnoví, pak RHEVM automaticky zpět aktivuje hostitele KVM.
Zde jsou související konfigurace motoru:
$ engine-config -g VdsRefreshRate VdsRefreshRate: 3 version: general $ engine-config -g StorageDomainFailureTimeoutInMinutes StorageDomainFailureTimeoutInMinutes: 5 version: general $ engine-config -g MaxStorageVdsTimeoutCheckSec MaxStorageVdsTimeoutCheckSec: 30 version: general $ engine-config -g MaxStorageVdsDelayCheckSec MaxStorageVdsDelayCheckSec: 5 version: general
2. Stav úložiště hostitelského monitoru KVM:
Pokud hostitel KVM nemůže přistupovat k doménám úložiště, stane se nefunkčním. Vdsm obnoví úložiště s intervalem sledování sd_health_check_delay. Vyvolá getStorageDomainStats, aby získal dom.getStats stav domény a vrátil její stav zpět do RHEVM prostřednictvím repoStats v _getDomsStats. Jak repo_stats_cache_refresh_timeout, tak sd_health_check_delay lze nakonfigurovat v /etc/vdsm/vdsm.conf .