Domande frequenti su Service Fabric
Esistono molte domande frequenti sulle caratteristiche e sulle modalità di uso di Service Fabric. In questo documento vengono illustrate molte di queste domande comuni e le relative risposte.
Nota
È consigliabile usare il modulo Azure Az PowerShell per interagire con Azure. Per iniziare, vedere Installare Azure PowerShell. Per informazioni su come eseguire la migrazione al modulo AZ PowerShell, vedere Eseguire la migrazione di Azure PowerShell da AzureRM ad Az.
Configurazione e gestione del cluster
Come si esegue il roll back del certificato del cluster di Service Fabric?
Il rollback di qualsiasi aggiornamento all'applicazione richiede il rilevamento degli errori di integrità prima che il quorum del cluster di Service Fabric esemetta la modifica; È possibile eseguire il rollforward solo delle modifiche di cui è stato eseguito il commit. Il tecnico dell'escalation tramite il servizio supporto tecnico clienti potrebbe essere necessario per ripristinare il cluster, se qualcosa introduce una modifica del certificato di interruzione non monitorata. Aggiornamento dell'applicazione di Service Fabric applica i Parametri di aggiornamento di un'applicazione e promette un aggiornamento con tempi di inattività pari a zero. Dopo l'aggiornamento monitorato dell'applicazione consigliato, l'avanzamento automatico tramite domini di aggiornamento è basato sul superamento di controlli di integrità, eseguendo il rollback automaticamente se l'aggiornamento di un servizio predefinito non riesce.
Se il cluster usa ancora la proprietà Identificazione personale del certificato classico nel modello di Resource Manager, è consigliabile modificare il cluster dall'identificazione personale del certificato al nome comune per applicare le funzionalità di gestione dei segreti moderne.
È possibile creare un cluster che si estenda a più aree di Azure o ai miei data center?
Sì.
La tecnologia di clustering principale di Service Fabric può essere usata per unire macchine in esecuzione in tutto il mondo, purché dispongano di connettività di rete l'una con l'altra. La compilazione e l'esecuzione di questo tipo di cluster possono essere tuttavia complicate.
Se si è interessati a questo scenario, è consigliabile contattare l'elenco dei problemi di GitHub di Service Fabric o tramite il rappresentante del supporto per ottenere indicazioni aggiuntive. Il team di Service Fabric sta lavorando per fornire ulteriori informazioni, materiale sussidiario e consigli per questo scenario.
Alcuni aspetti da considerare:
- La risorsa cluster di Service Fabric in Azure è ora divisa in aree, così come i set di scalabilità di macchine virtuali su cui viene creato il cluster. Ciò significa che in caso di malfunzionamento di un'area si potrebbe perdere la possibilità di gestire il cluster tramite Azure Resource Manager o il portale di Azure. Questa situazione può verificarsi anche se il cluster resta in esecuzione ed è possibile interagire direttamente con esso. Azure attualmente non offre la possibilità di avere una singola rete virtuale utilizzabile tra aree. Ciò significa che un cluster in più aree in Azure richiede indirizzi IP pubblici per ogni macchina virtuale nei set di scalabilità di macchine virtuali o Gateway VPN di Azure. Queste opzioni di rete hanno effetti diversi sui costi, sulle prestazioni e su alcuni livelli di progettazione di applicazioni. È richiesta un'attenta analisi e una pianificazione prima di affrontare un ambiente di questo tipo.
- La manutenzione, gestione e monitoraggio di tali computer possono diventare complicati, soprattutto quando estesi su tipi di ambienti, ad esempio tra provider di cloud diversi o tra risorse locali e Azure. È necessario determinare accuratamente gli aggiornamenti, il monitoraggio, la gestione e la diagnostica per il cluster e le applicazioni prima di eseguire i carichi di lavoro di produzione in tale ambiente. Se si ha già esperienza nella risoluzione di questi problemi in Azure o all'interno dei propri data center, è probabile che queste stesse soluzioni possano essere applicate durante la compilazione o l'esecuzione del cluster di Service Fabric.
I nodi di Service Fabric ricevono automaticamente aggiornamenti del sistema operativo?
È possibile usare Virtual Machine Scale Set Automatic OS Image Update (Aggiornamento automatico dell'immagine del sistema operativo con i set di scalabilità di macchine virtuali di Azure) oggi disponibile a livello generale.
Per i cluster NON eseguiti in Azure è stata fornita un'applicazione attraverso la quale i sistemi operativi sottostanti ai nodi di Service Fabric ricevono patch.
È possibile usare set di scalabilità di macchine virtuali di grandi dimensioni nel cluster di Service Fabric?
Risposta breve: no.
Risposta lunga: anche se con i set di scalabilità di macchine virtuali di grandi dimensioni è possibile arrivare fino a 1000 istanze di VM, per farlo è necessario usare i gruppi di posizionamento. I domini di errore e i domini di aggiornamento sono coerenti solo in un gruppo di posizionamento. Service Fabric usa i domini di errore e i domini di aggiornamento per prendere decisioni relative al posizionamento delle repliche del servizio/istanze del servizio. Poiché i domini di dominio e gli ID sono confrontabili solo all'interno di un gruppo di posizionamento, SF non può usarlo. Ad esempio, se VM1 in PG1 ha una topologia di FD=0 e VM9 in PG2 ha una topologia di FD=4, non significa che VM1 e VM2 si trovino in due rack hardware diversi, quindi SF non può usare i valori FD in questo caso per prendere decisioni di posizionamento.
I set di scalabilità di macchine virtuali di grandi dimensioni attualmente presentano altri problemi, ad esempio la mancanza di supporto per il bilanciamento del carico di livello 4. Per altre informazioni, vedere i dettagli sui set di scalabilità di grandi dimensioni
Qual è la dimensione minima di un cluster di Service Fabric? Perché non può essere di dimensioni minori?
La dimensione minima supportata per un cluster di Service Fabric che esegue carichi di lavoro di produzione è di cinque nodi. Per gli scenari di sviluppo, sono supportati cluster a un nodo (ottimizzati per un'esperienza di sviluppo rapido in Visual Studio) e cluster a cinque nodi.
È necessario che un cluster di produzione disponga di almeno cinque nodi a causa dei tre motivi seguenti:
- Anche quando nessun servizio utente è in esecuzione, un cluster di Service Fabric esegue un set di servizi di sistema con stato, inclusi il servizio di denominazione e il servizio di gestione del failover. Questi servizi di sistema sono essenziali per garantire l'operatività del cluster.
- Viene sempre configurata una sola replica di un servizio per ogni nodo, in modo che la dimensione del cluster costituisca il limite massimo per il numero di repliche che può avere un servizio, ovvero una partizione.
- Poiché l'aggiornamento di un cluster comporta l'arresto di almeno un nodo, è necessario avere almeno un nodo di riserva. Un cluster di produzione deve quindi avere almeno due nodi in aggiunta al numero minimo. Il numero minimo è definito dalla dimensione del quorum di un servizio di sistema, come illustrato di seguito.
L'obiettivo è che il cluster sia disponibile in caso di errore simultaneo di due nodi. Affinché un cluster di Service Fabric sia disponibile, è necessario che lo siano anche i servizi di sistema. I servizi di sistema con stato, ad esempio il servizio di denominazione e il servizio di gestione del failover, che tengono traccia dei servizi distribuiti nel cluster e della posizione in cui sono attualmente ospitati, dipendono da una coerenza elevata. Tale coerenza elevata, a sua volta, dipende dalla possibilità di acquisire un quorum per qualsiasi aggiornamento specifico per lo stato di tali servizi, dove per quorum si intende una stretta maggioranza delle repliche (N/2 + 1) per un determinato servizio. Pertanto, se si vuole essere resilienti contro la perdita simultanea di due nodi (perdita simultanea di due repliche di un servizio di sistema), è necessario avere ClusterSize - QuorumSize >= 2, che forza la dimensione minima a cinque.
Si noti che nell'argomento precedente si presuppone che ogni nodo abbia una replica di un servizio di sistema; pertanto, le dimensioni del quorum vengono calcolate in base al numero di nodi nel cluster. Se tuttavia si modifica TargetReplicaSetSize, è possibile rendere la dimensione del quorum minore di (N/2+1). Sembrerebbe quindi possibile avere un cluster inferiore a 5 nodi e avere comunque 2 nodi in più rispetto alla dimensione del quorum. Ad esempio, in un cluster a 4 nodi, se si imposta TargetReplicaSetSize su 3, le dimensioni del quorum basate su TargetReplicaSetSize sono (3/2 + 1) o 2, quindi è presente ClusterSize - QuorumSize = 4-2 = 2 >. Tuttavia, non è possibile garantire che il servizio di sistema si troverà al quorum o superiore se si perde una coppia di nodi contemporaneamente, potrebbe essere che i due nodi persi ospitavano due repliche, quindi il servizio di sistema passa alla perdita del quorum (con una sola replica lasciata) e non sarà più disponibile.
Detto questo, esaminiamo alcune possibili configurazioni di cluster:
Un nodo: questa opzione non offre disponibilità elevata perché la perdita del singolo nodo per qualsiasi motivo indica la perdita dell'intero cluster.
Due nodi: un quorum per un servizio distribuito tra due nodi (N = 2) è 2 (2/2 + 1 = 2). Quando una singola replica viene persa, è impossibile creare un quorum. Poiché l'esecuzione di un aggiornamento del servizio richiede l'arresto temporaneamente di una replica, questa non è una configurazione utile.
Tre nodi: con tre nodi (N = 3), è comunque necessario creare un quorum di duo nodi (3/2 + 1 = 2). È pertanto possibile perdere un singolo nodo e mantenere comunque il quorum, ma un errore simultaneo di due nodi determinerà la perdita di quorum dei servizi di sistema e renderà il cluster non disponibile.
Quattro nodi: con quattro nodi (N = 4), è necessario creare un quorum di tre nodi (4/2 + 1 = 3). È pertanto possibile perdere un singolo nodo e mantenere comunque il quorum, ma un errore simultaneo di due nodi determinerà la perdita di quorum dei servizi di sistema e renderà il cluster non disponibile.
Cinque nodi: con cinque nodi (N = 5), è comunque necessario creare un quorum di tre nodi (5/2 + 1 = 3). Ciò significa che è possibile perdere due nodi nello stesso momento e mantenere comunque il quorum per i servizi di sistema.
Per i carichi di lavoro di produzione, è necessario garantire resilienza in caso di errori simultanei di almeno due nodi (ad esempio, un errore per un aggiornamento del cluster e uno per altri motivi) e sono pertanto necessari cinque nodi.
È possibile disattivare il cluster di notte o nei fine settimana per ridurre i costi?
Generalmente, no. Service Fabric archivia lo stato su dischi temporanei e locali, ovvero se la macchina virtuale viene spostata in un host diverso, i dati non vengono spostati con esso. Nel normale funzionamento, questo non è un problema perché il nuovo nodo viene aggiornato da altri nodi. Tuttavia, se si arrestano tutti i nodi per riavviarli in un secondo momento, è molto probabile che la maggior parte di essi verrà avviata su nuovi host, rendendo impossibile il ripristino dle sistema.
Se si vogliono creare cluster per il test dell'applicazione prima della distribuzione, è consigliabile creare dinamicamente tali cluster come parte della pipeline di integrazione continua/distribuzione continua.
Come aggiorno il sistema operativo? Ad esempio come passo da Windows Server 2012 a Windows Server 2016?
Mentre stiamo lavorando a un'esperienza migliorata, oggi sei responsabile dell'aggiornamento. È necessario aggiornare l'immagine del sistema operativo nelle macchine virtuali del cluster per una macchina virtuale per volta.
È possibile crittografare i dischi dati collegati in un tipo di nodo del cluster (set di scalabilità di macchine virtuali)?
Sì. Per altre informazioni, vedere Creare un cluster con dischi dati collegati e Crittografia dischi di Azure per set di scalabilità di macchine virtuali.
È possibile usare macchine virtuali con priorità bassa in un tipo di nodo del cluster (set di scalabilità di macchine virtuali)?
No. Le macchine virtuali con priorità bassa non sono supportate.
Quali sono le directory e i processi da escludere quando si esegue un programma antivirus nel cluster?
Directory escluse dall'antivirus |
---|
Program Files\Microsoft Service Fabric |
FabricDataRoot (dalla configurazione del cluster) |
FabricLogRoot (dalla configurazione del cluster) |
Processi esclusi dall'antivirus |
---|
Fabric.exe |
FabricHost.exe |
FabricInstallerService.exe |
FabricSetup.exe |
FabricDeployer.exe |
ImageBuilder.exe |
FabricGateway.exe |
FabricDCA.exe |
FabricFAS.exe |
FabricUOS.exe |
FabricRM.exe |
FileStoreService.exe |
Come è possibile eseguire l'autenticazione dell'applicazione in Key Vault per ottenere segreti?
Di seguito sono riportati i mezzi per l'applicazione per ottenere le credenziali per l'autenticazione in Key Vault:
R. Durante il processo di compilazione/compressione delle applicazioni, è possibile eseguire il pull di un certificato nel pacchetto di dati dell'app SF e usarlo per eseguire l'autenticazione in Key Vault. B. Per gli host abilitati per l'identità del servizio gestito del set di scalabilità di macchine virtuali, è possibile sviluppare una semplice istanza di PowerShell SetupEntryPoint per l'app SF per ottenere un token di accesso dall'endpoint MSI e quindi recuperare i segreti da Key Vault.
È possibile trasferire la sottoscrizione a un tenant Microsoft Entra diverso?
No. A questo punto è necessario creare una nuova risorsa cluster di Service Fabric dopo il trasferimento della sottoscrizione a un tenant Microsoft Entra diverso.
È possibile spostare/migrare il cluster tra i tenant di Microsoft Entra?
No. A questo punto è necessario creare una nuova risorsa cluster di Service Fabric nel nuovo tenant.
È possibile spostare o eseguire la migrazione del cluster tra sottoscrizioni?
No. A questo punto è necessario creare una nuova risorsa cluster di Service Fabric nella nuova sottoscrizione.
È possibile spostare/migrare le risorse del cluster o del cluster in altri gruppi di risorse o rinominarle?
No. A questo punto è necessario creare una nuova risorsa cluster di Service Fabric con il nuovo gruppo di risorse/nome.
Progettazione di applicazioni
Qual è il modo migliore per eseguire query sui dati in partizioni di una raccolta Reliable Collections?
Le raccolte Reliable Collections sono in genere partizionate per abilitare l'aumento del numero di istanze allo scopo di incrementare le prestazioni e la velocità effettiva. Ciò significa che lo stato di un determinato servizio può essere distribuito in decine o centinaia di macchine. Per eseguire operazioni su quel set di dati completo, sono disponibili varie opzioni:
- Creare un servizio che esegua una query di tutte le partizioni di un altro servizio per estrarre i dati richiesti.
- Creare un servizio che possa ricevere dati da tutte le partizioni di un altro servizio.
- Inviare periodicamente dati da ogni servizio in un archivio esterno. Questo approccio è appropriato solo se le query eseguite non fanno parte della logica di business principale, perché i dati dell'archivio esterno non saranno aggiornati.
- In alternativa, archiviare i dati che devono supportare l'esecuzione di query su tutti i record direttamente in un archivio dati anziché in una raccolta affidabile. In questo modo si elimina il problema dei dati non aggiornati, ma non consente di sfruttare i vantaggi delle raccolte affidabili.
Qual è il modo migliore per eseguire query sui dati nei vari attori?
Gli attori sono progettati per essere unità indipendenti di stato e calcolo, pertanto non è consigliabile eseguire query generali dello stato dell'attore in fase di esecuzione. Se è necessario eseguire query nel set completo di stati degli attori, è consigliabile piuttosto:
- Sostituire i servizi di attori con servizi Reliable con stato, in modo che il numero delle richieste di rete raccolga tutti i dati dal numero di attori al numero di partizioni nel servizio.
- Progettare gli attori per l'invio periodico del relativo stato a un'archiviazione esterna per facilitare le query. Come in precedenza, questo approccio è ideale solo se le query in esecuzione non sono richieste per il comportamento di runtime.
Quanti dai è possibile archiviare in una raccolta Reliable Collections?
In genere i servizi Reliable sono partizionati. Pertanto, la quantità di dati archiviabili è limitata solo dal numero di macchine presenti nel cluster e dalla quantità di memoria disponibile su tali macchine.
Ad esempio, si supponga di avere una raccolta Reliable Collections in un servizio con 100 partizioni e 3 repliche, con archiviati oggetti di dimensioni pari a 1 KB di media. Si supponga quindi di disporre di un cluster di 10 macchine con 16 GB di memoria per macchina. Per ragioni di semplicità e cautela, si supponga che il sistema operativo, i servizi di sistema, il runtime di Service Fabric e i servizi consumino 6 GB di quella memoria, lasciando così 10 GB disponibili per ogni macchina o 100 GB per il cluster.
Tenendo presente che ciascun oggetto deve essere archiviato tre volte (una primaria e due repliche), si avrà una memoria sufficiente per circa 35 milioni di oggetti nella raccolta, con funzionamento a piena capacità. Tuttavia, si consiglia di essere preparati in caso di perdita simultanea di un dominio di errore e di un dominio di aggiornamento, che rappresentano circa 1/3 di capacità e ne ridurrebbero così il numero a circa 23 milioni.
Questo calcolo presuppone anche:
Che la distribuzione dei dati nelle partizioni sia approssimativamente uniforme o che si indichino le metriche di caricamento a Cluster Resource Manager. Per impostazione predefinita, Service Fabric bilancia il carico in base al numero di repliche. Nell'esempio precedente, vengono inserite 10 repliche primarie e 20 repliche secondarie su ciascun nodo nel cluster. Quanto descritto in precedenza è ideale per carichi distribuiti in modo uniforme tra le partizioni. Se il carico non è neanche, è necessario segnalare il carico in modo che Resource Manager possa comprimere repliche più piccole insieme e consentire alle repliche di dimensioni maggiori di consumare più memoria in un singolo nodo.
Che il servizio Reliable in questione sia l'unico ad archiviare stato nel cluster. Poiché è possibile distribuire più servizi in un cluster, è necessario tenere conto delle risorse di esecuzione e gestione dello stato richieste da ciascun servizio.
Che il cluster stesso non stia crescendo o compattando. Se si aggiungono altri computer, Service Fabric ribilancia le repliche per sfruttare la capacità aggiuntiva fino a quando il numero di computer supera il numero di partizioni nel servizio, poiché una singola replica non può estendersi sui computer. Al contrario, se si riduce la dimensione del cluster rimuovendo le macchine, le repliche sono raggruppate più strettamente e hanno una minore capacità totale.
Quanti dati è possibile archiviare in un attore?
Come per i servizi Reliable, la quantità di dati archiviabile in un servizio attore è limitata solo dallo spazio totale su disco e della memoria disponibile tra i nodi del cluster. Tuttavia, i singoli attori sono più efficaci quando vengono usati per racchiudere una piccola quantità di logica di business di stato e associata. Come regola generale, un singolo attore dovrebbe avere uno stato misurabile in kilobyte.
Dove il provider di risorse di Azure Service Fabric archivia i dati dei clienti?
Il provider di risorse di Azure Service Fabric non sposta o archivia i dati dei clienti dall'area in cui viene distribuita.
Altre domande
In che modo Service Fabric è correlato ai contenitori?
I contenitori offrono un modo semplice per racchiudere i servizi e le relative dipendenze in modo da risultare eseguibili con coerenza in tutti gli ambiente e usabili in modo isolato su una singola macchina. Service Fabric offre un modo per distribuire e gestire servizi, tra cui quelli inclusi in un contenitore.
Si prevede di rendere disponibile Service Fabric in open source?
Sono disponibili in open source parti di Service Fabric (framework Reliable Services, framework Reliable Actors, librerie di integrazione di ASP.NET Core, Service Fabric Explorer e interfaccia della riga di comando di Service Fabric) su GitHub e si accettano i contributi della community per questi progetti.
Microsoft ha recentemente annunciato l'intenzione di rendere disponibile in open source il runtime di Service Fabric. A questo punto, è disponibile il repository di Service Fabric in GitHub con gli strumenti di compilazione e test di Linux, il che significa che è possibile clonare il repository, compilare Service Fabric per Linux, eseguire test di base, aprire problemi e inviare richieste pull. Stiamo lavorando anche per completare la migrazione dell'ambiente di compilazione di Windows, oltre a ottenere un ambiente CI completo.
Seguire il blog di Service Fabric per le informazioni più recenti.
Passaggi successivi
Informazioni sui concetti e sulle procedure consigliate per il runtime di Service Fabric