Lavorare con le raccolte Reliable Collections
Service Fabric offre un modello di programmazione con stato disponibile per gli sviluppatori .NET tramite Reliable Collections. In particolare, Service Fabric offre classi ReliableDictionary e ReliableQueue. Quando si usano queste classi, lo stato è partizionato (per la scalabilità), replicato (per la disponibilità) e le transazioni vengono eseguite all'interno di una partizione (per la semantica ACID). Di seguito viene descritto l'uso tipico di un oggetto ReliableDictionary per osservarne le azioni.
try
{
// Create a new Transaction object for this partition
using (ITransaction tx = base.StateManager.CreateTransaction())
{
// AddAsync takes key's write lock; if >4 secs, TimeoutException
// Key & value put in temp dictionary (read your own writes),
// serialized, redo/undo record is logged & sent to secondary replicas
await m_dic.AddAsync(tx, key, value, cancellationToken);
// CommitAsync sends Commit record to log & secondary replicas
// After quorum responds, all locks released
await tx.CommitAsync();
}
// If CommitAsync isn't called, Dispose sends Abort
// record to log & all locks released
}
catch (TimeoutException)
{
// choose how to handle the situation where you couldn't get a lock on the file because it was
// already in use. You might delay and retry the operation
await Task.Delay(100);
}
Tutte le operazioni sugli oggetti ReliableDictionary (ad eccezione di ClearAsync che non è annullabile) richiedono un oggetto ITransaction. Questo oggetto è associato a tutte le modifiche che si tenta di apportare a qualsiasi oggetto ReliableDictionary e/o ReliableQueue all'interno di una singola partizione. Acquisire un oggetto ITransaction chiamando il metodo CreateTransaction di StateManager della partizione.
Nel codice precedente, l'oggetto ITransaction viene passato al metodo AddAsync del dizionario affidabile. Internamente, i metodi di dizionario che accettano una chiave acquisiscono un blocco di lettura/scrittura associato alla chiave. Se il metodo modifica il valore della chiave, il metodo acquisisce un blocco di scrittura sulla chiave; se il metodo legge solo dal valore della chiave, allora acquisisce un blocco di lettura sulla chiave. Poiché AddAsync modifica il valore della chiave sul nuovo valore ottenuto, viene acquisito il blocco di scrittura della chiave. Pertanto, se due (o più) thread tentano di aggiungere i valori alla stessa chiave nello stesso momento, un thread acquisirà il blocco di scrittura e gli altri verranno bloccati. Per impostazione predefinita, i metodi si interrompono fino a 4 secondi per acquisire il blocco; dopo 4 secondi, i metodi generano un'eccezione TimeoutException. Se si preferisce, esistono overload del metodo che consentono di superare un valore di timeout esplicito.
In genere, si scrive il codice per reagire a un'eccezione TimeoutException rilevandola e tentando di effettuare nuovamente l'intera operazione (come illustrato nel codice precedente). In questo codice semplice, si sta chiamando ogni volta Task.Delay oltre i 100 millisecondi. In realtà, potrebbe essere più opportuno usare un tipo di ritardo backoff esponenziale.
Una volta acquisito il blocco, AddAsync aggiunge i riferimenti dell'oggetto valore e chiave a un dizionario interno temporaneo associato all'oggetto ITransaction. Questa operazione viene eseguita per fornire la semantica di autolettura delle proprie scritture. Vale a dire che, dopo aver chiamato AddAsync, una chiamata successiva a TryGetValueAsync (usando lo stesso oggetto ITransaction) restituirà il valore anche se non si è eseguito il commit della transazione.
Nota
La chiamata a TryGetValueAsync con una nuova transazione restituirà un riferimento all'ultimo valore di cui è stato eseguito il commit. Non modificare direttamente il riferimento, in quanto ignora il meccanismo per rendere persistenti e replicare le modifiche. È consigliabile rendere i valori di sola lettura in modo che l'unico modo per modificare il valore di una chiave sia tramite API reliable dictionary.
Successivamente, AddAsync serializza gli oggetti di chiave e valore in array di byte e aggiunge gli array a un file di log sul nodo locale. Infine, AddAsync invia gli array di byte di tutte le repliche secondarie in modo che abbiano le stesse informazioni chiave/valore. Anche se le informazioni chiave/valore sono stato scritte in un file di log, le informazioni non vengono considerate parte del dizionario fino a quando non è stato eseguito il commit della transazione a cui sono associate.
Nel codice precedente, la chiamata a CommitAsync esegue il commit di tutte le operazioni della transazione. In particolare, aggiunge informazioni di commit al file di log sul nodo locale e invia anche il record di commit a tutte le repliche secondarie. Una volta ricevuta la risposta da un quorum (maggioranza) delle repliche, tutte le modifiche ai dati vengono considerate permanenti e i blocchi associati alle chiavi modificate tramite l'oggetto ITransaction vengono rilasciati in modo che altri thread/transazioni possano modificare le stesse chiavi e i relativi valori.
Se CommitAsync non viene chiamato (in genere a causa di un'eccezione generata), l'oggetto ITransaction viene eliminato. Quando viene eliminato un oggetto ITransaction su cui non è stato eseguito il commit, Service Fabric aggiunge informazioni sull'interruzione al file di log del nodo locale e non è necessario inviare alcun elemento alle repliche secondarie. A quel punto, i blocchi associati alle chiavi modificate tramite la transazione vengono rilasciati.
Raccolte Reliable Collections volatili
In alcuni carichi di lavoro, ad esempio una cache replicata, è possibile tollerare occasionalmente la perdita di dati. Evitare la persistenza dei dati su disco può consentire latenze e velocità effettiva migliori durante la scrittura in Reliable Dictionaries. Il compromesso per una mancanza di persistenza è che, se si verifica una perdita di quorum, si verificherà una perdita completa di dati. Poiché la perdita del quorum è una rara occorrenza, l'aumento delle prestazioni può essere utile per la rara possibilità di perdita di dati per tali carichi di lavoro.
Attualmente, il supporto volatile è disponibile solo per Reliable Dictionaries e Reliable Queues e non reliableConcurrentQueues. Vedere l'elenco delle Precisazioni per informare la decisione sull'uso di raccolte volatili.
Per abilitare il supporto volatile nel servizio, impostare il flag HasPersistedState
nella dichiarazione del tipo di servizio su false
, come indicato di seguito:
<StatefulServiceType ServiceTypeName="MyServiceType" HasPersistedState="false" />
Nota
I servizi persistenti esistenti non possono essere resi volatili e viceversa. Se si vuole farlo, sarà necessario eliminare il servizio esistente e quindi distribuire il servizio con il flag aggiornato. Ciò significa che è necessario essere disposti a causare la perdita completa dei dati se si vuole modificare il flag HasPersistedState
.
Inconvenienti comuni e come evitarli
Dopo averne appreso il funzionamento interno, ecco alcuni casi di uso improprio delle raccolte affidabili. Osserviamo il seguente codice:
using (ITransaction tx = StateManager.CreateTransaction())
{
// AddAsync serializes the name/user, logs the bytes,
// & sends the bytes to the secondary replicas.
await m_dic.AddAsync(tx, name, user);
// The line below updates the property's value in memory only; the
// new value is NOT serialized, logged, & sent to secondary replicas.
user.LastLogin = DateTime.UtcNow; // Corruption!
await tx.CommitAsync();
}
Quando si usa un normale dizionario .NET, è possibile aggiungere una coppia chiave/valore al dizionario e quindi modificare il valore di una proprietà (ad esempio LastLogin). Tuttavia, questo codice non funziona correttamente con un ReliableDictionary. Come visto in precedenza, la chiamata ad AddAsync serializza gli oggetti chiave/valore agli array di byte, salva gli array in un file locale e invia gli array anche alle repliche secondarie. Se successivamente si modifica una proprietà, questa operazione modifica il valore della proprietà solo nella memoria, senza influire sul file locale o sui dati inviati alle repliche. Se il processo si arresta in modo anomalo, il contenuto della memoria viene eliminato. Quando viene avviato un nuovo processo o un'altra replica diventa primaria, è disponibile il valore della proprietà.
Non è possibile sottolineare a sufficienza quanto sia semplice effettuare l'errore descritto in alto. Sarà possibile apprendere l'errore solo se/quando il processo si interrompe. Il modo corretto per scrivere il codice è semplicemente invertire le due righe:
using (ITransaction tx = StateManager.CreateTransaction())
{
user.LastLogin = DateTime.UtcNow; // Do this BEFORE calling AddAsync
await m_dic.AddAsync(tx, name, user);
await tx.CommitAsync();
}
Ecco un altro esempio che mostra un errore comune:
using (ITransaction tx = StateManager.CreateTransaction())
{
// Use the user's name to look up their data
ConditionalValue<User> user = await m_dic.TryGetValueAsync(tx, name);
// The user exists in the dictionary, update one of their properties.
if (user.HasValue)
{
// The line below updates the property's value in memory only; the
// new value is NOT serialized, logged, & sent to secondary replicas.
user.Value.LastLogin = DateTime.UtcNow; // Corruption!
await tx.CommitAsync();
}
}
Anche qui, con i dizionari regolari .NET, il codice indicato in alto funziona correttamente ed è un modello comune: lo sviluppatore usa una chiave per cercare un valore. Se il valore esiste, lo sviluppatore modifica un valore della proprietà. Con le raccolte Reliable Collections, tuttavia, questo codice presenta lo stesso problema già illustrato: non SI DEVE modificare un oggetto dopo averlo assegnato a una raccolta Reliable Collections.
Il modo corretto per aggiornare un valore in una raccolta Reliable Collections è fare riferimento al valore esistente e tenere in considerazione l'oggetto a cui fa riferimento tramite il riferimento non modificabile. Creare quindi un nuovo oggetto come copia esatta dell'oggetto originale. A questo punto, è possibile modificare lo stato di questo nuovo oggetto e scrivere il nuovo oggetto nella raccolta in modo che venga serializzato in array di byte, aggiunto al file locale e inviato alle repliche. Dopo aver eseguito il commit delle modifiche, gli oggetti interni alla memoria, il file locale e tutte le repliche hanno lo stesso stato. Tutto è in posizione.
Il codice seguente illustra il modo corretto per aggiornare un valore in una raccolta Reliable Collections:
using (ITransaction tx = StateManager.CreateTransaction())
{
// Use the user's name to look up their data
ConditionalValue<User> currentUser = await m_dic.TryGetValueAsync(tx, name);
// The user exists in the dictionary, update one of their properties.
if (currentUser.HasValue)
{
// Create new user object with the same state as the current user object.
// NOTE: This must be a deep copy; not a shallow copy. Specifically, only
// immutable state can be shared by currentUser & updatedUser object graphs.
User updatedUser = new User(currentUser);
// In the new object, modify any properties you desire
updatedUser.LastLogin = DateTime.UtcNow;
// Update the key's value to the updateUser info
await m_dic.SetValue(tx, name, updatedUser);
await tx.CommitAsync();
}
}
Definire tipi di dati non modificabili per evitare errori del programmatore
Idealmente, il compilatore dovrebbe segnalare gli errori quando si crea inavvertitamente codice che modifica lo stato di un oggetto considerato non modificabile. Tuttavia, il compilatore C# non è in grado di farlo. Pertanto, per evitare potenziali errori del programmatore, si consiglia di definire i tipi da usare con le raccolte Reliable Collections come tipi non modificabili. In particolare, questo significa che è opportuno fermarsi ai principali tipi di valore (ad esempio numeri [Int32, UInt64, etc.], DateTime, Guid, TimeSpan e simili). È anche possibile usare le stringhe. È preferibile evitare proprietà della raccolta poiché la serializzazione e la deserializzazione possono spesso influire negativamente sulle prestazioni. Tuttavia, se si intende usare le proprietà della raccolta, è consigliabile l'uso di libreria di raccolte .NET non modificabili (System.Collections.Immutable). Questa libreria è disponibile per il download all'indirizzo https://nuget.org. Si consiglia anche di sigillare le classi e rendere i campi di sola lettura quando possibile.
Il tipo UserInfo riportato di seguito mostra come definire un tipo non modificabile sfruttando i consigli indicati in precedenza.
[DataContract]
// If you don't seal, you must ensure that any derived classes are also immutable
public sealed class UserInfo
{
private static readonly IEnumerable<ItemId> NoBids = ImmutableList<ItemId>.Empty;
public UserInfo(String email, IEnumerable<ItemId> itemsBidding = null)
{
Email = email;
ItemsBidding = (itemsBidding == null) ? NoBids : itemsBidding.ToImmutableList();
}
[OnDeserialized]
private void OnDeserialized(StreamingContext context)
{
// Convert the deserialized collection to an immutable collection
ItemsBidding = ItemsBidding.ToImmutableList();
}
[DataMember]
public readonly String Email;
// Ideally, this would be a readonly field but it can't be because OnDeserialized
// has to set it. So instead, the getter is public and the setter is private.
[DataMember]
public IEnumerable<ItemId> ItemsBidding { get; private set; }
// Since each UserInfo object is immutable, we add a new ItemId to the ItemsBidding
// collection by creating a new immutable UserInfo object with the added ItemId.
public UserInfo AddItemBidding(ItemId itemId)
{
return new UserInfo(Email, ((ImmutableList<ItemId>)ItemsBidding).Add(itemId));
}
}
Anche ItemId è un tipo non modificabile, come illustrato di seguito:
[DataContract]
public struct ItemId
{
[DataMember] public readonly String Seller;
[DataMember] public readonly String ItemName;
public ItemId(String seller, String itemName)
{
Seller = seller;
ItemName = itemName;
}
}
Controllo delle versioni dello schema (aggiornamenti)
Internamente, le raccolte Reliable Collections serializzano gli oggetti usando DataContractSerializer di .NET. Gli oggetti serializzati sono persistenti sul disco locale della replica primaria e vengono anche trasmessi alle repliche secondarie. Con l'evoluzione del servizio, è probabile che si desideri modificare il tipo di dati (schema) richiesti dal servizio. Eseguire il controllo delle versioni dei dati con estrema attenzione. Innanzitutto, si deve essere sempre in grado di deserializzare i dati precedenti. In particolare, ciò significa che il codice di deserializzazione deve essere infinitamente compatibile con le versioni precedenti: la versione 333 del codice del servizio deve essere in grado di operare sui dati inseriti in una raccolta Reliable Collections dalla versione 1 del codice del servizio 5 anni fa.
Il codice del servizio viene aggiornato un dominio di aggiornamento alla volta. Pertanto, durante un aggiornamento, vengono eseguite contemporaneamente due diverse versioni del codice del servizio. È necessario evitare che la nuova versione del codice del servizio usi il nuovo schema dal momento che le versioni precedenti del codice del servizio potrebbero non essere in grado di gestire il nuovo schema. Quando possibile, progettare ogni versione del servizio in modo che sia compatibile con la versione immediatamente successiva. In particolare, questo significa che la V1 del codice del servizio deve essere in grado di ignorare tutti gli elementi dello schema che non gestisce in modo esplicito. Deve tuttavia essere in grado di salvare i dati che non conosce in modo esplicito e riscriverli in caso di aggiornamento di un valore o di una chiave del dizionario.
Avviso
Sebbene sia possibile modificare lo schema di una chiave, è necessario assicurarsi che gli algoritmi di uguaglianza e confronto della chiave siano stabili. Il comportamento delle raccolte affidabili dopo una modifica di uno di questi algoritmi non è definito e può causare danneggiamento dei dati, perdita e arresto anomalo del servizio. Le stringhe .NET possono essere usate come chiave, ma usano la stringa stessa come chiave. Non usare il risultato di String.GetHashCode come chiave.
In alternativa, è possibile eseguire un aggiornamento a più fasi.
- Aggiornare il servizio a una nuova versione
- ha sia la versione V1 originale che la nuova versione V2 dei contratti dati inclusi nel pacchetto del codice del servizio;
- registra serializzatori di stato V2 personalizzati, se necessario;
- esegue tutte le operazioni sulla raccolta originale V1 usando i contratti dati V1.
- Aggiornare il servizio a una nuova versione
- crea una nuova raccolta V2;
- esegue ogni operazione di aggiunta, aggiornamento ed eliminazione sulla prima V1 e quindi sulle raccolte V2 in una singola transazione;
- esegue operazioni di lettura solo nella raccolta V1.
- Copiare tutti i dati dalla raccolta V1 alla raccolta V2.
- Questa operazione può essere eseguita in un processo in background dalla versione del servizio distribuita nel passaggio 2.
- Recuperare tutte le chiavi della raccolta V1. L'enumerazione viene eseguita con IsolationLevel.Snapshot per impostazione predefinita per evitare di bloccare la raccolta per la durata dell'operazione.
- Per ogni chiave, usare una transazione separata per
- TryGetValueAsync dalla raccolta V1.
- Se il valore è già stato rimosso dall'insieme V1 dall'avvio del processo di copia, la chiave deve essere ignorata e non ripresa nell'insieme V2.
- TryAddAsync il valore per la raccolta V2.
- Se il valore è già stato aggiunto all'insieme V2 dall'avvio del processo di copia, la chiave deve essere ignorata.
- Il commit della transazione deve essere eseguito solo se il
TryAddAsync
restituiscetrue
. - Le API di accesso ai valori usano IsolationLevel.ReadRepeatable per impostazione predefinita e si basano sul blocco per garantire che i valori non vengano modificati da un altro chiamante finché non viene eseguito il commit o l'interruzione della transazione.
- Aggiornare il servizio a una nuova versione
- esegue operazioni di lettura solo sulla raccolta V2;
- esegue comunque ogni operazione di aggiunta, aggiornamento ed eliminazione nella prima V1 e quindi nelle raccolte V2 per mantenere l'opzione di rollback alla versione 1.
- Testare il servizio in modo completo e verificare che funzioni come previsto.
- Se non è stata eseguita alcuna operazione di accesso ai valori che non è stata aggiornata per funzionare sia nella raccolta V1 che nella versione 2, si potrebbero notare dati mancanti.
- Se mancano dati, eseguire il rollback al passaggio 1, rimuovere la raccolta V2 e ripetere il processo.
- Aggiornare il servizio a una nuova versione
- esegue tutte le operazioni solo sulla raccolta V2;
- tornare alla versione 1 non è più possibile con un rollback del servizio e richiederebbe il roll forward con i passaggi invertiti da 2 a 4.
- Aggiornare il servizio una nuova versione che
- Attendere il troncamento del log.
- Per impostazione predefinita, questo avviene ogni 50 MB di scritture (aggiunge, aggiorna e rimuove) a raccolte affidabili.
- Aggiornare il servizio a una nuova versione
- non include più i contratti dati V1 inclusi nel pacchetto di codice del servizio.
Passaggi successivi
Per informazioni sulla creazione di contratti di dati compatibili con versioni successive, vedere Contratti di dati compatibili con versioni successive
Per informazioni sulle procedure consigliate per il controllo delle versioni dei contratti di dati, vedere Controllo delle versioni dei contratti di dati
Per informazioni su come implementare contratti di dati a tolleranza di versione, vedere Callback di serializzazione a tolleranza di versione
Per informazioni su come fornire una struttura di dati che possa interagire con più versioni, vedere IExtensibleDataObject
Per informazioni su come configurare le raccolte Reliable Collections, vedere Configurazione di Replicator