Como: Fragmentos XML do fluxo de um XmlReader
Quando você tem que processa grandes arquivos XML, talvez não seja possível carregar a árvore inteira XML na memória. Este tópico mostra como passar informações usando XmlReader.
Um dos modos de efetivas usar XmlReader para ler objetos de XElement é escrever seu próprio método personalizado do eixo. Um método do eixo normalmente retorna uma coleção como IEnumerable de XElement, conforme mostrado no exemplo neste tópico. No método personalizado do eixo, depois de criar o fragmento XML chamando o método ReadFrom , retornar a coleção usando yield return. Isso fornece a semântica de execução adiada ao método personalizado do eixo.
Quando você cria uma árvore XML de um objeto de XmlReader , XmlReader deve ser posicionado em um elemento. O método de ReadFrom não retorna até que lê a marca do elemento.
Se você desejar criar uma árvore parcial, você pode criar uma instância XmlReader, posiciona o leitor no nó que você deseja converter a XElement uma árvore e em seguida, cria o objeto de XElement .
O tópico Como: Fragmentos XML do fluxo com acesso às informações de cabeçalho contém informações e um exemplo de como passar um documento mais complexo.
O tópico Como executar o streaming de transformação de grandes documentos XML contém um exemplo de usar LINQ to XML para transformar documentos XML muito grandes para manter uma pegada pequena de memória.
Exemplo
Este exemplo cria um método personalizado do eixo. Você pode consultá-lo usando uma consulta de LINQ . O método personalizado do eixo, StreamRootChildDoc, é um método que foi criado especificamente para ler um documento que tenha um elemento de repetição de Child .
Dica
O exemplo a seguir usa a construção yield return de C#.O código equivalente é fornecido no Visual Basic usando uma classe que implementa a interface IEnumerable(Of XElement).Para obter um exemplo de implementação de IEnumerable(Of T) no Visual Basic, consulte Instruções passo a passo: implementando IEnumerable(Of T) no Visual Basic.
static IEnumerable<XElement> StreamRootChildDoc(StringReader stringReader)
{
using (XmlReader reader = XmlReader.Create(stringReader))
{
reader.MoveToContent();
// Parse the file and display each of the nodes.
while (reader.Read())
{
switch (reader.NodeType)
{
case XmlNodeType.Element:
if (reader.Name == "Child") {
XElement el = XElement.ReadFrom(reader) as XElement;
if (el != null)
yield return el;
}
break;
}
}
}
}
static void Main(string[] args)
{
string markup = @"<Root>
<Child Key=""01"">
<GrandChild>aaa</GrandChild>
</Child>
<Child Key=""02"">
<GrandChild>bbb</GrandChild>
</Child>
<Child Key=""03"">
<GrandChild>ccc</GrandChild>
</Child>
</Root>";
IEnumerable<string> grandChildData =
from el in StreamRootChildDoc(new StringReader(markup))
where (int)el.Attribute("Key") > 1
select (string)el.Element("GrandChild");
foreach (string str in grandChildData) {
Console.WriteLine(str);
}
}
Module Module1
Sub Main()
Dim markup = "<Root>" &
" <Child Key=""01"">" &
" <GrandChild>aaa</GrandChild>" &
" </Child>" &
" <Child Key=""02"">" &
" <GrandChild>bbb</GrandChild>" &
" </Child>" &
" <Child Key=""03"">" &
" <GrandChild>ccc</GrandChild>" &
" </Child>" &
"</Root>"
Dim grandChildData =
From el In New StreamRootChildDoc(New IO.StringReader(markup))
Where CInt(el.@Key) > 1
Select el.<GrandChild>.Value
For Each s In grandChildData
Console.WriteLine(s)
Next
End Sub
End Module
Public Class StreamRootChildDoc
Implements IEnumerable(Of XElement)
Private _stringReader As IO.StringReader
Public Sub New(ByVal stringReader As IO.StringReader)
_stringReader = stringReader
End Sub
Public Function GetEnumerator() As IEnumerator(Of XElement) Implements IEnumerable(Of XElement).GetEnumerator
Return New StreamChildEnumerator(_stringReader)
End Function
Public Function GetEnumerator1() As IEnumerator Implements IEnumerable.GetEnumerator
Return Me.GetEnumerator()
End Function
End Class
Public Class StreamChildEnumerator
Implements IEnumerator(Of XElement)
Private _current As XElement
Private _reader As Xml.XmlReader
Private _stringReader As IO.StringReader
Public Sub New(ByVal stringReader As IO.StringReader)
_stringReader = stringReader
_reader = Xml.XmlReader.Create(_stringReader)
_reader.MoveToContent()
End Sub
Public ReadOnly Property Current As XElement Implements IEnumerator(Of XElement).Current
Get
Return _current
End Get
End Property
Public ReadOnly Property Current1 As Object Implements IEnumerator.Current
Get
Return Me.Current
End Get
End Property
Public Function MoveNext() As Boolean Implements IEnumerator.MoveNext
While _reader.Read()
Select Case _reader.NodeType
Case Xml.XmlNodeType.Element
Dim el = TryCast(XElement.ReadFrom(_reader), XElement)
If el IsNot Nothing Then
_current = el
Return True
End If
End Select
End While
Return False
End Function
Public Sub Reset() Implements IEnumerator.Reset
_reader = Xml.XmlReader.Create(_stringReader)
_reader.MoveToContent()
End Sub
#Region "IDisposable Support"
Private disposedValue As Boolean ' To detect redundant calls
' IDisposable
Protected Overridable Sub Dispose(ByVal disposing As Boolean)
If Not Me.disposedValue Then
If disposing Then
_reader.Close()
End If
End If
Me.disposedValue = True
End Sub
Public Sub Dispose() Implements IDisposable.Dispose
Dispose(True)
GC.SuppressFinalize(Me)
End Sub
#End Region
End Class
Este exemplo gera a seguinte saída:
bbb
ccc
Nesse exemplo, o documento de origem é muito pequeno. No entanto, mesmo se houver milhões de elementos de Child , este exemplo ainda terá uma pegada pequena de memória.