Практическое руководство. Заполнение коллекций объектов из нескольких источников (LINQ)

В этом примере показано объединение данных из различных источников в последовательность новых типов.


Не пытайтесь объединить данные в памяти или файловой системе с данными, все еще находящимися в базе данных.Такие междоменные соединения могут выдавать неопределенный результат из-за различий в способах определения операций соединения для запросов к базам данных и другим типам источников.Кроме того, есть риск, что такая операция может вызвать исключение нехватки памяти, если объем данных в базе данных достаточно велик.Чтобы соединить данные из базы данных с данными в памяти, сначала вызовите ToList или ToArray в запросе к базе данных, а затем выполните соединение с возвращенной коллекцией.

Создание файла данных


В следующем примере показано использование именованного типа Student для хранения объединенных данных из двух коллекций строк в памяти, которые имитируют данные электронной таблицы в формате CSV. Первый набор строк представляет имена и идентификаторы студентов, а вторая коллекция представляет идентификатор студента (в первом столбце) и четыре результата экзаменов. Идентификатор используется в качестве внешнего ключа.

Class Student
    Public FirstName As String 
    Public LastName As String 
    Public ID As Integer 
    Public ExamScores As List(Of Integer)
End Class 

Class PopulateCollection

    Shared Sub Main()

        ' Merge content from spreadsheets into a list of Student objects. 

        ' These data files are defined in How to: Join Content from  
        ' Dissimilar Files (LINQ). 

        ' Each line of names.csv consists of a last name, a first name, and an 
        ' ID number, separated by commas. For example, Omelchenko,Svetlana,111 
        Dim names As String() = System.IO.File.ReadAllLines("../../../names.csv")

        ' Each line of scores.csv consists of an ID number and four test  
        ' scores, separated by commas. For example, 111, 97, 92, 81, 60 
        Dim scores As String() = System.IO.File.ReadAllLines("../../../scores.csv")

        ' The following query merges the content of two dissimilar spreadsheets  
        ' based on common ID values. 
        ' Multiple From clauses are used instead of a Join clause 
        ' in order to store the results of scoreLine.Split. 
        ' Note the dynamic creation of a list of integers for the 
        ' ExamScores member. We skip the first item in the split string  
        ' because it is the student ID, not an exam score. 
        Dim queryNamesScores = From nameLine In names
                          Let splitName = nameLine.Split(New Char() {","})
                          From scoreLine In scores
                          Let splitScoreLine = scoreLine.Split(New Char() {","})
                          Where splitName(2) = splitScoreLine(0)
                          Select New Student() With {
                               .FirstName = splitName(0), .LastName = splitName(1), .ID = splitName(2),
                               .ExamScores = (From scoreAsText In splitScoreLine Skip 1
                                             Select Convert.ToInt32(scoreAsText)).ToList()}

        ' Optional. Store the query results for faster access in future 
        ' queries. This could be useful with very large data files. 
        Dim students As List(Of Student) = queryNamesScores.ToList()

        ' Display each student's name and exam score average. 
        For Each s In students
            Console.WriteLine("The average score of " & s.FirstName & " " &
                              s.LastName & " is " & s.ExamScores.Average())

        ' Keep console window open in debug mode.
        Console.WriteLine("Press any key to exit.")
    End Sub 
End Class 

' Output:  
' The average score of Omelchenko Svetlana is 82.5 
' The average score of O'Donnell Claire is 72.25 
' The average score of Mortensen Sven is 84.5 
' The average score of Garcia Cesar is 88.25 
' The average score of Garcia Debra is 67 
' The average score of Fakhouri Fadi is 92.25 
' The average score of Feng Hanying is 88 
' The average score of Garcia Hugo is 85.75 
' The average score of Tucker Lance is 81.75 
' The average score of Adams Terry is 85.25 
' The average score of Zabokritski Eugene is 83 
' The average score of Tucker Michael is 92
class Student
    public string FirstName { get; set; }
    public string LastName { get; set; }
    public int ID { get; set; }
    public List<int> ExamScores { get; set; }

class PopulateCollection
    static void Main()
        // These data files are defined in How to: Join Content from  
        // Dissimilar Files (LINQ). 

        // Each line of names.csv consists of a last name, a first name, and an 
        // ID number, separated by commas. For example, Omelchenko,Svetlana,111 
        string[] names = System.IO.File.ReadAllLines(@"../../../names.csv");

        // Each line of scores.csv consists of an ID number and four test  
        // scores, separated by commas. For example, 111, 97, 92, 81, 60 
        string[] scores = System.IO.File.ReadAllLines(@"../../../scores.csv");

        // Merge the data sources using a named type. 
        // var could be used instead of an explicit type. Note the dynamic 
        // creation of a list of ints for the ExamScores member. We skip  
        // the first item in the split string because it is the student ID,  
        // not an exam score.
        IEnumerable<Student> queryNamesScores =
            from nameLine in names
            let splitName = nameLine.Split(',')
            from scoreLine in scores
            let splitScoreLine = scoreLine.Split(',')
            where splitName[2] == splitScoreLine[0]
            select new Student()
                FirstName = splitName[0],
                LastName = splitName[1],
                ID = Convert.ToInt32(splitName[2]),
                ExamScores = (from scoreAsText in splitScoreLine.Skip(1)
                              select Convert.ToInt32(scoreAsText)).

        // Optional. Store the newly created student objects in memory 
        // for faster access in future queries. This could be useful with 
        // very large data files.
        List<Student> students = queryNamesScores.ToList();

        // Display each student's name and exam score average. 
        foreach (var student in students)
            Console.WriteLine("The average score of {0} {1} is {2}.",
                student.FirstName, student.LastName,

        //Keep console window open in debug mode
        Console.WriteLine("Press any key to exit.");
/* Output: 
    The average score of Omelchenko Svetlana is 82.5.
    The average score of O'Donnell Claire is 72.25.
    The average score of Mortensen Sven is 84.5.
    The average score of Garcia Cesar is 88.25.
    The average score of Garcia Debra is 67.
    The average score of Fakhouri Fadi is 92.25.
    The average score of Feng Hanying is 88.
    The average score of Garcia Hugo is 85.75.
    The average score of Tucker Lance is 81.75.
    The average score of Adams Terry is 85.25.
    The average score of Zabokritski Eugene is 83.
    The average score of Tucker Michael is 92.

В предложении select инициализатор объектов используется для создания каждого нового объекта Student, применяя данные из двух источников.

Если нет необходимости хранить результаты запроса, анонимные типы могут быть более удобными, чем именованные типы. Именованные типы необходимы, если результаты запроса передаются за пределы метода, в котором выполняется запрос. В следующем примере выполняется та же задача, что и в предыдущем примере, но с использованием анонимных типов вместо именованных:

' Merge the data by using an anonymous type.  
' Note the dynamic creation of a list of integers for the 
' ExamScores member. We skip 1 because the first string 
' in the array is the student ID, not an exam score. 
Dim queryNamesScores2 =
    From nameLine In names
    Let splitName = nameLine.Split(New Char() {","})
    From scoreLine In scores
    Let splitScoreLine = scoreLine.Split(New Char() {","})
    Where splitName(2) = splitScoreLine(0)
    Select New With
           {.Last = splitName(0),
            .First = splitName(1),
            .ExamScores = (From scoreAsText In splitScoreLine Skip 1
                           Select Convert.ToInt32(scoreAsText)).ToList()}

' Display each student's name and exam score average. 
For Each s In queryNamesScores2
    Console.WriteLine("The average score of " & s.First & " " &
                      s.Last & " is " & s.ExamScores.Average())
// Merge the data sources by using an anonymous type. 
// Note the dynamic creation of a list of ints for the 
// ExamScores member. We skip 1 because the first string 
// in the array is the student ID, not an exam score. 
var queryNamesScores2 =
    from nameLine in names
    let splitName = nameLine.Split(',')
    from scoreLine in scores
    let splitScoreLine = scoreLine.Split(',')
    where splitName[2] == splitScoreLine[0]
    select new
        First = splitName[0],
        Last = splitName[1],
        ExamScores = (from scoreAsText in splitScoreLine.Skip(1)
                      select Convert.ToInt32(scoreAsText))

// Display each student's name and exam score average. 
foreach (var student in queryNamesScores2)
    Console.WriteLine("The average score of {0} {1} is {2}.",
        student.First, student.Last, student.ExamScores.Average());

Компиляция кода

  • Чтобы настроить исходные файлы, следуйте инструкциям в разделе Практическое руководство. Объединение содержимого из файлов разных форматов (LINQ).

  • Создайте проект Visual Studio, предназначенный для .NET Framework версии 3.5 или более поздней версии. По умолчанию в проекте имеются ссылка на файл System.Core.dll и директива using (C#) или оператор Imports (Visual Basic) для пространства имен System.Linq.

  • Скопируйте этот код в проект.

  • Нажмите клавишу F5, чтобы скомпилировать и выполнить программу.

  • Нажмите любую клавишу для выхода из окна консоли.

