355 500 произведений, 25 200 авторов.

Электронная библиотека книг » Герберт Шилдт » C# 4.0: полное руководство » Текст книги (страница 73)
C# 4.0: полное руководство
  • Текст добавлен: 6 апреля 2017, 04:00

Текст книги "C# 4.0: полное руководство"


Автор книги: Герберт Шилдт



сообщить о нарушении

Текущая страница: 73 (всего у книги 83 страниц)

В приведенном ниже примере программы демонстрируется применение метода Break() для прерывания цикла, параллельно выполняемого методом For(). Это вариант предыдущего примера, переработанный таким образом, чтобы метод MyTransform() принимал теперь объект типа ParallelLoopState в качестве своего параметра, а метод Break() вызывался при обнаружении отрицательного значения в массиве данных. Отрицательное значение, по которому прерывается выполнение цикла, вводится в массив data внутри метода Main(). Далее проверяется состояние завершения цикла преобразования данных. Свойство IsCompleted будет содержать логическое значение false, поскольку в массиве data обнаруживается отрицательное значение. При этом на экран выводится номер шага, на котором цикл был прерван. (В этой программе исключены все избыточные циклы, применявшиеся в ее предыдущей версии, а оставлены только самые эффективные из них: последовательно выполняемый цикл инициализации и параллельно выполняемый цикл преобразования.)

// Использовать объекты типа ParallelLoopResult и ParallelLoopState, а также

// метод Break() вместе с методом For() для параллельного выполнения цикла.

using System;

using System.Threading.Tasks;

class DemoParallelForWithLoopResult {

  static int[] data;

  // Метод, служащий в качестве тела параллельно выполняемого цикла.

  //Операторы этого цикла просто расходуют время ЦП для целей демонстрации,

  static void MyTransform(int i, ParallelLoopState pis) {

    // Прервать цикл при обнаружении отрицательного значения,

    if(data[i] < 0) pis.Break();

    data[i] = data[i] / 10;

    if(data[i] < 1000) data[i] = 0;

    if(data[i] > 1000 & data[i] < 2000) data[i] = 100;

    if(data[i] > 2000 & data[i] < 3000) data[i] = 200;

    if(data[i] > 3000) data[i] = 300;

  }

  static void Main() {

    Console.WriteLine(«Основной поток запущен.»);

    data = new int[100000000];

    // Инициализировать данные.

    for(int i=0; i < data.Length; i++) data[i] = i;

    // Поместить отрицательное значение в массив data, data[1000] = -10;

    // Параллельный вариант инициализации массива в цикле.

    ParallelLoopResult loopResult = Parallel.For(0, data.Length, MyTransform);

    // Проверить, завершился ли цикл,

    if(!loopResult.IsCompleted)

      Console.WriteLine("nЦикл завершился преждевременно из-за того, " +

            «что обнаружено отрицательное значение» +

            "на шаге цикла номер " +

            loopResult.LowestBreakIteration + «.n»);

    Console.WriteLine(«Основной поток завершен.»);

  }

}

Выполнение этой программы может привести, например, к следующему результату.

Основной поток запущен.

Цикл завершился преждевременно из-за того, что обнаружено отрицательное значение на шаге цикла номер 1000

Основной поток завершен.

Как следует из приведенного выше результата, цикл преобразования данных преждевременно завершается после 1000 шагов. Дело в том, что метод Break() вызывается внутри метода MyTransform() при обнаружении в массиве данных отрицательного значения.

Помимо двух описанных выше форм метода For() существует и ряд других его форм. В одних из этих форм допускается указывать различные дополнительные параметры, а в других – использовать параметры типа long вместо int для пошагового выполнения цикла. Имеются также формы метода For(), предоставляющие такие дополнительные преимущества, как, например, возможность указывать метод, вызываемый по завершении потока каждого цикла.

И еще одно, последнее замечание: если требуется остановить цикл, параллельно выполняемый методом For(), не обращая особого внимания на любые шаги цикла, которые еще могут быть в нем выполнены, то для этой цели лучше воспользоваться методом Stop(), чем методом Break().


Применение метода ForEach()

Используя метод ForEach(), можно создать распараллеливаемый вариант цикла foreach. Существует несколько форм метода ForEach(). Ниже приведена простейшая форма его объявления:

public static ParallelLoopResult

      ForEach(IEnumerable source,

               Action body)

где source обозначает коллекцию данных, обрабатываемых в цикле, a body — метод, который будет выполняться на каждом шаге цикла. Как пояснялось ранее в этой книге, во всех массивах, коллекциях (описываемых в главе 25) и других источниках данных поддерживается интерфейс IEnumerable. Метод, передаваемый через параметр body, принимает в качестве своего аргумента значение или ссылку на каждый обрабатываемый в цикле элемент массива, но не его индекс. А в итоге возвращаются сведения о состоянии цикла.

Аналогично методу For(), параллельное выполнение цикла методом ForEach() можно остановить, вызвав метод Break() для экземпляра объекта типа ParallelLoopState, передаваемого через параметр body, при условии, что используется приведенная ниже форма метода ForEach().

public static ParallelLoopResult

      ForEach(IEnumerable source,

          Action body)

В приведенном ниже примере программы демонстрируется применение метода ForEach() на практике. Как и прежде, в данном примере создается крупный массив целых значений. А отличается данный пример от предыдущих тем, что метод, выполняющийся на каждом шаге цикла, просто выводит на консоль значения из массива. Как правило, метод WriteLine() в распараллеливаемом цикле не применяется, потому что ввод-вывод на консоль осуществляется настолько медленно, что цикл оказывается полностью привязанным к вводу-выводу. Но в данном примере метод WriteLine() применяется исключительно в целях демонстрации возможностей метода ForEach(). При обнаружении отрицательного значения выполнение цикла прерывается вызовом метода Break(). Несмотря на то что метод Break() вызывается в одной задаче, другая задача может по-прежнему выполняться в течение нескольких шагов цикла, прежде чем он будет прерван, хотя это зависит от конкретных условий работы среды выполнения.

// Использовать объекты типа ParallelLoopResult и ParallelLoopState, а также

// метод Break() вместе с методом ForEach() для параллельного выполнения цикла.

using System;

using System.Threading.Tasks;

class DemoParallelForWithLoopResult {

  static int[] data;

  // Метод, служащий в качестве тела параллельно выполняемого цикла.

  // В данном примере переменной v передается значение элемента массива

  // данных, а не индекс этого элемента.

  static void DisplayData(int v, ParallelLoopState pis) {

    // Прервать цикл при обнаружении отрицательного значения,

    if (v < 0) pis.Break();

    Console.WriteLine("Значение: " + v);

  }

  static void Main() {

    Console.WriteLine(«Основной поток запущен.»);

    data = new int[100000000];

    // Инициализировать данные.

    for (int i=0; i < data.Length; i++) data[i] = i;

    // Поместить отрицательное значение в массив data,

    data[100000] = -10;

    // Использовать цикл, параллельно выполняемый методом ForEach(),

    // для отображения данных на экране.

    ParallelLoopResult loopResult = Parallel.ForEach(data, DisplayData);

    // Проверить, завершился ли цикл,

    if(!loopResult.IsCompleted)

      Console.WriteLine("nЦикл завершился преждевременно из-за того, " +

             «что обнаружено отрицательное значение» +

             "на шаге цикла номер " +

             loopResult.LowestBreakIteration + «.n»);

    Console.WriteLine(«Основной поток завершен.»);

  }

}

В приведенной выше программе именованный метод применяется в качестве делегата, представляющего «тело» цикла. Но иногда удобнее применять анонимный метод. В качестве примера ниже приведено реализуемое в виде лямбда-выражения «тело» цикла, параллельно выполняемого методом ForEach().

// Использовать цикл, параллельно выполняемый методом ForEach(),

// для отображения данных на экране.

ParallelLoopResult loopResult =

        Parallel.ForEach(data, (v, pis) => {

                Console.WriteLine("Значение: " + v);

                if (v < 0) pis.Break();

         }

         );


Исследование возможностей PLINQ

PLINQ представляет собой параллельный вариант языка интегрированных запросов LINQ и тесно связан с библиотекой TPL. PLINQ применяется, главным образом, для достижения параллелизма данных внутри запроса. Как станет ясно из дальнейшего, сделать это совсем не трудно. Как и TPL, тема PLINQ довольно обширна и многогранна, поэтому в этой главе представлены лишь самые основные понятия данного языка.


Класс ParallelEnumerable

Основу PLINQ составляет класс ParallelEnumerable, определенный в пространстве имен System.Linq. Это статический класс, в котором определены многие методы расширения, поддерживающие параллельное выполнение операций. По существу, он представляет собой параллельный вариант стандартного для LINQ класса Enumerable. Многие его методы являются расширением класса ParallelQuery, а некоторые из них возвращают объект типа ParallelQuery. В классе ParallelQuery инкапсулируется последовательность операций, поддерживающая параллельное выполнение. Имеются как обобщенный, так и необобщенный варианты данного класса. Мы не будем обращаться к классу ParallelQuery непосредственно, а воспользуемся несколькими методами класса ParallelEnumerable. Самый главный из них, метод AsParallel(), описывается в следующем разделе.


Распараллеливание запроса методом AsParallel()

Едва ли не самым удобным средством PLINQ является возможность просто создавать параллельный запрос. Нужно лишь вызвать метод AsParallel() для источника данных. Метод AsParallel() определен в классе ParallelEnumerable и возвращает источник данных, инкапсулированный в экземпляре объекта типа ParallelQuery. Это дает возможность поддерживать методы расширения параллельных запросов. После вызова данного метода запрос разделяет источник данных на части и оперирует с каждой из них таким образом, чтобы извлечь максимальную выгоду из распараллеливания. (Если распараллеливание оказывается невозможным или неприемлемым, то запрос, как обычно, выполняется последовательно.) Таким образом, добавления в исходный код единственного вызова метода AsParallel() оказывается достаточно для того, чтобы превратить последовательный запрос LINQ в параллельный запрос LINQ. Для простых запросов это единственное необходимое условие.

Существуют как обобщенные, так и необобщенные формы метода AsParallel(). Ниже приведена простейшая обобщенная его форма:

public static ParallelQuery AsParallel(this IEnumerable source)

public static ParallelQuery

                     AsParallel(this IEnumerable source)

где TSource обозначает тип элементов в последовательном источнике данных source.

Ниже приведен пример, демонстрирующий простой запрос PLINQ.

// Простой запрос PLINQ.

using System;

using System.Linq;

class PLINQDemo {

  static void Main() {

    int[] data = new int[10000000];

    // Инициализировать массив данных положительными значениями,

    for(int i=0; i < data.Length; i++) data[i] = i;

    //А теперь ввести в массив данных ряд отрицательных значений

    data[1000] = -1;

    data[14000] = -2;

    data[15000] = -3;

    data[676000] = -4;

    data[8024540] = -5;

    data[9908000] = -6;

    // Использовать запрос PLINQ для поиска отрицательных значений,

    var negatives = from val in data.AsParallel() where val < 0 select val;

    foreach(var v in negatives)

      Console.Write(v + " ");

    Console.WriteLine();

  }

}

Эта программа начинается с создания крупного массива data, инициализируемого целыми положительными значениями. Затем в него вводится ряд отрицательных значений. А далее формируется запрос на возврат последовательности отрицательных значений. Ниже приведен этот запрос.

var negatives = from val in data.AsParallel() where val < 0 select val;

В этом запросе метод AsParallel() вызывается для источника данных, в качестве которого служит массив data. Благодаря этому разрешается параллельное выполнение операций над массивом data, а именно: поиск отрицательных значений параллельно в нескольких потоках. По мере обнаружения отрицательных значений они добавляются в последовательность вывода. Это означает, что порядок формирования последовательности вывода может и не отражать порядок расположения отрицательных значений в массиве data. В качестве примера ниже приведен результат выполнения приведенного выше кода в двухъядерной системе.

-5 -6 -1 -2 -3 -4

Как видите, в том потоке, где поиск выполнялся в верхней части массива, отрицательные значения -5 и -6 были обнаружены раньше, чем значение -1 в том потоке, где поиск происходил в нижней части массива. Следует, однако, иметь в виду, что из-за отличий в степени загрузки задачами, количества доступных процессоров и прочих факторов системного характера могут быть получены разные результаты. А самое главное, что результирующая последовательность совсем не обязательно будет отражать порядок формирования исходной последовательности.


Применение метода AsOrdered()

Как отмечалось в предыдущем разделе, по умолчанию порядок формирования результирующей последовательности в параллельном запросе совсем не обязательно должен отражать порядок формирования исходной последовательности. Более того, результирующую последовательность следует рассматривать как практически неупорядоченную. Если же результат должен отражать порядок организации источника данных, то его нужно запросить специально с помощью метода AsOrdered(), определенного в классе ParallelEnumerable. Ниже приведены обобщенная и необобщенная формы этого метода:

public static ParallelQuery AsOrdered(this ParallelQuery source)

public static ParallelQuery

           AsOrdered(this ParallelQuery source)

где TSource обозначает тип элементов в источнике данных source. Метод AsOrdered() можно вызывать только для объекта типа ParallelQuery, поскольку он является методом расширения класса ParallelQuery.

Для того чтобы посмотреть, к какому результату может привести применение метода AsOrdered(), подставьте его вызов в приведенный ниже запрос из предыдущего примера программы.

// Использовать метод AsOrdered() для сохранения порядка

// в результирующей последовательности.

var negatives = from val in data.AsParallel().AsOrdered() where val < 0 select val;

После выполнения программы порядок следования элементов в результирующей последовательности будет отражать порядок их расположения в исходной последовательности.


Отмена параллельного запроса

Параллельный запрос отменяется таким же образом, как и задача. И в том и в другом случае отмена опирается на структуру CancellationToken, получаемую из класса CancellationTokenSource. Получаемый в итоге признак отмены передается запросу с помощью метода WithCancellation(). Отмена параллельного запроса производится методом Cancel(), который вызывается для источника признаков отмены. Главное отличие отмены параллельного запроса от отмены задачи состоит в следующем: когда параллельный запрос отменяется, он генерирует исключение OperationCanceledException, а не AggregateException. Но в тех случаях, когда запрос способен сгенерировать несколько исключений, исключение OperationCanceledException может быть объединено в совокупное исключение AggregateException. Поэтому отслеживать лучше оба вида исключений.

Ниже приведена форма объявления метода WithCancellation():

public static ParallelQuery  WithCancellation (

                  this ParallelQuery source,

                             CancellationToken cancellationToken)

где source обозначает вызывающий запрос, a cancellationToken – признак отмены. Этот метод возвращает запрос, поддерживающий указанный признак отмены.

В приведенном ниже примере программы демонстрируется порядок отмены параллельного запроса, сформированного в программе из предыдущего примера. В данной программе организуется отдельная задача, которая ожидает в течение 100 миллисекунд, а затем отменяет запрос. Отдельная задача требуется потому, что цикл foreach, в котором выполняется запрос, блокирует выполнение метода Main() до завершения цикла.

// Отменить паралельный запрос

using System;

using System.Linq;

using System.Threading;

using System.Threading.Tasks;

class PLINQCancelDemo {

  static void Main() {

    CancellationTokenSource cancelTokSrc = new CancellationTokenSource();

    int[] data = new int[10000000];

    // Инициализировать массив данных положительными значениями,

    for (int i=0; i < data.Length; i++) data[i] = i;

    //А теперь ввести в массив данных ряд отрицательных значений,

    data[1000] = -1;

    data [14000] = -2;

    data[15000] = -3;

    data[676000] = -4;

    data[8024540] = -5;

    data [9908000] = -6;

   // Использовать запрос PLINQ для поиска отрицательных значений,

    var negatives = from val in

          data.AsParallel(). WithCancellation(cancelTokSrc.Token)

          where val < 0

          select val;

    // Создать задачу для отмены запроса по истечении 100 миллисекунд.

    Task cancelTsk = Task.Factory.StartNew(() => {

              Thread.Sleep(100);

              cancelTokSrc.Cancel();

    });

    try {

      foreach(var v in negatives)

        Console.Write(v + " ");

    } catch(OperationCanceledException exc) {

      Console.WriteLine(exc.Message);

    } catch(AggregateException exc) {

      Console.WriteLine (exc);

    } finally {

      cancelTsk.Wait();

      cancelTokSrc.Dispose();

      cancelTsk.Dispose();

    }

    Console.WriteLine();

  }

}

Ниже приведен результат выполнения этой программы. Если запрос отменяется до его завершения, то на экран выводится только сообщение об исключительной ситуации.

Запрос отменен с помощью маркера, переданного в метод WithCancellation.


Другие средства PLINQ

Как упоминалось ранее, PLINQ представляет собой довольно крупную подсистему. Это объясняется отчасти той гибкостью, которой обладает PLINQ. В PLINQ доступны и многие другие средства, помогающие подстраивать параллельные запросы под конкретную ситуацию. Так, при вызове метода WithDegreeOfParallelism() можно указать максимальное количество процессоров, выделяемых для обработки запроса, а при вызове метода AsSequential() – запросить последовательное выполнение части параллельного запроса. Если вызывающий поток, ожидающий результатов от цикла foreach, не требуется блокировать, то для этой цели можно воспользоваться методом ForAll(). Все эти методы определены в классе ParallelEnumerable. А в тех случаях, когда PLINQ должен по умолчанию поддерживать последовательное выполнение, можно воспользоваться методом WithExecutionMode(), передав ему в качестве параметра признак ParallelExecutionMode.ForceParallelism.


Вопросы эффективности PLINQ

Далеко не все запросы выполняются быстрее только потому, что они распараллелены. Как пояснялось ранее в отношении TPL, издержки, связанные с созданием параллельных потоков и управлением их исполнением, могут «перекрыть» все преимущества, которые дает распараллеливание. Вообще говоря, если источник данных оказывается довольно мелким, а требующаяся обработка данных – очень короткой, то внедрение параллелизма может и не привести к ускорению обработки запроса. Поэтому за рекомендациями по данному вопросу следует обращаться к информации корпорации Microsoft.


ГЛАВА 25 Коллекции, перечислители и итераторы

В этой главе речь пойдет об одной из самых важных составляющих среды .NET Framework: коллекциях. В C# коллекция представляет собой совокупность объектов. В среде .NET Framework имеется немало интерфейсов и классов, в которых определяются и реализуются различные типы коллекций. Коллекции упрощают решение многих задач программирования благодаря тому, что предлагают готовые решения для создания целого ряда типичных, но порой трудоемких для разработки структур данных. Например, в среду .NET Framework встроены коллекции, предназначенные для поддержки динамических массивов, связных списков, стеков, очередей и хеш-таблиц. Коллекции являются современным технологическим средством, заслуживающим пристального внимания всех, кто программирует на С#.

Первоначально существовали только классы необобщенных коллекций. Но с внедрением обобщений в версии C# 2.0 среда .NET Framework была дополнена многими новыми обобщенными классами и интерфейсами. Благодаря введению обобщенных коллекций общее количество классов и интерфейсов удвоилось. Вместе с библиотекой распараллеливания задач (TPL) в версии 4.0 среды .NET Framework появился ряд новых классов коллекций, предназначенных для применения в тех случаях, когда доступ к коллекции осуществляется из нескольких потоков. Нетрудно догадаться, что прикладной интерфейс Collections API составляет значительную часть среды .NET Framework.

Кроме того, в настоящей главе рассматриваются два средства, непосредственно связанные с коллекциями: перечислители и итераторы. И те и другие позволяют поочередно обращаться к содержимому класса коллекции в цикле foreach.


    Ваша оценка произведения:

Популярные книги за неделю