Ремонт принтеров, сканнеров, факсов и остальной офисной техники


назад Оглавление вперед




[214]

30.3.1. Упражнения

30.3-1. Докажите результат, аналогичный теореме Брента, для моделирования на CRCW-машине схем, содержащих элементы И и ИЛИ с любой входной степенью. (Указание: в качестве размера следует рассмотреть общее количество входов элементов).

30.3-2. Докажите, что существует EREW-алгоритм для параллельной обработки префиксов массива из га элементов, использующий О (га/ lgra) процессоров и имеющий время работы О (lgra). Почему этот алгоритм нельзя использовать для списков?

30.3-3. Постройте эффективный по затратам алгоритм для умножения матрицы размера га X га на вектор размера га со временем работы О (lgra). (Указание: Постройте сначала схему из функциональных элементов.)

30.3-4. Постройте CRCW-алгоритм для умножения двух матриц размера га X га, использующий га2 процессоров и не менее эффективный по затратам, чем стандартный алгоритм со временем работы 0(га3). Будет ли он EREW-алгоритмом?

30.3-5. В некоторых моделях параллельных вычислений процессоры могут отключаться на некоторых шагах, так что число активных процессоров уменьшается. При подсчёте затрат на каждом шаге учитываются только активные процессоры. Докажите, что CRCW-алгоритм в такой модели со временем работы t, затратами w и любым начальным числом процессоров может быть смоделирован на EREW-машине с р процессорами за время 0((w/p-\-t) lgp). (Основная сложность состоит в том, что заранее неизвестно, какие процессоры будут активны.)

30.4. Эффективная параллельная обработка префиксов

В разделе 30.1.2 был рассмотрен EREW-алгоритм параллельной обработки префиксов для списка из га элементов за время О (lgra). Он использует га процессоров, поэтому затраты составляют ©(ralg га), что больше, чем затраты О (га) однопроцессорного алгоритма. Следовательно, алгоритм List-Prefix не является эффективным по затратам.

В этом разделе описывается вероятностный EREW-алгоритм параллельной обработки префиксов, который использует ©(га/lgra) процессоров и в большинстве случаев (с большой вероятностью) работает за время О (lgra). Таким образом, этот (вероятностный) алгоритм можно считать эффективным по затратам. Конструкция теоремы 30.4 позволяет указать такой алгоритм для любого числа процессоров р = 0(п/ lg га).


splice out = удаление

splice in = возвращение удалённых

рекурсивный вызов процедуры Randomized-List-Prefix

Рис. 30.9 30.9. Рекурсивный вероятностный алгоритм обработки префиксов списка на примере списка из 9 объектов, (а) Чёрные объекты намечены для удаления. (Среди них нет соседних.) (Ь) Значение каждого удаляемого объекта соединяется со значением следующего; алгоритм рекурсивно вызывается на уменьшенном списке, (c)-(d) В результате уцелевшие элементы получают правильные значения, а удалённые объекты вычисляют свои префиксы с помощью предыдущих.

splice out удаление splice in возвращение stage 1 уровень 1 (bottom) (внутренний) (top) (внешний)

Рис. 30.10 30.10. Уровни рекурсии для алгоритма Randomized-List-Prefix. Вначале список содержит 9 объектов. Рекурсивные вызовы осуществляются до тех пор, пока список не станет пустым.

30.4.1. Рекурсивная параллельная обработка префиксов

Алгоритм Randomized-List-Prefix использует для га-элементного списка р = 0(ra/lgra) процессоров, так что каждый процессор отвечает за п/р = в (lgra) элементов. Распределение объектов по процессорам происходит произвольным образом (не обязательно подряд) в начале работы алгоритма и более не меняется. Для удобства будем считать, что список является двунаправленным, поскольку такой список можно изготовить из однонаправленного за время 0(1).

Идея алгоритма состоит в том, чтобы исключить из списка некоторые объекты (присоединив их к следующим за ними), произвести обработку префиксов для получившегося списка, а затем обработать пропущенные префиксы, учтя исключённые элементы. Один уровень рекурсии показан на рис. 30.9, а весь процесс - на рис. 30.10.

При выборе исключаемых элементов мы будем соблюдать такие правила::

1.Нельзя одновременно исключать два элемента, за которые отвечает один и тот же процессор.

2.Нельзя исключать два соседних в списке объекта.

Перед тем как описывать механизм выбора исключаемых элементов, рассмотрим подробнее сам процесс исключения. Пусть решено исключить /г-й объект. Тогда (/г + 1)-й объект запоминает значение [к, /г+1] = [к, к] <g> [к + 1, к + 1] (после чего /г-й объект удаляется). Если /г-й объект является последним, то он просто удаляется из списка.

После удаления процедура Randomized-List-Prefix вызывает саму себя на уменьшенном списке, если он ещё не пуст. После этого


рекурсивного вызова все элементы уменьшенного списка содержат правильные значения префиксов, и остаётся лишь обработать префиксы, соответствующие исключённым элементам.

Это сделать легко: если /г-й объект был исключён, то (к - 1)-й объект остался в списке и после рекурсивного вызова содержит значение [1, к - 1]. Остаётся лишь вычислить [1, к] = [1, к - 1]®[/г, к].

Условие 1 гарантирует, что для каждого исключённого объекта найдётся процессор, который будет производить вычисления. Условие 2 обеспечивает возможность обработать недостающий префикс, произведя всего одну операцию <g> (см. упр. 30-4.1). Итак, при выполнении требований 1 и 2 каждый шаг алгоритма требует времени 0(1).

30.4.2.Выбор удаляемых объектов

Как же выбирать объекты для удаления? Прежде всего, необходимо соблюдать требования 1 и 2. Кроме того, сам процесс выбора должен занимать немного времени (лучше всего 0(1)). Наконец, следует удалять как можно больше объектов, чтобы остающийся список был как можно короче и глубина рекурсии - как можно меньше.

Укажем способ удовлетворить всем этим требованиям.

1.Каждый процессор случайно выбирает один из подведомственных ему объектов (из числа оставшихся в списке).

2.Каждый процессор бросает монету и с вероятностью 1/2 помечает выбранный им на предыдущем шаге объект (а с вероятностью 1/2 не делает ничего).

3.К удалению назначаются помеченные объекты, у которых следующий объект не помечен: объект г удаляется, если он помечен, a next[i] не помечен (никаким другим процессором).

Описанные действия выполняются за время 0(1) и не используют одновременный доступ к памяти.

Очевидно, что требование 1 выполнено (каждый процессор выбирает не более одного элемента). Требование 2 также выполнено, так как объекты г и next[i] не могут быть выбраны одновременно - если next[i] выбран, то он должен быть помечен - а тогда объект г не выбирается.

30.4.3.Анализ

Поскольку шаг рекурсии занимает время 0(1), необходимо оценить лишь количество шагов, после которого список станет пустым. Пусть на этапе 1 описанного процесса какой-то процессор выбрал объект г. Какова вероятность того, что объект г попадёт в



[стр.Начало] [стр.1] [стр.2] [стр.3] [стр.4] [стр.5] [стр.6] [стр.7] [стр.8] [стр.9] [стр.10] [стр.11] [стр.12] [стр.13] [стр.14] [стр.15] [стр.16] [стр.17] [стр.18] [стр.19] [стр.20] [стр.21] [стр.22] [стр.23] [стр.24] [стр.25] [стр.26] [стр.27] [стр.28] [стр.29] [стр.30] [стр.31] [стр.32] [стр.33] [стр.34] [стр.35] [стр.36] [стр.37] [стр.38] [стр.39] [стр.40] [стр.41] [стр.42] [стр.43] [стр.44] [стр.45] [стр.46] [стр.47] [стр.48] [стр.49] [стр.50] [стр.51] [стр.52] [стр.53] [стр.54] [стр.55] [стр.56] [стр.57] [стр.58] [стр.59] [стр.60] [стр.61] [стр.62] [стр.63] [стр.64] [стр.65] [стр.66] [стр.67] [стр.68] [стр.69] [стр.70] [стр.71] [стр.72] [стр.73] [стр.74] [стр.75] [стр.76] [стр.77] [стр.78] [стр.79] [стр.80] [стр.81] [стр.82] [стр.83] [стр.84] [стр.85] [стр.86] [стр.87] [стр.88] [стр.89] [стр.90] [стр.91] [стр.92] [стр.93] [стр.94] [стр.95] [стр.96] [стр.97] [стр.98] [стр.99] [стр.100] [стр.101] [стр.102] [стр.103] [стр.104] [стр.105] [стр.106] [стр.107] [стр.108] [стр.109] [стр.110] [стр.111] [стр.112] [стр.113] [стр.114] [стр.115] [стр.116] [стр.117] [стр.118] [стр.119] [стр.120] [стр.121] [стр.122] [стр.123] [стр.124] [стр.125] [стр.126] [стр.127] [стр.128] [стр.129] [стр.130] [стр.131] [стр.132] [стр.133] [стр.134] [стр.135] [стр.136] [стр.137] [стр.138] [стр.139] [стр.140] [стр.141] [стр.142] [стр.143] [стр.144] [стр.145] [стр.146] [стр.147] [стр.148] [стр.149] [стр.150] [стр.151] [стр.152] [стр.153] [стр.154] [стр.155] [стр.156] [стр.157] [стр.158] [стр.159] [стр.160] [стр.161] [стр.162] [стр.163] [стр.164] [стр.165] [стр.166] [стр.167] [стр.168] [стр.169] [стр.170] [стр.171] [стр.172] [стр.173] [стр.174] [стр.175] [стр.176] [стр.177] [стр.178] [стр.179] [стр.180] [стр.181] [стр.182] [стр.183] [стр.184] [стр.185] [стр.186] [стр.187] [стр.188] [стр.189] [стр.190] [стр.191] [стр.192] [стр.193] [стр.194] [стр.195] [стр.196] [стр.197] [стр.198] [стр.199] [стр.200] [стр.201] [стр.202] [стр.203] [стр.204] [стр.205] [стр.206] [стр.207] [стр.208] [стр.209] [стр.210] [стр.211] [стр.212] [стр.213] [стр.214] [стр.215] [стр.216] [стр.217] [стр.218] [стр.219] [стр.220] [стр.221] [стр.222] [стр.223] [стр.224] [стр.225] [стр.226] [стр.227] [стр.228] [стр.229] [стр.230] [стр.231] [стр.232] [стр.233] [стр.234] [стр.235] [стр.236] [стр.237] [стр.238] [стр.239] [стр.240] [стр.241] [стр.242] [стр.243] [стр.244] [стр.245] [стр.246] [стр.247] [стр.248] [стр.249] [стр.250] [стр.251] [стр.252] [стр.253] [стр.254] [стр.255] [стр.256] [стр.257] [стр.258] [стр.259] [стр.260] [стр.261] [стр.262] [стр.263] [стр.264] [стр.265] [стр.266] [стр.267] [стр.268] [стр.269] [стр.270] [стр.271] [стр.272] [стр.273] [стр.274] [стр.275] [стр.276] [стр.277] [стр.278] [стр.279] [стр.280] [стр.281] [стр.282] [стр.283] [стр.284] [стр.285] [стр.286] [стр.287] [стр.288] [стр.289] [стр.290] [стр.291] [стр.292] [стр.293] [стр.294]