Сайт по ремонту принтеров

двух га-разрядных чисел за время O(lgra) с элементами, имеющими фиксированное число входов, указал Офман [152]

Идею использовать сложение с запоминанием переносов для умножения высказали Эстрин, Гилхрист и Померен [64]. Атрубин [13] построил бесконечный линейно-матричный умножитель для чисел любой длины (га-й бит произведения выдаётся сразу после поступления га-ых битов сомножителей). Дерево Уоллеса описал Уоллес [197] (независимо его идея была открыта Офманом [152]).

Алгоритмы деления восходят к И. Ньютону (придумавшему свой метод итераций около 1665 года). В задаче 29.1 строится схема для деления, имеющая глубину глубины 0(lg2ra). В действительности можно построить схему глубины всего O(lgra) (Бим, Кук и Хувер [19]).

Алгоритмы параллельных вычислений

С появлением многопроцессорных компьютеров возникла необходимость в разработке параллельных алгоритмов (parallel algorithms), которые используют возможность одновременного выполнения нескольких действий. Усилиями многих исследователей такие алгоритмы разработаны для множества задач, в том числе и для задач, рассмотренных в предыдущих главах. В этой главе мы рассмотрим несколько простых параллельных алгоритмов в качестве иллюстрации основных идей.

Сортирующие сети и схемы из функциональных элементов (главы 28, 29) представляют собой модель параллельных вычислений, но недостаточно общую. В этой главе в качестве модели используются «параллельные машины с произвольным доступом». Они удобны для описания алгоритмов работы со структурами данных (массивами, деревьями, списками и т. д.). Эта модель достаточно близка к практике в том смысле, что если один алгоритм оказывается эффективнее другого для этой модели, то, как правило, он будет эффективнее и при практической реализации.

30.0.1. Параллельная машина с произвольным доступом (PRAM)

Устройство параллельной машины с произвольным доступом (parallel random-access machine, PRAM) показано на рис. 30.1. Процессоры Ро,... , Pp-i используют общую память (shared memory). Все р процессоров могут одновременно записывать информацию в память или читать из памяти, а также параллельно выполнять арифметические и логические операции.

В качестве меры для оценки времени работы мы выбираем число циклов параллельного доступа к общей памяти, считая, что каждый такой цикл занимает фиксированное время. На практи-

Рис. 30.1 30.1. Устройство PRAM-машины. Процессоры Po,Pi,... , Pp-i используют общую память. Каждый процессор может получить доступ к любой ячейке памяти за единичное время.

ке это не совсем так, поскольку время доступа к памяти зависит от количества используемых процессоров. Тем не менее, в реальных многопроцессорных компьютерах доступ к памяти (обычно с помощью специальной сети коммутации) действительно занимает большую часть времени, так что число обращений к памяти является разумной оценкой времени работы.

При оценке алгоритмов для PRAM необходимо учитывать не только время работы, но и количество используемых процессоров. В этом состоит важное отличие от однопроцессорной модели, где мы интересуемся в основном временем работы. Как правило, уменьшение числа процессоров приводит к соответствующему увеличению времени работы. Этот вопрос обсуждается в разделе 30.3.

30.0.2. Параллельный и исключительный доступ к памяти

Существует несколько подходов к использованию общей памяти. В алгоритмах с одновременным чтением (concurrent-read algorithms) несколько процессоров могут одновременно считывать информацию из одной ячейки. В алгоритмах с исключающим чтением (exclusive-read algorithms) одновременное чтение (из одной ячейки памяти) запрещено. Подобным же образом алгоритмы делятся на алгоритмы с одновременной записью (concurrent-write algorithms) и алгоритмы с исключающей записью (exclusive-write algorithms). Таким образом, возможно четыре вида общей памяти, для которых традиционно употребляются следующие названия:

•EREW (exclusive-read exclusive-write): исключающее чтение и исключающая запись,

•CREW: одновременное чтение и исключающая запись,

•ERCW: исключающее чтение и одновременная запись,

•CRCW: одновременное чтение и одновременная запись.

Далее мы будем говорить, например, о EREW-машине или CREW-алгоритме, имея в виду соответствующий тип общей памяти.

Наиболее употребительны модели EREW и CRCW. Ясно, что все алгоритмы, которые могут выполняться на EREW-машине, могут выполняться и на CRCW-машине, но не наоборот. Аппаратная поддержка модели EREW проще и быстрее (из-за отсутствия конфликтов при записи и чтении). Реализация модели CRCW более сложна, если мы хотим обеспечить хотя бы примерно одинаковое время доступа к памяти для всех вариантов доступа, но с точки зрения программиста эта модель значительно проще и удобнее.

Из двух оставшихся типов (CREW, ERCW) более популярна модель CREW, хотя на практике реализовать одновременную запись не сложнее, чем одновременное чтение. В этой главе считается, что все алгоритмы, использующие одновременное чтение или за-

[стр.Начало] [стр.1] [стр.2] [стр.3] [стр.4] [стр.5] [стр.6] [стр.7] [стр.8] [стр.9] [стр.10] [стр.11] [стр.12] [стр.13] [стр.14] [стр.15] [стр.16] [стр.17] [стр.18] [стр.19] [стр.20] [стр.21] [стр.22] [стр.23] [стр.24] [стр.25] [стр.26] [стр.27] [стр.28] [стр.29] [стр.30] [стр.31] [стр.32] [стр.33] [стр.34] [стр.35] [стр.36] [стр.37] [стр.38] [стр.39] [стр.40] [стр.41] [стр.42] [стр.43] [стр.44] [стр.45] [стр.46] [стр.47] [стр.48] [стр.49] [стр.50] [стр.51] [стр.52] [стр.53] [стр.54] [стр.55] [стр.56] [стр.57] [стр.58] [стр.59] [стр.60] [стр.61] [стр.62] [стр.63] [стр.64] [стр.65] [стр.66] [стр.67] [стр.68] [стр.69] [стр.70] [стр.71] [стр.72] [стр.73] [стр.74] [стр.75] [стр.76] [стр.77] [стр.78] [стр.79] [стр.80] [стр.81] [стр.82] [стр.83] [стр.84] [стр.85] [стр.86] [стр.87] [стр.88] [стр.89] [стр.90] [стр.91] [стр.92] [стр.93] [стр.94] [стр.95] [стр.96] [стр.97] [стр.98] [стр.99] [стр.100] [стр.101] [стр.102] [стр.103] [стр.104] [стр.105] [стр.106] [стр.107] [стр.108] [стр.109] [стр.110] [стр.111] [стр.112] [стр.113] [стр.114] [стр.115] [стр.116] [стр.117] [стр.118] [стр.119] [стр.120] [стр.121] [стр.122] [стр.123] [стр.124] [стр.125] [стр.126] [стр.127] [стр.128] [стр.129] [стр.130] [стр.131] [стр.132] [стр.133] [стр.134] [стр.135] [стр.136] [стр.137] [стр.138] [стр.139] [стр.140] [стр.141] [стр.142] [стр.143] [стр.144] [стр.145] [стр.146] [стр.147] [стр.148] [стр.149] [стр.150] [стр.151] [стр.152] [стр.153] [стр.154] [стр.155] [стр.156] [стр.157] [стр.158] [стр.159] [стр.160] [стр.161] [стр.162] [стр.163] [стр.164] [стр.165] [стр.166] [стр.167] [стр.168] [стр.169] [стр.170] [стр.171] [стр.172] [стр.173] [стр.174] [стр.175] [стр.176] [стр.177] [стр.178] [стр.179] [стр.180] [стр.181] [стр.182] [стр.183] [стр.184] [стр.185] [стр.186] [стр.187] [стр.188] [стр.189] [стр.190] [стр.191] [стр.192] [стр.193] [стр.194] [стр.195] [стр.196] [стр.197] [стр.198] [стр.199] [стр.200] [стр.201] [стр.202] [стр.203] [стр.204] [стр.205] [стр.206] [стр.207] [стр.208] [стр.209] [стр.210] [стр.211] [стр.212] [стр.213] [стр.214] [стр.215] [стр.216] [стр.217] [стр.218] [стр.219] [стр.220] [стр.221] [стр.222] [стр.223] [стр.224] [стр.225] [стр.226] [стр.227] [стр.228] [стр.229] [стр.230] [стр.231] [стр.232] [стр.233] [стр.234] [стр.235] [стр.236] [стр.237] [стр.238] [стр.239] [стр.240] [стр.241] [стр.242] [стр.243] [стр.244] [стр.245] [стр.246] [стр.247] [стр.248] [стр.249] [стр.250] [стр.251] [стр.252] [стр.253] [стр.254] [стр.255] [стр.256] [стр.257] [стр.258] [стр.259] [стр.260] [стр.261] [стр.262] [стр.263] [стр.264] [стр.265] [стр.266] [стр.267] [стр.268] [стр.269] [стр.270] [стр.271] [стр.272] [стр.273] [стр.274] [стр.275] [стр.276] [стр.277] [стр.278] [стр.279] [стр.280] [стр.281] [стр.282] [стр.283] [стр.284] [стр.285] [стр.286] [стр.287] [стр.288] [стр.289] [стр.290] [стр.291] [стр.292] [стр.293] [стр.294]

Среды: Smalltalk80 MicroCap Local bus Bios Pci 12С ML Микроконтроллеры: Atmel Intel Holtek AVR MSP430 Microchip Книги: Емкостный датчик 500 схем для радиолюбителей часть 2 (4) Структура компьютерных программ Автоматическая коммутация Кондиционирование и вентиляция Ошибки при монтаже Схемы звуковоспроизведения Дроссели для питания Блоки питания Детекторы перемещения Теория электропривода Адаптивное управление Измерение параметров Печатная плата pcad pcb Физика цвета Управлении софтверными проектами Математический аппарат Битовые строки Микроконтроллер nios Команды управления выполнением программы Перехода от ahdl к vhdl Холодный спай Усилители hi-fi Электронные часы Сердечники из распылённого железа Анализ алгоритмов 8-разрядные КМОП Классификация МПК История Устройства автоматики Системы и сети Частотность Справочник микросхем Вторичного электропитания Типы видеомониторов Радиобиблиотека Электронные системы Бесконтекстный язык Управление техническими системами Монтаж печатных плат Работа с коммуникациями Создание библиотечного компонента Нейрокомпьютерная техника Parser Пи-регулятор ч.1 ПИ-регулятор ч.2 Обработка списков Интегральные схемы Шина ISAВ Шина PCI Прикладная криптография Нетематическое: Взрывной автогидролиз Нечеткая логика Бытовые установки (укр) Автоматизация проектирования Сбор и защита Дискретная математика Kb радиостанция Энергетика Ретро: Прием в автомобиле Управление шаговым двигателем Магнитная запись Ремонт микроволновки Дискретные системы часть 2