Ремонт принтеров, сканнеров, факсов и остальной офисной техники


назад Оглавление вперед




[59]

Медианы и порядковые статистики

В этой главе мы рассматриваем такую задачу: дано множество из га чисел; найти тот его элемент, который будет г-м по счёту, если расположить элементы множества в порядке возрастания. В англоязычной литературе такой элемент называется г-ж порядковой статистикой (order statistic). Например, минимум (minimum) -это порядковая статистика номер 1, а максимум (maximum) - порядковая статистика номер га. Медианой (median) называется элемент множества, находящийся (по счёту) посередине между минимумом и максимумом. Точнее говоря, если га нечётно, то медиана - это порядковая статистика номер г = (га + 1)/2, а если га четно, то медиан даже две: с номерами г = га/2 и г = га/2 + 1. Можно ещё сказать, что, независимо от чётности га, медианы имеют номер г = [(га + l)/2j и г = [(га + 1)/2]. В дальнейшем мы будем называть медианой меньшую из двух (если их две).

Для удобства мы будем считать, что множество, в котором мы ищем порядковые статистики, состоит из различных элементов, хотя практически всё, что мы делаем, переносится на ситуацию, когда во множестве есть повторяющиеся элементы. Задача выбора элемента с данным номером (selection problem) состоит в следующем:

Дано: Множество А из га различных элементов и целое число г, 1 г га.

Найти: Элемент х £ А, для которого ровно г - 1 элементов множества А меньше х.

Эту задачу можно решить за время О (nig га): отсортировать числа, после чего взять г-ж элемент в полученном массиве. Есть, однако, и более быстрые алгоритмы.

В разделе 10.1 мы рассмотрим простейший случай: нахождение максимального и минимального элементов. Общая задача более интересна; ей посвящены два следующих раздела. В разделе 10.2 мы рассматриваем удобный на практике вероятностный алгоритм, который ищет порядковую статистику за время О (га) в среднем (имеется в виду математическое ожидание времени его работы на любом входе). В разделе 10.3 мы рассматриваем (представля-


ющий скорее теоретический интерес) детерминированный алгоритм, требующий времени О (га) в худшем случае.

10.1. Минимум и максимум

Сколько сравнений необходимо, чтобы во множестве из га чисел найти наименьшее? За га - 1 сравнений это сделать легко: надо последовательно перебирать все числа, храня значение наименьшего числа из уже просмотренных. Запишем этот алгоритм, считая, что числа заданы в виде массива А длины га.

Мшшим(А)

1min <- А[1]

2for г <т- 2 to length[A]

3do if min > A[i]

4then min <- A[i]

5return min

Разумеется, аналогичным образом можно найти и максимум.

Можно ли найти минимум еще быстрее? Нет, и вот почему. Рассмотрим алгоритм нахождения наименьшего числа как турнир среди га чисел, а каждое сравнение - как матч, в котором меньшее число побеждает. Чтобы победитель был найден, каждое из остальных чисел должно проиграть по крайней мере один матч, так что меньше га - 1 сравнений быть не может, и алгоритм Minimum оптимален по числу сравнений.

Интересный вопрос, связанный с этим алгоритмом - нахождение математического ожидания числа исполнений строки 4. В задаче 6-2 требуется показать, что эта величина есть O(lgra).

Одновременный поиск минимума и максимума

Иногда бывает нужно найти одновременно минимальный и максимальный элементы множества. Представим себе программу, которая должна уменьшить рисунок (набор точек, заданных своими координатами) так, чтобы он уместился на экране. Для этого нужно найти максимум и минимум по каждой координате.

Если мы попросту найдем сначала минимум, а потом максимум, затратив на каждый из них по га - 1 сравнений, то всего будет 2га - 2 сравнения, что асимптотически оптимально. Можно, однако, решить эту задачу всего за 3[~га/2] - 2 сравнений. Именно, будем хранить значения максимума и минимума уже просмотренных чисел, а очередные числа будем обрабатывать по два таким образом: сначала сравним два очередных числа друг с другом, а затем


большее из них сравним с максимумом, а меньшее - с минимумом. При этом на обработку двух элементов мы затратим три сравнения вместо четырёх (кроме первой пары, где понадобится всего одно сравнение).

Упражнения

10.1-1 Покажите, что второе по величине число из га данных можно найти в худшем случае за га + [lgra] - 2 сравнения. (Указание. Ищите это число вместе с наименьшим.)

10.1-2* Покажите, что для одновременного нахождения наибольшего и наименьшего из га чисел в худшем случае необходимо не менее [Зга/2] - 2 сравнений. (Указание. В каждый момент элементы делятся на четыре группы: (1) непросмотренные (которые могут оказаться и минимальными, и максимальными); (2) те, что ещё могут оказаться минимальными, но заведомо не максимальны; (3) те, что ещё могут оказаться максимальными, но не минимальными; (4) отброшенные (которые заведомо не минимальны и не максимальны). Пусть а\, а2, а3, а± - количество элементов каждой группы. Как меняются эти числа при сравнениях?)

10.2. Выбор за линейное в среднем время

Хотя общая задача выбора выглядит более сложной, чем задача о минимуме или максимуме, её, как ни странно, тоже можно решить за время в (га). В этом разделе мы рассмотрим вероятностный алгоритм Randomized-Select для решения этой задачи, действующий по схеме «разделяй и властвуй». Он аналогичен алгоритму быстрой сортировки из главы 8: массив разбивается на меньшие части. Однако алгоритм быстрой сортировки, разбив массив на два куска, обрабатывает оба, а алгоритм Randomized-Select - только один из этих кусков. Поэтому он быстрее: среднее время быстрой сортировки есть О (га lgra), в то время как алгоритм Randomized-Select работает в среднем за время ©(га).

Алгоритм Randomized-Select использует процедуру Randomized-Partition, описанную в разделе 8.3, поведение которой (и, стало быть, всего алгоритма) зависит от датчика случайных чисел. Вызов Randomized-Select(A, р, г, г) возвращает г-ж по счёту в порядке возрастания элемент массива А\р. .г].



[стр.Начало] [стр.1] [стр.2] [стр.3] [стр.4] [стр.5] [стр.6] [стр.7] [стр.8] [стр.9] [стр.10] [стр.11] [стр.12] [стр.13] [стр.14] [стр.15] [стр.16] [стр.17] [стр.18] [стр.19] [стр.20] [стр.21] [стр.22] [стр.23] [стр.24] [стр.25] [стр.26] [стр.27] [стр.28] [стр.29] [стр.30] [стр.31] [стр.32] [стр.33] [стр.34] [стр.35] [стр.36] [стр.37] [стр.38] [стр.39] [стр.40] [стр.41] [стр.42] [стр.43] [стр.44] [стр.45] [стр.46] [стр.47] [стр.48] [стр.49] [стр.50] [стр.51] [стр.52] [стр.53] [стр.54] [стр.55] [стр.56] [стр.57] [стр.58] [стр.59] [стр.60] [стр.61] [стр.62] [стр.63] [стр.64] [стр.65] [стр.66] [стр.67] [стр.68] [стр.69] [стр.70] [стр.71] [стр.72] [стр.73] [стр.74] [стр.75] [стр.76] [стр.77] [стр.78] [стр.79] [стр.80] [стр.81] [стр.82] [стр.83] [стр.84] [стр.85] [стр.86] [стр.87] [стр.88] [стр.89] [стр.90] [стр.91] [стр.92] [стр.93] [стр.94] [стр.95] [стр.96] [стр.97] [стр.98] [стр.99] [стр.100] [стр.101] [стр.102] [стр.103] [стр.104] [стр.105] [стр.106] [стр.107] [стр.108] [стр.109] [стр.110] [стр.111] [стр.112] [стр.113] [стр.114] [стр.115] [стр.116] [стр.117] [стр.118] [стр.119] [стр.120] [стр.121] [стр.122] [стр.123] [стр.124] [стр.125] [стр.126] [стр.127] [стр.128] [стр.129] [стр.130] [стр.131] [стр.132] [стр.133] [стр.134] [стр.135] [стр.136] [стр.137] [стр.138] [стр.139] [стр.140] [стр.141] [стр.142] [стр.143] [стр.144] [стр.145] [стр.146] [стр.147] [стр.148] [стр.149] [стр.150] [стр.151] [стр.152] [стр.153] [стр.154] [стр.155] [стр.156] [стр.157] [стр.158] [стр.159] [стр.160] [стр.161] [стр.162] [стр.163] [стр.164] [стр.165] [стр.166] [стр.167] [стр.168] [стр.169] [стр.170] [стр.171] [стр.172] [стр.173] [стр.174] [стр.175] [стр.176] [стр.177] [стр.178] [стр.179] [стр.180] [стр.181] [стр.182] [стр.183] [стр.184] [стр.185] [стр.186] [стр.187] [стр.188] [стр.189] [стр.190] [стр.191] [стр.192] [стр.193] [стр.194] [стр.195] [стр.196] [стр.197] [стр.198] [стр.199] [стр.200] [стр.201] [стр.202] [стр.203] [стр.204] [стр.205] [стр.206] [стр.207] [стр.208] [стр.209] [стр.210] [стр.211] [стр.212] [стр.213] [стр.214] [стр.215] [стр.216] [стр.217] [стр.218] [стр.219] [стр.220] [стр.221] [стр.222] [стр.223] [стр.224] [стр.225] [стр.226] [стр.227] [стр.228] [стр.229] [стр.230] [стр.231] [стр.232] [стр.233] [стр.234] [стр.235] [стр.236] [стр.237] [стр.238] [стр.239] [стр.240] [стр.241] [стр.242] [стр.243] [стр.244] [стр.245] [стр.246] [стр.247] [стр.248] [стр.249] [стр.250] [стр.251] [стр.252] [стр.253] [стр.254] [стр.255] [стр.256] [стр.257] [стр.258] [стр.259] [стр.260] [стр.261] [стр.262] [стр.263] [стр.264] [стр.265] [стр.266] [стр.267] [стр.268] [стр.269] [стр.270] [стр.271] [стр.272] [стр.273] [стр.274] [стр.275] [стр.276] [стр.277] [стр.278] [стр.279] [стр.280] [стр.281] [стр.282] [стр.283] [стр.284] [стр.285] [стр.286] [стр.287] [стр.288] [стр.289] [стр.290] [стр.291] [стр.292] [стр.293] [стр.294]