Ремонт принтеров, сканнеров, факсов и остальной офисной техники


назад Оглавление вперед




[78]

Теорема 12.7. Рассмотрим таблицу с открытой адресацией, коэффициент заполнения которой равен а < 1. Пусть хеширование равномерно. Тогда математическое ожидание числа проб при успешном поиске элемента в таблице не превосходит

Ч, 1

а 1 - а

если считать, что ключ для успешного поиска в таблице выбирается случайным образом и все такие выборы равновероятны.

Доказательство. Уточним, как производится усреднение: сначала мы заполняем таблицу независимо выбираемыми ключами, причём для каждого из них выполняется предположение равномерного хеширования. Затем мы усредняем по всем элементам таблицы время их поиска.

Заметим, что при успешном поиске ключа к мы делаем те же самые пробы, которые производились при помещении ключа к в таблицу. Тем самым среднее число проб при поиске (усреднение по элементам) равно общему числу проб при добавлении, делённому на число элементов в таблице, которое мы обозначаем п. Математическое ожидание общего числа проб при добавлении равно сумме математических ожиданий для каждого отдельного шага. К моменту добавления (г+1)-го элемента в таблице заполнено г позиций, коэффициент заполнения равен г/т (га - число мест в таблице), и математическое ожидание не больше 1/(1 - г/га) = га/(га - г). Поэтому сумма математических ожиданий не превосходит

га гагага

+-7 + - + --.+

га га-1 га - 2га - п+1

Эта сумма равна га • (1/(га - п + 1) + ... + 1/(га - 1) + 1/га) и оценивается сверху с помощью интеграла (3.10):

m

Г 1

ra- I - dt = га In (га /(га - п)).

Вспоминая, что общее число операций надо поделить на п, получаем оценку (га/га) 1п(га/(га - п)) = (1/ск) 1п(1/(1 - а)).□

Если, например, таблица заполнена наполовину, то среднее число проб для успешного поиска не превосходит 1,387, а если на 90%, то 2,559.

Упражнения

12.4-1 Выполните добавление ключей 10, 22, 31,4,15, 28,17, 88, 59 (в указанном порядке) в хеш-таблицу с открытой адресацией раз-


мера то = 11. Для вычисления последовательности проб используется линейный метод с h(k) = к mod то. Выполните то же задание, если используется квадратичный метод с той же h, с\ = 1, с2 = 3, а также для двойного хеширования с h\ = N и /г2(&) = 1 + (к mod (то - 1)).

12.4-2 Напишите процедуру Hash-Delete для удаления элемента из таблицы с открытой адресацией, реализующую описанную схему (со значением deleted), и перепишите соответствующим образом процедуры Hash-Insert и Hash-Search.

12.4-3* Покажите, что при двойном хешировании (h(k, г) = (hi(k) + ih,2(k)) mod то) последовательность проб, соответствующая ключу к, является перестановкой множества {0,1,..., то - 1} тогда и только тогда, когда /г2(&) взаимно просто с то. (Указание: см. главу 33.)

12.4-4 Найдите численные значения верхних оценок теорем 12.5 и 12.7 для поиске присутствующего и отсутствующего элементов для коэффициентов заполнения 1/2, 3/4 и 7/8.

12.4-5* Предположим, что мы помещаем п записей в таблицу с открытой адресацией; размер таблицы равен то, хеширование равномерно, ключи записей выбираются случайным образом. Обозначим через р(п, то) вероятность того, что при этом не произойдет коллизий. Покажите, что р(п, то) e-n(n-i)/2m (указанИе: см. неравенство (2.7).) Эта величина очень мала, когда п заметно больше у/п.

12.4-6* Частичные суммы гармонического ряда можно оценить так:

tfn = lnn + 7+,(12.8)

In

где 7 = 0,5772156649 ... - так называемая постоянная Эйлера (Еи-lers constant) и 0 < е < 1 (доказательство см. в книге Кнута [121]). Как использовать это для оценки куска гармонического ряда в доказательстве теоремы 12.7?

12.4-7* Найдите ненулевое значение коэффициента заполнения а, при котором оценка среднего числа проб при поиске отсутствующего элемента (теорема 12.5) вдвое превосходит оценку среднего числа проб при успешном поиске (теорема 12.7).


Задачи к главе 12

245

Задачи

12-1 Наибольшее число проб при добавлении элемента

Рассмотрим хеш-таблицу с открытой адресацией размера то, в которую один за другим помещаются га ключей, причём га то/2. Предположим, что хеширование равномерно.

а.Покажите, что для любого г = 1, 2,..., га вероятность того, что при добавлении г-го ключа в таблицу произошло более к проб, не превосходит 2~к.

б.Покажите, что для любого г = 1, 2,..., га вероятность того, что при добавлении г-го ключа в таблицу произошло более 2lgra проб, не превосходит 1/га2.

Пусть X - случайная величина, равная максимальному числу проб при добавлении элементов с номерами 1, 2,..., га.

в.Покажите, что Р{Х > 2lgra} 1/га.

г.Покажите, что математическое ожидание величины X (наибольшего числа проб) есть О (lgra).

12-2 Поиск в неизменяющемся множестве

Пусть мы работаем с множеством из га элементов, в котором ключи являются числами, а единственная операция, которую надо поддерживать, - это поиск (элементы не добавляются и не удаляются). Требуется реализовать поиск максимально эффективно (до того, как начнут поступать запросы на поиск, множество можно предварительно обработать, и время на такую обработку не ограничено).

а.Покажите, что поиск можно реализовать таким образом, чтобы в худшем случае он занимал время О (lgra), а дополнительная память (сверх той, в которой хранится само множество) не использовалась.

б.Пусть мы решили записать элементы нашего множества в хеш-таблицу с открытой адресацией, состоящую из то ячеек. Предположим, что хеширование равномерно. При каком минимальном объёме то - га дополнительной памяти средняя стоимость операции поиска элемента, отсутствующего в множестве, будет не хуже, чем в пункте (а)? В качестве ответа приведите асимптотическую оценку то - га через га.

12-3 Длины цепочек при хешировании

Рассмотрим хеш-таблицу с га ячейками, в которой коллизии разрешаются с помощью цепочек. Хеширование равномерно: каждый новый ключ имеет равные шансы попасть во все ячейки независимо



[стр.Начало] [стр.1] [стр.2] [стр.3] [стр.4] [стр.5] [стр.6] [стр.7] [стр.8] [стр.9] [стр.10] [стр.11] [стр.12] [стр.13] [стр.14] [стр.15] [стр.16] [стр.17] [стр.18] [стр.19] [стр.20] [стр.21] [стр.22] [стр.23] [стр.24] [стр.25] [стр.26] [стр.27] [стр.28] [стр.29] [стр.30] [стр.31] [стр.32] [стр.33] [стр.34] [стр.35] [стр.36] [стр.37] [стр.38] [стр.39] [стр.40] [стр.41] [стр.42] [стр.43] [стр.44] [стр.45] [стр.46] [стр.47] [стр.48] [стр.49] [стр.50] [стр.51] [стр.52] [стр.53] [стр.54] [стр.55] [стр.56] [стр.57] [стр.58] [стр.59] [стр.60] [стр.61] [стр.62] [стр.63] [стр.64] [стр.65] [стр.66] [стр.67] [стр.68] [стр.69] [стр.70] [стр.71] [стр.72] [стр.73] [стр.74] [стр.75] [стр.76] [стр.77] [стр.78] [стр.79] [стр.80] [стр.81] [стр.82] [стр.83] [стр.84] [стр.85] [стр.86] [стр.87] [стр.88] [стр.89] [стр.90] [стр.91] [стр.92] [стр.93] [стр.94] [стр.95] [стр.96] [стр.97] [стр.98] [стр.99] [стр.100] [стр.101] [стр.102] [стр.103] [стр.104] [стр.105] [стр.106] [стр.107] [стр.108] [стр.109] [стр.110] [стр.111] [стр.112] [стр.113] [стр.114] [стр.115] [стр.116] [стр.117] [стр.118] [стр.119] [стр.120] [стр.121] [стр.122] [стр.123] [стр.124] [стр.125] [стр.126] [стр.127] [стр.128] [стр.129] [стр.130] [стр.131] [стр.132] [стр.133] [стр.134] [стр.135] [стр.136] [стр.137] [стр.138] [стр.139] [стр.140] [стр.141] [стр.142] [стр.143] [стр.144] [стр.145] [стр.146] [стр.147] [стр.148] [стр.149] [стр.150] [стр.151] [стр.152] [стр.153] [стр.154] [стр.155] [стр.156] [стр.157] [стр.158] [стр.159] [стр.160] [стр.161] [стр.162] [стр.163] [стр.164] [стр.165] [стр.166] [стр.167] [стр.168] [стр.169] [стр.170] [стр.171] [стр.172] [стр.173] [стр.174] [стр.175] [стр.176] [стр.177] [стр.178] [стр.179] [стр.180] [стр.181] [стр.182] [стр.183] [стр.184] [стр.185] [стр.186] [стр.187] [стр.188] [стр.189] [стр.190] [стр.191] [стр.192] [стр.193] [стр.194] [стр.195] [стр.196] [стр.197] [стр.198] [стр.199] [стр.200] [стр.201] [стр.202] [стр.203] [стр.204] [стр.205] [стр.206] [стр.207] [стр.208] [стр.209] [стр.210] [стр.211] [стр.212] [стр.213] [стр.214] [стр.215] [стр.216] [стр.217] [стр.218] [стр.219] [стр.220] [стр.221] [стр.222] [стр.223] [стр.224] [стр.225] [стр.226] [стр.227] [стр.228] [стр.229] [стр.230] [стр.231] [стр.232] [стр.233] [стр.234] [стр.235] [стр.236] [стр.237] [стр.238] [стр.239] [стр.240] [стр.241] [стр.242] [стр.243] [стр.244] [стр.245] [стр.246] [стр.247] [стр.248] [стр.249] [стр.250] [стр.251] [стр.252] [стр.253] [стр.254] [стр.255] [стр.256] [стр.257] [стр.258] [стр.259] [стр.260] [стр.261] [стр.262] [стр.263] [стр.264] [стр.265] [стр.266] [стр.267] [стр.268] [стр.269] [стр.270] [стр.271] [стр.272] [стр.273] [стр.274] [стр.275] [стр.276] [стр.277] [стр.278] [стр.279] [стр.280] [стр.281] [стр.282] [стр.283] [стр.284] [стр.285] [стр.286] [стр.287] [стр.288] [стр.289] [стр.290] [стр.291] [стр.292] [стр.293] [стр.294]