Ремонт принтеров, сканнеров, факсов и остальной офисной техники


назад Оглавление вперед




[103]

ство умножении для каждой из них, или же с помощью алгоритма Recursive-Matrix-Chain?

16.2-3 Нарисуйте дерево рекурсии для алгоритма Merge-Sort (сортировка слиянием) из раздела 1.3.1, применённого к массиву из 16 элементов. Почему здесь нет смысла запоминать ответы к уже решённым подзадачам?

16.3. Наибольшая общая подпоследовательность

Подпоследовательность получается из данной последовательности, если удалить некоторые её элементы (сама последовательность также считается своей подпоследовательностью). Формально: последовательность Z = (z\, z2,..., Zk) называется подпоследовательностью (subsequence) последовательности X = (х\, ж2,..., хп), если существует строго возрастающая последовательность индексов (ii, г2,..., ik), Для которой Zj = жг-. при всех j = 1, 2,..., к. Например, Z = (B,C,D,B) является подпоследовательностью последовательности X = (А, В, С, В, D, А, В); соответствующая последовательность индексов есть (2,3,5,7). (Отметим, что говоря о последовательностях, мы - в отличие от курсов математического анализа - имеем в виду конечные последовательности.)

Будем говорить, что последовательность Z является общей подпоследовательностью (common subsequence) последовательностей X и У, если Z является подпоследовательностью как X, так и У. Пример: X = (А, В, С, В, D, А, В), У = (В, D, С, А, В, А), Z = (В, С, А). Последовательность Z в этом примере - не самая длинная из общих подпоследовательностей X и У (последовательность (В, С, В, А) длиннее). Последовательность (В, С, В, А) будет наибольшей общей подпоследовательностью для X и У, поскольку общих подпоследовательностей длины 5 у них нет. Наибольших общих подпоследовательностей может быть несколько. Например, (В, D, А, В) - другая наибольшая общая подпоследовательность X и У.

Задача о наибольшей общей подпоследовательности (сокращенно НОП; по-английски LCS = longest-common-subsequence) состоит в том, чтобы найти общую подпоследовательность наибольшей длины для двух данных последовательностей X и У. В этом разделе мы покажем, как решить эту задачу с помощью динамического программирования.


Строение наибольшей общей подпоследовательности

Если решать задачу о НОП «в лоб», перебирая все подпоследовательности последовательности X и проверяя для каждой из них, не будет ли она подпоследовательностью последовательности У, то алгоритм будет работать экспоненциальное время, поскольку последовательность длины то имеет 2т подпоследовательностей (столько же, сколько подмножеств у множества {1, 2,..., то}).

Однако задача о НОП обладает свойством оптимальности для подзадач, как показывает теорема 16.1 (см. ниже). Подходящее множество подзадач - множество пар префиксов двух данных последовательностей. Пусть X = (х\, х2, , хт) - некоторая последовательность. Её префикс (prefix) длины г - это последовательность Х{ = (х\, х2, , х{) (при г от 0 до то). Например, если X = (А, В, С, В, D, А, В), то Х4 = (А, В, С, В), а Х0 - пустая последовательность.

Теорема 16.1 (о строении НОП). Пусть Z = (z\, z2,..., Zk) -

одна из наибольших общих подпоследовательностей для X = (xt,x2,. ..,хт) uY = (yi,y2,. ..,уп)- Тогда:

1.если хт = уп, то Zj~ = хт = уп и Zk-\ является НОП для Хт \ и Уп-Ъ

2.если хт ф уп и Zk ф хт, то Z является НОП для Хт \ и Y;

3.если хт ф уп и Zk ф Уп, то Z является НОП для Хт и Yn-\-

Доказательство. (1) Если Zk ф хт, то мы можем дописать хт = уп в конец последовательности Z и получить общую подпоследовательность длины к + 1, что противоречит условию. Стало быть, Zk = хт = уп. Если у последовательностей Xm-i и Yn-\ есть более длинная (чем Zk-\) общая подпоследовательность, то мы можем дописать к ней хт = уп и получить общую подпоследовательность для X и У, более длинную, чем Z - противоречие.

(2)Коль скоро Zk ф хт, последовательность Z является общей подпоследовательностью для Xm-i и У. Так как Z - НОП для X и У, то она тем более является НОП для Xm-i и У.

(3)Аналогично (2).□

Мы видим, что НОП двух последовательностей содержит в себе наибольшую общую подпоследовательность их префиксов. Стало быть, задача о НОП обладает свойством оптимальности для подзадач. Сейчас мы убедимся, что перекрытие подзадач также имеет место.

Рекуррентная формула

Теорема 16.1 показывает, что нахождение НОП последовательностей X = (х\, х2,..., хт) и У = (yi, у2,..., уп) сводится к реше-


нию либо одной, либо двух подзадач. Если хт = уп, то достаточно найти НОП последовательностей Xm i ии дописать к ней в

конце хт = уп. Если же хт ф уп, то надо решить две подзадачи: найти НОП для Xm i и У, а затем найти НОП для X и Yn-\. Более длинная из них и будет служить НОП для X и У.

Теперь сразу видно, что возникает перекрытие подзадач. Действительно, чтобы найти НОП X и У, нам может понадобиться найти НОП Хт \ и У, а также НОП X и Уга-1; каждая из этих задач содержит подзадачу нахождения НОП для Xm i и Yn-\. Аналогичные перекрытия будут встречаться и далее.

Как и в задаче перемножения последовательности матриц, мы начнём с рекуррентного соотношения для стоимости оптимального решения. Пусть c[i,j] обозначает длину НОП для последовательностей Х{ и Yv Если г или j равно нулю, то одна из двух последовательностей пуста, так что c[i,j] = 0. Сказанное выше можно записать так:

Вычисление длины НОП

Исходя из соотношения (16.5), легко написать рекурсивный алгоритм, работающий экспоненциальное время и вычисляющий длину НОП двух данных последовательностей. Но поскольку различных подзадач всего О (тога), лучше воспользоваться динамическим программированием.

Исходными данными для алгоритма LCS-Length служат последовательности X = (х\, Х2, , хт) и У = (у\, у2, , Уп) Числа c[i,j] записываются в таблицу с[0 . .то, 0 . .га] в таком порядке: сначала заполняется слева направо первая строка, затем вторая, и т. д. Кроме того, алгоритм запоминает в таблице Ь[1.. то, 1.. га] «происхождение» c[i, j]: в клетку b[i,j] заносится стрелка, указывающая на клетку с координатами [г - 1, j - 1), [г - l,j) или (г, j - 1), в зависимости от того, равно ли c[i,j] числу с[г - 1, j - 1] + 1, c[i - или c[i,j - 1] (см. (16.5)). Результатами работы алгоритма являются таблицы cub.

0

Ф, j] = < c[i - 1, j - 1] + 1

max(c[i,j - l],c[i- l,j])

если г = 0 или j = 0, если i,j > 0 и Xi = yj, если i,j > 0 и Xi ф yj.

(16.5)



[стр.Начало] [стр.1] [стр.2] [стр.3] [стр.4] [стр.5] [стр.6] [стр.7] [стр.8] [стр.9] [стр.10] [стр.11] [стр.12] [стр.13] [стр.14] [стр.15] [стр.16] [стр.17] [стр.18] [стр.19] [стр.20] [стр.21] [стр.22] [стр.23] [стр.24] [стр.25] [стр.26] [стр.27] [стр.28] [стр.29] [стр.30] [стр.31] [стр.32] [стр.33] [стр.34] [стр.35] [стр.36] [стр.37] [стр.38] [стр.39] [стр.40] [стр.41] [стр.42] [стр.43] [стр.44] [стр.45] [стр.46] [стр.47] [стр.48] [стр.49] [стр.50] [стр.51] [стр.52] [стр.53] [стр.54] [стр.55] [стр.56] [стр.57] [стр.58] [стр.59] [стр.60] [стр.61] [стр.62] [стр.63] [стр.64] [стр.65] [стр.66] [стр.67] [стр.68] [стр.69] [стр.70] [стр.71] [стр.72] [стр.73] [стр.74] [стр.75] [стр.76] [стр.77] [стр.78] [стр.79] [стр.80] [стр.81] [стр.82] [стр.83] [стр.84] [стр.85] [стр.86] [стр.87] [стр.88] [стр.89] [стр.90] [стр.91] [стр.92] [стр.93] [стр.94] [стр.95] [стр.96] [стр.97] [стр.98] [стр.99] [стр.100] [стр.101] [стр.102] [стр.103] [стр.104] [стр.105] [стр.106] [стр.107] [стр.108] [стр.109] [стр.110] [стр.111] [стр.112] [стр.113] [стр.114] [стр.115] [стр.116] [стр.117] [стр.118] [стр.119] [стр.120] [стр.121] [стр.122] [стр.123] [стр.124] [стр.125] [стр.126] [стр.127] [стр.128] [стр.129] [стр.130] [стр.131] [стр.132] [стр.133] [стр.134] [стр.135] [стр.136] [стр.137] [стр.138] [стр.139] [стр.140] [стр.141] [стр.142] [стр.143] [стр.144] [стр.145] [стр.146] [стр.147] [стр.148] [стр.149] [стр.150] [стр.151] [стр.152] [стр.153] [стр.154] [стр.155] [стр.156] [стр.157] [стр.158] [стр.159] [стр.160] [стр.161] [стр.162] [стр.163] [стр.164] [стр.165] [стр.166] [стр.167] [стр.168] [стр.169] [стр.170] [стр.171] [стр.172] [стр.173] [стр.174] [стр.175] [стр.176] [стр.177] [стр.178] [стр.179] [стр.180] [стр.181] [стр.182] [стр.183] [стр.184] [стр.185] [стр.186] [стр.187] [стр.188] [стр.189] [стр.190] [стр.191] [стр.192] [стр.193] [стр.194] [стр.195] [стр.196] [стр.197] [стр.198] [стр.199] [стр.200] [стр.201] [стр.202] [стр.203] [стр.204] [стр.205] [стр.206] [стр.207] [стр.208] [стр.209] [стр.210] [стр.211] [стр.212] [стр.213] [стр.214] [стр.215] [стр.216] [стр.217] [стр.218] [стр.219] [стр.220] [стр.221] [стр.222] [стр.223] [стр.224] [стр.225] [стр.226] [стр.227] [стр.228] [стр.229] [стр.230] [стр.231] [стр.232] [стр.233] [стр.234] [стр.235] [стр.236] [стр.237] [стр.238] [стр.239] [стр.240] [стр.241] [стр.242] [стр.243] [стр.244] [стр.245] [стр.246] [стр.247] [стр.248] [стр.249] [стр.250] [стр.251] [стр.252] [стр.253] [стр.254] [стр.255] [стр.256] [стр.257] [стр.258] [стр.259] [стр.260] [стр.261] [стр.262] [стр.263] [стр.264] [стр.265] [стр.266] [стр.267] [стр.268] [стр.269] [стр.270] [стр.271] [стр.272] [стр.273] [стр.274] [стр.275] [стр.276] [стр.277] [стр.278] [стр.279] [стр.280] [стр.281] [стр.282] [стр.283] [стр.284] [стр.285] [стр.286] [стр.287] [стр.288] [стр.289] [стр.290] [стр.291] [стр.292] [стр.293] [стр.294]