Ремонт принтеров, сканнеров, факсов и остальной офисной техники


назад Оглавление вперед




[5]

£ сс

6. СОГЛАСОВАНИЕ СКОБОК

Используя комбинаторы синтаксического анализа и преобразователи, создаваемые до сих пор, мы можем сконструировать парсер, распознающий согласующиеся пары скобок. Первой попыткой, не представляющей однако корректный тип, является следующее:

parens :: Parser Char ??? parens = (symbol ( <*>

parens <*>

symbol ) <*>

parens) <> epsilon

На это определение оказала сильное влияние хорошо известная грамматика для вложенных скобок. Тем не менее вызывает затруднения тип дерева разбора. Если этим типом будет а, то типом соединения четырех поддеревьев в первой альтернативе будет (Char, (a, (Char, a))), что не является тем же самым или унифицирующимся с а. Также вторая альтернатива (epsilon) должна возвращать дерево разбора того же типа. Поэтому для построения дерева нужного типа необходимо сначала определить тип дерева разбора, и использовать оператор <@ в обоих альтернативах. Например, тип дерева разбора может быть следующим:

data Tree= Nil Bin (Tree, Tree)

Теперь мы можем добавить «семантические функции» к парсеру:

parens :: Parser Char Tree parens = (symbol ( <*>

parens <*>

symbol ) <*>

parens) <@ (\( , (x, ( , y))) -> Bin (x, y)) <>

epsilon <@ const Nil

Довольно непонятный текст \( , (x, ( , y))) является лямбда образцом, описывающим функцию с первым параметром, являющимся кортежём, содержащим четыре части первой альтернативы, из которых лишь вторая и четвертая имеют значение.

Упражнение 4. Почему в лямбда образце вместо кортежа, у которого второй элемент является кортежём, у которого второй элемент является кортежём, мы не используем кортеж, состоящий из четырех элементов?

Упражнение 5. Почему нужна функция const., которая определена в стандартном модуле Prelude как const x y = x? Вы можете написать вторую альтернативу более лаконично без использования const и <@?

В лямбда образце символы подчеркивания используются в качестве «заполнителя»

для деревьев разбора, возвращаемых symbol ( и symbol ), которые не нужны в

ФП 02005-06 01


результате. Для того, чтобы не пришлось использовать эти сложные кортежи, возможно было бы легче отсеять деревья разбора для символов на более раннем этапе. Для этого мы вводим два вспомогательных комбинатора синтаксического разбора, которые пригодятся во многих ситуациях. Эти операторы ведут себя также как и <*>, за исключением того, что они отсеивают результат одного из двух парсеров, являющихся их аргументами:

(<*) p <* q

(*>) p *> q

Parser s a -> Parser s b -> Parser s a

p <*> q <@ fst

Parser s a -> Parser s b -> Parser s b

p <*> q <@ snd

Мы можем использовать эти новые комбинаторы синтаксического анализа для улучшения удобочитаемости парсера parens:

open close

parens parens

symbol ( symbol )

Parser Char Tree

(open *> parens <* close) <*> parens <@ Bin <> succeed Nil

Путём благоразумного выбора приоритетов используемых операторов:

infixr 6 <*>, <*, *> infixl 5 <@ infixr 4 <>

мы сводим к минимуму число необходимых скобок.

Упражнение 6. Скобки вокруг open >parens <* close в первой альтернативе необходимы несмотря на наши продуманные приоритеты. Что случится если мы опустим их?

Изменяя функцию, используемую после <@ («семантическую функцию»), мы можем получить нечто отличающееся от деревьев разбора. В качестве примера мы напишем парсер, подсчитывающий глубину вложенности скобок:

nesting :: Parser Char Int

nesting = (open *> nesting <* close) <*> nesting <@ f <> succeed 0 where f (x, y) = (1 + x) "max" y

Если интерес представляют дополнительные варианты, то, возможно, стоит превратить семантическую функцию и величину, возвращаемую в «пустом» случае в два дополнительных параметра. Функция высшего порядка foldparens производит разбор вложенных скобок, используя данную семантическую функцию и константу соответственно, после разбора одной из двух альтернатив:

foldparens foldparens f e

((a, a) -> a) -> a -> Parser Char a

p = (open *> p <* close) <*> p <@ f <>

ФП 02005-06 01

Лист 17

№ йокум.

Копиоова Фоомат


succeed e

Упражнение 7. Функция foldparens является обобщением функций parens и nesting. Напишите последние две как частный случай первой.

Пример использования nesting может выглядеть следующим образом:

? just nesting "()(())()" [(2, [])]

? just nesting "())"

В самом деле nesting лишь распознает корректно построенные вложенные скобки и вычисляет глубину вложенности в процессе разбора.

Упражнение 8. Что случится, если мы опустим преобразователь just в этих примерах?

ФП 02005-06 01

Лист 18

№ докум.

Копиоова Формат



[стр.Начало] [стр.1] [стр.2] [стр.3] [стр.4] [стр.5] [стр.6] [стр.7] [стр.8] [стр.9] [стр.10] [стр.11] [стр.12] [стр.13]