Читаем Введение в Perl полностью

Значение флага '-w'. true -если включено и false – выключено.

$^X

$EXECUTABLE_NAME

Команда запуска Перл. Аналогично argv[0] в С.

$ARGV

Имя текущего файла читаемого оператором '<>'.

@ARGV

Массив параметров строки запуска программы. Внимание! @#ARGV – меньше количества параметров на 1 т.к. $ARGV[0] это первый параметр (не имя программы).

@INC

Список директорий диска которые просматривает Перл для выполнения команд do, require или use.

%INC

Этот хеш содержит имена директорий для имен использованных файлов командами do или require. Ключ – имя файла, а значение – директория.

$ENV{выражение}

Хеш %ENV содержит значения переменных окружения. Изменение этих значений вызывает изменение окружения для процессов потомков.

$SIG{выражение}

Хеш %SIG содержит имена подпрограмм для системных сигналов таких как INT, QUIT, PIPE, ... Значение 'DEFAULT' – для системной обработки. 'IGNORE' – игнорировать данный сигнал.

Регулярные выражения (шаблоны)

В данной главе описывается синтаксис регулярных выражений. Чаще всего в Перл они используюстя в операторах поиска и замены таких как s// m/ операторах связки =~ или != и т.д.

Как правило все эти операторы имеют схожие опции такие как:

i – не различать строчные и заглавные буквы.

m – считать строку многострочной.

s – однострочная строка.

x – расширенный синтаксис ( использование пробелов и комментариев)

Обычно все эти опции обозначают как '/x'. Их можно использовать даже внутри шаблонов, используя новую конструкцию (?...)

Регулярные выражения или шаблоны (pattern) то же самое что и regexp процедуры в Юниксе. Выражения и синтаксис заимствован из свободно распространяемых процедур V8 Генри Спенсера (Henry Spencer) там же они подробно и описаны.

В шаблонах используются следующие метасимволы (символы обозначающие группы других символов) часто называемых egrep – стандартом:

\ – считать следующий метасимвол как обычный символ.

^ – начало строки

 – один произвольный символ. Кроме '\n' – конец строки.

$ – конец строки

| – альтернатива (или)

()  – группировка

[]  – класс символов

Метасимволы имеют модификаторы (пишутся после метасимвола):

 – повторяется 0 или большее число раз

 – повторяется 1 или большее число раз

 – 1 или 0 раз

{n} – точно n раз

{n,} – по меньшей мере раз

{n,m} – не менше n, но и не больше m

Во все других случаях фигурные скобки считаются обычными (регулярными) символами. Таким образом '*' эквивалентна {0,} , '+' – {1,} и '?' – {0,1}. n и m не могут быть больше 65536.

По умолчанию действие метасимволов «жадно» (greedy). Совпадение распространяется столько раз сколько возможно не учитывая результат действия следуюющих метасимволов. Если вы хотите «уменьшить их аппетит» то используйте символ '?'. Это не изменяет значение метасимволов просто уменьшает распространение. Таким образом:

*? – станет 0 и более

+?  – 1 и более

?? – 0 или 1 раз

{n}? – точно n раз

{n,}? – не меньше n раз

{n,m}? – больше или равно n и меньше m раз

Шаблоны работают так же как и двойные кавычки поэтому в них можно использовать `\` – символы (бакслэш-символы):

\t – символ табуляции

\n – новая строка

\r – перевод каретки

\A – перевол формата

\v – вертикальная табуляция

\a – звонок

\e – escape

\033 – восьмеричная запись символа

\x1A – шестнадцатеричная

\c[ – control символ

\l – нижний регистр следующего символа

\u – верхний регистр -//-

\L – все символы в нижнем регистре до \E

\U – в верхнем -//-

\E – ограничитель смены регистра

\Q – отмена действия как метасимвола

Дополнительно в Перл добавлены следующие метасимволы:

\w – алфавитно-цифровой или '_' символ

\W – не алфавитно-цифровой или '_' символ

\s – один пробел

\S – один не пробел

\d – одна цифра

\D – одна не цифра

Обратите внимание что все это «один» символ. Для обозначения последовательности применяйте модификаторы. Так:

\w+ – слово

\d+ – целое число

[+-]?\d+ – целое со знаком

[+-]?\d+\.?\d* – число с точкой

Кроме того существуют мнимые метасимволы. Обозначающие не существующие символы в месте смены значения. Такие как:

\b – граница слова

\B – не граница слова

\A – начало строки

\Z – конец строки

\G – конец действия m//g

Граница слова (\b) – это мнимая точка между символами \w и \W.

Внутри класса символов '\b' обозначает символ backspace (стирания).

Метасимволы \A и \Z – аналогичны '^' и '$' но если началостроки '^' и конец строки '$' действуют для каждой строки в многосторочной строке то \A и \Z обозначают начало и конец всей многосторчной строки.

Если внутри шаблона применяется группировка (круглые скобки) то номер подстроки группы обозначается как '\цифра'.

Заметьте что за шаблоном в пределах выражения или блока эти группы обозначаются как '$цифра'. Кроме этого существуют дополнительные переменные:

$+  – обозначает последнее совпадение

$& – все совпадение

$` – все до совпадения

$' – все после совпадения

Пример:

$s = «Один 1 два 2 и три 3»;

if ($s =~ /(\d+)\D+(\d+)/)

{

Перейти на страницу:

Похожие книги

1001 совет по обустройству компьютера
1001 совет по обустройству компьютера

В книге собраны и обобщены советы по решению различных проблем, которые рано или поздно возникают при эксплуатации как экономичных нетбуков, так и современных настольных моделей. Все приведенные рецепты опробованы на практике и разбиты по темам: аппаратные средства персональных компьютеров, компьютерные сети и подключение к Интернету, установка, настройка и ремонт ОС Windows, работа в Интернете, защита от вирусов. Рассмотрены не только готовые решения внезапно возникающих проблем, но и ответы на многие вопросы, которые возникают еще до покупки компьютера. Приведен необходимый минимум технических сведений, позволяющий принять осознанное решение.Компакт-диск прилагается только к печатному изданию книги.

Юрий Всеволодович Ревич

Программирование, программы, базы данных / Интернет / Компьютерное «железо» / ОС и Сети / Программное обеспечение / Книги по IT
Programming with POSIX® Threads
Programming with POSIX® Threads

With this practical book, you will attain a solid understanding of threads and will discover how to put this powerful mode of programming to work in real-world applications. The primary advantage of threaded programming is that it enables your applications to accomplish more than one task at the same time by using the number-crunching power of multiprocessor parallelism and by automatically exploiting I/O concurrency in your code, even on a single processor machine. The result: applications that are faster, more responsive to users, and often easier to maintain. Threaded programming is particularly well suited to network programming where it helps alleviate the bottleneck of slow network I/O. This book offers an in-depth description of the IEEE operating system interface standard, POSIX (Portable Operating System Interface) threads, commonly called Pthreads. Written for experienced C programmers, but assuming no previous knowledge of threads, the book explains basic concepts such as asynchronous programming, the lifecycle of a thread, and synchronization. You then move to more advanced topics such as attributes objects, thread-specific data, and realtime scheduling. An entire chapter is devoted to "real code," with a look at barriers, read/write locks, the work queue manager, and how to utilize existing libraries. In addition, the book tackles one of the thorniest problems faced by thread programmers-debugging-with valuable suggestions on how to avoid code errors and performance problems from the outset. Numerous annotated examples are used to illustrate real-world concepts. A Pthreads mini-reference and a look at future standardization are also included.

David Butenhof

Программирование, программы, базы данных