355 500 произведений, 25 200 авторов.

Электронная библиотека книг » Владимир Маслов » Введение в Perl » Текст книги (страница 2)
Введение в Perl
  • Текст добавлен: 10 сентября 2016, 11:22

Текст книги "Введение в Perl"


Автор книги: Владимир Маслов



сообщить о нарушении

Текущая страница: 2 (всего у книги 5 страниц)

Встроенные переменные Перл

Описанные в данной главе переменные имеют в Перл специальные значения.

Они обозначаются несколько непривычно для «глаза» программистов т.к. состоят обычно только из дву символов причем первый это '$' символо с которого начинаются имена всех переменных и произвольный часто не буквенно-цифровой символ. Если вы хотите пользоваться их «нормальными» буквенными синонимами то вам нужно указать в начале программы:

use English;

Точно так же если вы захотите пользоваться переменными и методами текущего указателя файлов вы можете написать:

use FileHandle;

после этого можно можно просто писать:

метод указатель выражение

или

указатель -> метод(выражение)

Ниже приводятся имена как в короткой так и в длинной (словесной) форме.

Некоторые из встроенных переменных имеют доступ тоько на чтение поэтому изменить их значение просто не возможно.

$_

$ARG

Переменная – по умолчанию для операторов ввода и поиска. То есть если в качестве аргумента не указана никакая переменная то используется именно эта.

$цифра

Содержит найденные подстроку в последнем поиске когда шаблон содержит метасимволы в круглых скобках. Цифра в данном случае это номер скобок. Первая подстрока имеет номер 1.

$&

$MATCH

Найденная подстрока в последнем поиске по шаблону.

$`

Подстрока предшевствующая найденной подстроке.

$'

$POSTMATCH

Подстрока последующая за найденной подстрокой.

$+

$LAST_PAREN_MATCH

Подстрока найденная в поиске с выбором по «или».

$*

$MULTILINE_MATCHING

Если значение этой переменной установить равным 1 то переменная в которой осуществляется поиск будет считаться многосторочной т.е. содержащей символы 'n' – перевод строки. Если значеие равно 0 то переменная считается однострочной. В Перл версии 5 и выше не рекомендуестя использовать эту переменную.

$.

$INPUT_LINE_NUMBER

$NR

Номер прочитанной строки последнего оператора ввода. Закрытие файла вызывает очистку значения этой переменной.

$/

$RS

$INPUT_RECORD_SEPARATOR

Символ – признак конца входной строки. По умолчанию это 'n'

$|

$OUTPUT_AUTOFLUSH

Если присвоить этой переменной не нулевое значение то будет сброс буфера вывода после каждой операции вывода. Значение по умолчанию -0

$,

$OFS

$OUTPUT_FIELD_SEPARATOR

Символ добавляемый оператором print после каждого элемента из списка параметров.

$

$ORS

$OUTPUT_RECORD_SEPARATOR

Символ добавляемый print после вывода всех параметров.

$"

$LIST_SEPARATOR

Анологичен «$,» но добавляется после каждого элемента массива указаноого в «....».

$;

$SUBSEP

$SUBSCRIPT_SEPARATOR

Символ – разделитель для эмуляции многомерных массивов в хеш массивах. По умолчанию '34'.

$#

$OFMT

Формат по умолчанию для вывода чисел.

$%

$FORMAT_PAGE_NUMBER

Формат по умолчанию для вывода номеров страниц.

$=

$FORMAT_LINES_PER_PAGE

Длина одной страницы. По умолчанию 60 строк.

$-

$FORMAT_LINES_LEFT

Количество оставшихся строк на странице.

$~

$FORMAT_NAME

Имя формата текущего вывода. По умолчанию имя указателя.

$^

$FORMAT_TOP_NAME

Имя текущего формата для заголовка страницы.

$:

$FORMAT_LINE_BREAK_CHARACTERS

Символы переноса строки для многострочных полей. В строке формата такие поля начинаются символом '^'. По умолчанию 'n-'.

$^L

$FORMAT_FORMFEED

Символ перевода формата ( смены листа). По умолчанию 'f'.

$^A

$ACCUMULATOR

Текущее значение аккумулятора функции write() для format(). Значение этой переменной можно увидеть только при использовании функции formline() т.к. write() очищает ее после каждого вывода.

$?

$CHILD_ERROR

Данная перменная содержит статус завершения таких процессов как: закрытие pipe, завершение функций system(), wait() и `...`.

$!

$ERRNO

$OS_ERROR

В числовом контексте возвращает код ошибки errno.

В строковом – строку сообщения об ошибке. Можно принудительно присвоить этой перменной код ошибки что бы получить системное сообщение для данного кода или установить код завершения для функции die().

$@

$EVAL_ERROR

Сообщение об ошибке последней команды eval().

$$

$PID

$PROCESS_ID

Номер текущего процесса.

$<

$UID

$REAL_USER_ID

Реальный UID текущего процесса.

$>

$EUID

$EFFECTIVE_USER_ID

Эффективный UID текущего процесса.

$(

$GID

$REAL_GROUP_ID

Реальный GID текущего процесса.

$)

$EGID

$EFFECTIVE_GROUP_ID

Эффективный GID текущего процесса.

$O

$PROGRAM_NAME

Имя файла программы. Если этой переменной присвоить какое нибудь значение то его можно видеть в команде ps, что удобно для контроля за состоянием программы.

$[

Номер первого элемента массива или символа строки. Значение по умолчанию – 0.

$]

$PERL_VERSION

Строка сообщение версии Перл. Печатается по команде perl -v Применяется в программе для определения рабочей версии Перл. В числовом контексте это номер версии плюс номер модификации / 1000.

$^D

$DEBUGGING

Текущее значение ключа отладки '-D'.

$^F

$SYSTEM_FD_MAX

Номер максимального системного описателя файлов (system file descriptor). Обычно это 2.

$^I

$INPLACE_EDIT

Текущее значение inplace-edit возможности. Для отключения используйте undef.

$^P

$PERLDB

Внутренний флаг отладки. Применяется для того что бы отладчик не отслеживал самого себя.

$^T

$BASETIME

Время в секундах с начала 1970 года старта текущей программы.

$^W

$WARNING

Значение флага '-w'. true -если включено и false – выключено.

$^X

$EXECUTABLE_NAME

Команда запуска Перл. Аналогично argv[0] в С.

$ARGV

Имя текущего файла читаемого оператором '<>'.

@ARGV

Массив параметров строки запуска программы. Внимание! @#ARGV – меньше количества параметров на 1 т.к. $ARGV[0] это первый параметр (не имя программы).

@INC

Список директорий диска которые просматривает Перл для выполнения команд do, require или use.

%INC

Этот хеш содержит имена директорий для имен использованных файлов командами do или require. Ключ – имя файла, а значение – директория.

$ENV{выражение}

Хеш %ENV содержит значения переменных окружения. Изменение этих значений вызывает изменение окружения для процессов потомков.

$SIG{выражение}

Хеш %SIG содержит имена подпрограмм для системных сигналов таких как INT, QUIT, PIPE, ... Значение 'DEFAULT' – для системной обработки. 'IGNORE' – игнорировать данный сигнал.

Регулярные выражения (шаблоны)

В данной главе описывается синтаксис регулярных выражений. Чаще всего в Перл они используюстя в операторах поиска и замены таких как s// m/ операторах связки =~ или != и т.д.

Как правило все эти операторы имеют схожие опции такие как:

i – не различать строчные и заглавные буквы.

m – считать строку многострочной.

s – однострочная строка.

x – расширенный синтаксис ( использование пробелов и комментариев)

Обычно все эти опции обозначают как '/x'. Их можно использовать даже внутри шаблонов, используя новую конструкцию (?...)

Регулярные выражения или шаблоны (pattern) то же самое что и regexp процедуры в Юниксе. Выражения и синтаксис заимствован из свободно распространяемых процедур V8 Генри Спенсера (Henry Spencer) там же они подробно и описаны.

В шаблонах используются следующие метасимволы (символы обозначающие группы других символов) часто называемых egrep – стандартом:

 – считать следующий метасимвол как обычный символ.

^ – начало строки

 – один произвольный символ. Кроме 'n' – конец строки.

$ – конец строки

| – альтернатива (или)

()  – группировка

[]  – класс символов

Метасимволы имеют модификаторы (пишутся после метасимвола):

 – повторяется 0 или большее число раз

 – повторяется 1 или большее число раз

 – 1 или 0 раз

{n} – точно n раз

{n,} – по меньшей мере раз

{n,m} – не менше n, но и не больше m

Во все других случаях фигурные скобки считаются обычными (регулярными) символами. Таким образом '*' эквивалентна {0,} , '+' – {1,} и '?' – {0,1}. n и m не могут быть больше 65536.

По умолчанию действие метасимволов «жадно» (greedy). Совпадение распространяется столько раз сколько возможно не учитывая результат действия следуюющих метасимволов. Если вы хотите «уменьшить их аппетит» то используйте символ '?'. Это не изменяет значение метасимволов просто уменьшает распространение. Таким образом:

*? – станет 0 и более

+?  – 1 и более

?? – 0 или 1 раз

{n}? – точно n раз

{n,}? – не меньше n раз

{n,m}? – больше или равно n и меньше m раз

Шаблоны работают так же как и двойные кавычки поэтому в них можно использовать `` – символы (бакслэш-символы):

t – символ табуляции

n – новая строка

r – перевод каретки

A – перевол формата

v – вертикальная табуляция

a – звонок

e – escape

33 – восьмеричная запись символа

x1A – шестнадцатеричная

c[ – control символ

l – нижний регистр следующего символа

u – верхний регистр -//-

L – все символы в нижнем регистре до E

U – в верхнем -//-

E – ограничитель смены регистра

Q – отмена действия как метасимвола

Дополнительно в Перл добавлены следующие метасимволы:

w – алфавитно-цифровой или '_' символ

W – не алфавитно-цифровой или '_' символ

s – один пробел

S – один не пробел

d – одна цифра

D – одна не цифра

Обратите внимание что все это «один» символ. Для обозначения последовательности применяйте модификаторы. Так:

w+ – слово

d+ – целое число

[+-]?d+ – целое со знаком

[+-]?d+.?d* – число с точкой

Кроме того существуют мнимые метасимволы. Обозначающие не существующие символы в месте смены значения. Такие как:

b – граница слова

B – не граница слова

A – начало строки

Z – конец строки

G – конец действия m//g

Граница слова (b) – это мнимая точка между символами w и W.

Внутри класса символов 'b' обозначает символ backspace (стирания).

Метасимволы A и Z – аналогичны '^' и '$' но если началостроки '^' и конец строки '$' действуют для каждой строки в многосторочной строке то A и Z обозначают начало и конец всей многосторчной строки.

Если внутри шаблона применяется группировка (круглые скобки) то номер подстроки группы обозначается как 'цифра'.

Заметьте что за шаблоном в пределах выражения или блока эти группы обозначаются как '$цифра'. Кроме этого существуют дополнительные переменные:

$+  – обозначает последнее совпадение

$& – все совпадение

$` – все до совпадения

$' – все после совпадения

Пример:

$s = «Один 1 два 2 и три 3»;

if ($s =~ /(d+)D+(d+)/)

{

print «$1n»; # Результат '1'

print «$2n»; # '2'

print «$+n»; # '2'

print «$&n»; # '1 два 2'

print «$`n»; # 'Один '

print «$'n»; # ' и три 3'

}

Перл версии 5 содержит дополнительные конструкции шаблонов:

(?#комментарий) – комментарий в теле шаблона.

(?:шаблон) – группировка как и '( )' но без обратной ссылки

(?=шаблон) – «заглядывание» вперед.

Например /w+(?=t)/ соответствует слову за которым идет табуляция но символ 't' не включается в результат.

Пример:

$s = «1+2-3*4»;

if ($s =~ /(d)(?=-)/) # Наити цифру за которой стоит '-'

{

print «$1n»; # Результат '2'

}

else { print «ошибка поискаn»;}

(?!шаблон) – «заглядывание» вперед по отрицанию.

Пример:

$s = «1+2-3*4»;

if ($s =~ /(d)(?!+)/) # Наити цифру за которой не стоит '+'

{

print «$1n»; # Результат '2'

}

else { print «ошибка поискаn»;}

(?ismx) – «внутренние» модификаторы. Удобно применять в шаблонах где например нужно внутри шаблона указать модификатор.

Правила регулярного выражения. (regex)

1. Любой символ обозначает себя самого если это не метасимвол. Если вам нужно отменить действие метасимвола то поставьте перед ним ''.

2. Строка символов обозначает строку этих символов.

3. Множество возможных символов (класс) заключается в квадратные скобки '[]' это значит что в данном месте может стоять один из указанных в скобках символ. Если первый символ в скобках это '^' – значит не один из указанных символов не может стоять в данном месте выражения. Внутри класса можно употреблять символ '-' обозначающий диаппазон символов. Например a-z один из малых букв латинского алфавита, 0-9 – цифра и т.д.

4. Все символы, включая специальные можно обозначать с помощью '' как в языке С.

5. Альтернативные последовательности разделяются символом '|' Заметьте что внутри квадратных скобок это обычный символ.

6. Внутри регулярного выражения можно указыват «подшаблоны» заключая их в круглые скобки и ссылаться на них как 'номер' Первая скобка обозначается как '1'.

Операторы и приоритеты

В Перл ассоциативность и приоритетность операторов аналогична языку C Ниже перечислены все операторы в порядке уменьшения приоритета, в начале строки указана ассоциативность.

ассоц. операторы

– –

левая термы и левосторонные списковые операторы

левая ->

– ++ –

правая **

правая ! ~ унарные + и -

левая =~ !~

левая * / % x

левая + – .

левая << >>

– именованные унарные операторы

– < > <= >= lt gt le ge

– == != <=> eq ne cmp

левая &

левая | ^

левая &&

левая ||

– ..

правая ?:

правая = += -= *= и т.д.

левая , =>

– правосторонние списковые операторы

левая not

левая and

левая or xor


Термы и левосторонние списковые операторы.

Любой терм имеет самый высокий приоритет. К терму относятся переменные, кавычки и их операторы, арифметические и логические выражения в скобках, любые функции с параметрами в скобках. Фактически таких функций нет так как это просто унарные и списковые операторы просто они ведут себя подобно функциям с параметрами в скобках. Подробно смотри главу «Функции».

Если после любого спикового оператора ( print(), и т.д.) или унарного оператора (chdir(), и т.д.) следует левая круглая скобка, то операторы внутри скобок имеют наивысший приоритет. Так же как и обычные функции.

Если скобки отсутсвуют то приоритет списковых операторов или наивысший или наименьший в отношении операторов справа или слева от него.

Например:

@i = ('a ','b ', print 'c ', 'd ');

print «n»,@i,"n";

Результат:

c d

a b 1

Здесь мы имеем списковый оператор print. Для запятых слева от него он имеет наименьший приоритет, но повышает приоритет правой запятой.

Поэтому правая запятая воспринимается как параметр для print и печатается 'c d' а левая просто записывает код завершения операции в массив @i и последний print показывает это.


Оператор '->'

Так же как в С или С++ это инфиксный оператор переадрессации. Если справа от него стоит [...] или {...} выражение, то правая часть может быть непосредственной или символической ссылкой на массив или хеш.

В противном случае правая сторона это метод или простой скаляр содержащий имя метода, а правая или объект или имя класса. Подробно смотри главу «Классы».


Операторы ++ (инкремент) и (декремент).

Эти операторы работают так же как и в С. Если оператор стоит перед переменной то значение переменной изменяется на 1 и полученной значение используется. Если после переменной то ее величина изменяется после применения.

Употребление инкремента к строковым переменным в Перл имеет одну особенность.

Каждый символ остается в своем классе (большие, малые, цифры) и учитывается перенос предыдущего символа. Таким образом строковые переменные с цифрами работают как числовые переменные.

Пример:

print ++($i = «09»); # Результат «10»

print ++($i = «a9»); # «b0»

print ++($i = «az»); # «ba»

print ++($i = «aZ»); # «bA»


Оператор ** (возведение в степень)

Пример:

print 4**2 # Результат 16

print -4**2 # Результат -16 т.е. -(4**2)


Унарные операторы.

'!' – логическое отрицание

'-' – арифметический минус

'~' – побитная инверсия (дополнение до 1)

'+' – арифметический плюс

'' – получение ссылки на переменную (как & в С)


Операторы «привязки» =~ и !~ .

Эти «необычные» я бы даже сказал оригинальные операторы имеют очень широкое применение в Перл. Можно даже назвать их «оригинальным» решением.

Оператор =~ логически связывает левую часть выражения с патерном (pattern – образец, шаблон, модель) в правой. По умолчанию поиск или изменение по патерну выполняется в переменной $_ Операторы привязки позволяют делать это с любой переменной указанной в левой части. Логическим результатом будет успех операции. Если в правой части вместо патерна присутсвует выражение, то результат этого выражения воспринимается как патерн. Однако это не очень эффективно т.к. патерн будет компилироваться во время исполнения программы что заметно снизит быстродействие.

Оператор !~ аналогичен =~ только результат совпадения инвентируется (логическое «нет»). Подробное применение этих операторов приводится в главе «Патерны».


Мультипликативные операторы.

'*' – арифметическое умножение

'/' – арифметическое деление

'%' – арифметический модуль

'x' – оператор повторения

В скалярном контексте возвращает строку левой части повторенную величиной указанной в правой части. В списковом контексте, если в левой части список в круглых скобках – повторенный список.

Пример:

print '*' x 5; # Результат '*****'

print (1,2) x 3; # Результат 121212


Аддитивные операторы.

'+' – арифметический плюс

'-' – арифметический минус

'.' – конкатенация (объединение) строк


Операторы сдвига.

'<<' – Сдвигает побитно влево значение выражения в левой части на количество бит указанное в правой.

'>>' – Сдвигает побитно вправо значение выражения в левой части на количество бит указанное в правой.


Именованные унарные операторы.

Фактически это функции с одним аргументом. Круглые скобки можно опускать.

Операторы отношений.

'<' – арифметическое меньше

'>' – арифметическое больше

'<=' – арифметическое меньше или равно

'>=' – арифметическое больше или равно

'lt' – строковое меньше

'gt' – строковое больше

'le' – строковое меньше или равно

'ge' – строковое больше или равно


Операторы равенства.

'==' результат true если левая часть равна правой (равно)

'!=' – не равно

'<=>' – -1 если левая часть меньше правой, 0 если равна, 1 если больше.

'eq' – строковое равно

'ne' – строковое не равно

'cmp' – как и '<=>' применительно к строкам


Операторы работы с битами.

'&' – побитное AND

'|' – побитное OR

'^' – побитное XOR


Логические операторы && (AND) и || (OR).

'&&' – если левое выражение возвращает false, правое не выполняется.

'||' – если левое выражение возвращает true, правое не выполняется.

Отличие от подобных операторов в С заключается в том, что в С возращаемое значение либо 0 либо 1. Тогда как в Перл возвращается результат выражения.


Оператор диапазона '..'

Результат работы данного оператора зависит от контекста. В списковом контексте результат есть список с элементами. Первый элемент которого это левое выражение и последнее – правое.

Значение каждого элемента внутри списка увеличивается на 1.

Данный оператор удобен для небольших циклов т.к. память отводится для всего списка целиком. Поэтому будьте внимательны и не задавайте слишком большой диаппазон.

Пример:

for $i (1..4)

{ print "$i ";

}

Результат: 1 2 3 4

В скалярном контексте результат – логическое значение. Каждая '..' операция устанавливает свое собственное состояние. Это false до тех пор пока левый операнд false. Как только левый операнд стал true результат – true до тех пока правый true, после чего результат опять – false. Если вы не хотите проверять правый операнд то используйте оператор '...'.

Правый операнд не вычисляется пока результат false и левый операнд не вычисляется пока пока результат true. Приоритетность оператора '..' немного ниже чем '&&' и '||'. Возвращаемое значение если flase – нулевая строка, если true – порядковый номер начиная с 1. Порядковый номер обнуляется для каждого нового диаппазона.

Последний порядковый номер добавляется строкой "E0" которая не изменяет его значение но позволяет фиксировать последнее значение.

Пример:

@алфавит = ('a'..'z'); # Массив малых букв латинского алфавита

@цифры = (0..9); # Массив цифр


Условный оператор '?:'

Этот оператор работает так же как и в С. Если выражение перед '?' истинно то выполняется аргумент перед ':' – иначе после ':'.

Пример:

$i = 1;

$i > 1 ? print «больше» : print «меньше»;

Результат: меньше


Операторы присваивания.

'=' – обычный оператор «присвоить» правое значение переменной слева Вся эта группа операторов подобна операторам С т.е.

$i += 2;

эквивалентно

$i = $i + 2;

Остальные операторы этой группы работают аналогично.

Допустимы следующие операторы:

**=

+= -= .=

*= /= %= x=

&= |= ^=

<<= >>=

&&= ||=

Приоритет всей этой группы операторов равен приоритету '='.


Оператор ',' (запятая)

В скалярном контексте выполняется левый аргумент, результат игнорируется затем правый и его результат есть результат действия оператора.

В списковом контексте это разделитель элементов списка который включает указанные элементы в список.


Оператор логическое not (орицание).

Унарный not возвращает противоположное значение полученное выражением справа. Он эквивалентен '!' но имеет очень низкий приоритет.


Оператор логическое and (И).

Выполняет логическую конъюнкцию двух выражений. Эквивалентен '&&' но имеет очень низкий приоритет и «краткость» действия. т.е если левое выражение равно false – левое не выполняется.


Логическое or (ИЛИ).

Выполняет логическую дизъюнкцию двух выражений. Эквивалентен '||', но имеет очень низкий приоритет и «краткость» действия. т.е если левое выражение равно true – левое не выполняется.


Логическое xor (исключающее ИЛИ).

Выполняет логическое исключающие или. Всегда выполняются оба правое и левое выражение.


С операторы отсутствующие в Перл.

В Перл отсутсвуют операторы языка С такие как:

унарное & – получить адрес. Для этого применяется ''.

унарный * – переадресация.

(TYPE) – совмещение типов.


Операторы ограничители строк.

Обычно ограничители строк мы считаем литералами, но в Перл это операторы выполняющие разного рода интерполяцию и поиск по шаблону. Вы можете сами задавать удобные для вас ограничители. В следующей таблице приведен полный перечень вариантов. Фигурные скобки '{}' обозначают любой символ используемый для ограничителя. В случае использования скобок (круглых '()', квадратных '[]', фигурных '{}', угловых '<>') в начале ставится открывающаяся скобка а в конце закрывающая.


По умолчанию Полное Функция Интерполяция

– – – –

'' q{} Literal нет

"" qq{} Литерал да

`` qx{} Команда да

qw{} Список слов нет

// m{} Шаблон да

s{}{} Подстановка да

tr{}{} Трансляция нет

В строках допускающих интерполяцию имена переменных начинающиеся с символов '$' или '@' – интерполируются т.е. в строку вставляется значение строки или массива.

Данные последовательности символов имеют специальное значение:

t символ табуляции

n символ новой строки

r возврат

f перевод формата

v вертикальная табуляция

b backspace (забой)

a звонок

e escape

34 восьмеричный символ

x1a шестьнадцатеричный символ

c[ символ управления

l нижний регистр следующего символа

u верхний регистр следующего символа

L нижний регистр для всех символов до E

U верхний регистр для всех символов до E

E ограничитель смены регистра

Q отмена действия метасимволов до E

Шаблоны интерполируются как регулярные выражения. Это выполняется вторым проходом после интерполяции переменных поэтому в шаблоны можно вставлять переменные. Для отмены интерполяции используйте 'Q'. Если вы применяете вложенные ограничители то внутренние ограничители работать не будут.


?PATERN?

?PATERN?

Действие этого оператора аналогично /шаблон/ но выполняется до первого совпадения. Это удобно для поиска наличия какой нибудь строки в одном или множестве файлов. Это не очень удачный оператор поэтому в следующих версиях Перл его возможно не будет.

m/PATERN/gimosx

/PATERN/gimosx

Поиск в строке по патерну (шаблону). В скалярном контексте возвращает логическое значение true (1) или false (''). Если строка не указана с помощью операторов '=~' или '!~' поиск ведется в строке $_

Опции:

 – Глобальный поиск. Поиск всех вхождений.

 – Сравнение не зависит от регистра (верхний или нижний)

m – Строка многострочна.

o – однопроходная компиляция

s – однострочная строка

x – используеются расширенные регулярные выражения.

Если '/' – ограничитель то начальное 'm' можно опустить. С помощью него в качестве ограничителя может быть любой символ кроме пробела.

PATTERN может содержать переменные которые будут интерполироваться (перекомпилироваться) каждый раз в момент вычисления.

Переменные $) и $| не интерполируются. Если вы хотите что бы такой шаблон интерполировался один раз – добавьте /o.

Это необходимо делать в циклах поиска для увеличения быстродействия однако если вы измените значение переменной Перл этого даже не заметит.

Если PATERN – нулевая строка то используется последнее регулярное выражение.

В скалярном контексте возвращается список элементы которого результаты выполнения выражений в скобках патерна ($1, $2, $3...).

Обратите внимание что первый елемент $1.

Пример:

$a = «/usr/local/perl/perl.bin»; # Анализируемая строка

Цель: Создать массив @dirs с именами директорий.

Решение:

Самый простой способ воспользоваться split('/'), но в качестве примера используем скобки.

@dirs =~ m[/(w*)/(w*)/(w*)/(w*)]

Здесь 'm[' – использовать квадратные скобки как ограничители.

(w*) – шаблон алфавитноцифровой последовательности.

В результате @dirs равен ('usr', 'local', 'perl')



q/строка/ 'строка'

Строка литералов. Не интерполируется. Внутри строки разрешается использовать ' или \ для обозначения символов ' и .

Пример:

print q#Привет.#; # Результат Привет.

print 'O'K'; # O'K



qq/строка/ «строка»

Интерполируемая строка.

Пример:

$var = 13;

print «$var = $var»;

Результат:

$var = 13



qx/строка/ `строка`

Сначала строка интерполируется а потом выполняется как системная команда.

Пример:

print `date`;

Результат:

Thu Nov 14 13:36:49 MSK 1996


qw/строка/

Возвращает список элементы которого – слова строки разделенные пробелами.

Пример:

print qw/Построемся и спасемся!/; # ('Построемся','и','спасемся!')

Результат:

Построемсяиспасемся!

Часто применяется как:

use POSIX qw( setlocale localeconv )

@EXPORT = qw( proc1 var );



s/шаблон/подстрока/egimosx

Поиск по шаблону и в случае успеха замена подстрокой.

Возвращает количество произведенных подстановок иначе false (0). Если строка в которой ведестя поиск не указана (операторы =~ или != ) то используется переменная $_ .

Если в качестве раделителя '/' исрользовать одинарную кавычку (') то интерполяции не будет иначе можно применять переменные в шаблоне или подстроке.

Опции:

e – Расмматривать правую часть как выражение.

 – Глобальный поиск.

 – Без различия регистра букв

m – многосточная переменная

o – компилировать шаблон один раз

s – однострочная переменная

x – расширенное регулярное выражение

Разделитель '/' можно заменить на любой алфавитно-цифровой символ кроме пробела.

Пример:

$var = «12345»; # исходная строка

$var =~ s/1/0/; # Заменить '1' на '0'. Результат 02345

$var =~ s(5)(.); # Заменить '5' на '.' Результат 0234.

Здесь в качестве разделителя применены скобки поэтому подстрока

взята в две скобки.

$var =~ s/d*/каламбур/; Заменить все цифры. Результат 'каламбур.'

$var =~ s/а/о/g; # Заменить все 'а' на 'о'. Результат 'коломбур.'

$var = «12 34»; # Новое значение

$var =~ s/(dd) (dd)/$2 $1/; # Поменять местами числа. Результат '34 12'.

tr/таблица1/таблица2/cds

y/таблица1/таблица2/cds

Замена всех символов из «таблица1» на соответсвующий символ из «таблица2». Результат – количество замен или стираний. Без оператора =~ или != операция выполняется с строкой $_. Для совместимости с программой sed вместо tr можно писать 'y'.

Опции:

c – дополнение «таблица1»

d – стереть найденные но не замененные символы.

s – «зжать» повторяющиеся замененные символы.

Если указана опция /dтаблица2 всегда интерпретируется как положено.

Другими словами если таблица2 короче чем таблица1 то символ из таблицы1 интерпретируется всегда. Если таблица2null то все символы строки остаются не изменненные. Это удобно для подсчета количества сиволов в строке определенного класса или для сжатия повторяющихся символов например пробелов.

Пример:

$s = «hello»; # Исходная строка

$s =~ tr/a-z/A-Z/; # Заменить малые буквы на большие. Результат

# 'HELLO'

$s = 'Hel....lo';

$s =~ tr/a-zA-z/_/c; # Заменить все не буквы на '_'

# Результат 'Hel____lo'

$s =~ tr/_/ /s; # Заменить '_' на ' ' и сжать.

# Результат 'Hel lo'

$s =~ tr/a-zA-Z /a-zA-Z/d; # Удалить все не буквы. Результат 'Hello'

Если один и тот же символ несколько раз указан в таблице1 то применяется только первая замена.


Операторы ввода-вывода.

В Перл существует несколько операторов ввода-вывода. Первый это скобки из символа '`' – акцента. Строка в этих скобках воспринимается как системная команда и результат ее действия возвращается как «псевдо» литерал. В скалярном контексте это строка содержащая весь результат, а в списковом – список элементы которого – строки результата.

Статус выполненой команды хранится в переменной $? .

Следующая команда ввода вывода выглядит как '<файл>'.

Вычисление <файл> приводит к чтению строки из файла. Обратите внимание что 'файл' здесь не имя файла, а указатель файла который создается функцией open(). В скалярном контексте читается одна строка вместе с символом 'n' – перевода строки, а в списковом весь файл читается в список элементы которого суть строки файла.

В случае обнаружения конца файла результат оператора не определен и воспринимается как false. Если не указана переменная результата то по умолчанию это $_. Указатель файла по умолчанию STDIN – стандартный ввод.

Пример:

while(<>) { print; }; # Прочитать и вывести весь файл STDIN

У оператора '<>' есть одна отличительная особенность. Если в командной строке нет никаких аргументов то читается стандартный ввод, если есть аргументы то они считаются именами файлов которые последовательно читаются.

Если в угловых скобках записана переменная то содержимое этой переменной считается именем указателя файла или ссылкой на указатель файла. Если такого указателя не существует то содержимое переменной воспринимается как шаблон имен файлов и результат – имена файлов на диске подходящих по шаблону.

Пример:

while(<*.pl>) { print;}; # То же что и ls *.pl

@files = <*>; # Массив @files содержит имена файлов в директории

но лучше сделать: @files = glob("*"); т.к. внутри скобок можно использовать переменные.


Слияние констант.

Как и С Перл выполняет возможные вычисления в период компиляции.

Так подстановка символов после '' , операция конкатенации строк, арифметические выражения содержащие только одни константы, все это делается в момент компиляции что существенно увеличивает скорость выполнения программы.


Целочисленная арифметика.

По умолчанию Перл выполняет арифметику с плавающей запятой, но если вы укажете:

use integer;

то компилятор будет использовать целочисленную арифметику до конца текущего блока, хотя вложенный блок может это и отменить в своих пределах с помощью:

no integer;


    Ваша оценка произведения:

Популярные книги за неделю