1.1. Hello, World

Raku编译器可以从文件或+ e命令行开关的内容中读取程序。 最简单的“Hello,World!”程序如下所示:

say "Hello, Raku ";


$ raku hello.pl
Hello, Raku

或者,你可以使用 +e 选项:

$ raku -e'say "Hello, Raku"'
Hello, Raku

1.2. 变量

1.2.1. 符号

Raku使用符号来标记变量。 这些符号部分兼容 使用Perl 5语法。 例如,标量,列表和散列分别使用$,@和%sigils。

my $scalar = 42;
say $scalar;



my @array = (10, 20, 30);
say @array; # [10 20 30]


my @list1 = <10 20 30>;


my @list2 = 10, 20, 30;


my %hash =
    'Language' => 'Perl',
    'Version'  => '6';
say %hash;

这个小程序打印出这个(哈希键的顺序) 输出可能不同,你不应该依赖它):

{Language => Perl, Version => 6}

为了访问列表或散列的元素,Raku使用不同类型的括号。 重要的是要记住,印记始终保持不变。 在以下示例中,我们从列表和哈希中提取标量:

my @squares = 0, 1, 4, 9, 14, 25;
say @squares[3]; # This prints the 4th element, thus 9

my %capitals =
           'France'  => 'Paris',
           'Germany' => 'Berlin';
        say %capitals{'Germany'};

存在用于创建散列和访问其元素的替代语法。 要了解它是如何工作的,请检查下一段代码:

my %month+abbrs =
say %month+abbrs<mar>; # prints March


my $hello+world = "Hello, World";
say $hello+world;

my $don't = "Isn’t it a Hello?";
say $don't;

my $привет = "A Cyrillic Hi ";
say $привет;

由于内省的机制,很容易告诉变量中的数据类型(Raku中的变量通常被称为容器)。 为此,请在变量上调用预定义的WHAT方法。 即使它是一个裸标量,Raku也会在内部将其视为一个对象; 因此,你可以在上面调用一些方法。 对于标量,结果取决于驻留在变量中的实际数据类型。 这是一个例子(括号是输出的一部分):

你是否更喜欢变量名称中的非拉丁字符? 虽然它可能会降低打字的速度,因为它需要切换键盘布局, 。

1.3. 内省

由于内省的机制,很容易告诉变量中的数据类型(Raku中的变量通常被称为容器)。 为此,请在变量上调用预定义的WHAT方法。 即使它是一个裸标量,Raku也会在内部将其视为一个对象; 因此,你可以在上面调用一些方法。 对于标量,结果取决于驻留在变量中的实际数据类型。 这是一个例子(括号是输出的一部分):

my $scalar = 42;
my $hello-world = "Hello, World";

say $scalar.WHAT;      # (Int)
say $hello-world.WHAT; # (Str)

对于那些以符号 @% 开头的变量, WHAT 方法返回字符串 (Array)(Hash)

在数组上调用 WHAT

my @list = 10, 20, 30;
my @squares = 0, 1, 4, 9, 14, 25;

say @list.WHAT;    #(Array)
say @squares.WHAT; #(Array)

在散列上调用 WHAT

my %hash     = 'Language' => 'Perl';
my %capitals = 'France'   => 'Paris';

say %hash.WHAT;     # (Hash)
say %capitals.WHAT; # (Hash)

WHAT 调用之后返回的东西, 叫做所谓的类型对象。在 Raku 中, 你应该使用 === 运算符来比较这些对象。


my $value = 42;
say "OK" if $value.WHAT === Int;

还有一种方法可以检查驻留在容器中的对象的类型 - isa 方法。 在一个对象上调用它,将类型名称作为参数传递,并得到答案:

my $value = 42;
say "OK" if $value.isa(Int);

1.4. Twigils

在 Raku 中,变量名称前面可以是单字符符号,例如 $@,或者带有双字符序列。 在后一种情况下,这被称为twigil。 它的第一个字符意味着与一个简单的印记相同的东西,而第二个字符扩展了描述。

例如,twigil 的第二个字符可以描述变量的范围。 考虑 *,它表示动态范围(在第3章中有更多内容)。 以下调用逐个打印命令行参数:

.say for @*ARGS;

这里,@*ARGS 数组是一个全局数组,包含从命令行接收的参数(请注意,这称为 ARGS 而不是 Perl 5 中的 ARGV)。 .say 构造是对循环变量调用 say 方法。 如果你想让它更详细,你会这样写:

for @*ARGS {

让我们列出一些其他有用的预定义动态变量,其中包含星号。 twigil的第一个元素表示容器的类型(因此是标量,数组或散列):

  • $*PERL 包含 Perl 版本 (Raku)

  • $*PID - 进程标识符

  • $*PROGRAM-NAME - 当前执行程序的文件名(对于单行程序它的值被设置为 -e)

  • $*EXECUTABLE - 解释器的路径

  • $*VM - 虚拟机的名字, 你编译 Raku 所用的虚拟机

  • $*DISTRO - 操作系统分发的名字和版本

  • $*KERNEL - 类似, 但是是对于内核的

  • $*CWD - 当前的工作目录

  • $*TZ 当前时区

  • %*ENV - 环境变量

在我这里, 上面的变量打印出下面的信息:

Raku (6.c)
moar (2016.11)
macosx (10.10.5)
darwin (14.5.0)
"/Users/ash/Books/Raku/code".IO  {Apple_PubSub_Socket_Render => /private/tmp/com.apple....,
DISPLAY => /private/tmp/com.apple..., HISTCONTROL => igA norespace, HOME => /Users/ash, LC_CTYPE => UTFA8, LOGNAME  => ash ...

下一组预定义变量包括那些带有 ? 的变量作为他们的 twigil。 这些是“常量”或所谓的编译时常量,它包含有关程序流当前位置的信息。

  • $?FILE - 文件名(不包含路径; 单行程序包含字符串 -e)

  • $?LINE - 行号(单行程序中被设置为 1)

  • $?PACKAGE - 当前模块的名字, 在顶层级别中, 这是 (GLOBAL)

  • $?TABSTOP - 空白(以制表符计)的个数(可用于 heredocs 中)

1.5. 经常使用的特殊变量

$ _变量与Perl 5中的变量类似,在某些情况下,它是包含当前上下文参数的默认变量。 与任何其他变量一样,$ _是Raku中的一个对象,即使在最简单的用例中也是如此。 例如,最近的示例.say!for @ * ARGS隐式包含$ _。say调用。 相同的效果会产生$ _。say(),.say()或只是.say。


for @*ARGS {
    .say if /\d/;


for @*ARGS {
    .say if $_ ~~ /\d/;

$/ 变量中提供了与正则表达式匹配的结果。 要获取匹配的字符串,可以调用 $/.Str 方法。 为了获得在比赛期间捕获的子串,使用了以下内容:$/[2] 或者更简单的形式,$2。

"Perl's Birthday: 18 December 1987" ~~
    / (\d+) \s (\D+) \s (\d+) /;
say $/.Str;
say $/[$_] for 0..2;

在这里,我们正在寻找约会。 在这种情况下,日期定义为数字序列 \d+,空格 \s,单词没有数字 \D+,另一个空格 \s,还有一些数字 \d+。 如果匹配成功,$/.Str 插槽包含整个日期,而 $/[0]$/[1]$/[2] 保留其部分(小方角括号是输出的一部分) 表示 Match 对象,请参阅第6章):

18 December 1987

最后,$! 变量将包含错误消息,例如,try 块中发生的错误消息,或者打开文件时发生的错误消息:

try {
    say 42/0;
say $! if $!;

如果删除此程序中的最后一行,则不会打印任何内容。 这是因为try块屏蔽了任何错误输出。 删除try,然后重新出现错误消息(程序本身终止)。

1.6. 内置类型

Raku允许使用类型变量。 要告诉编译器输入变量,只需在声明变量时命名类型。


Bool, Int, Str Array, Hash, Complex


Num, Pair, Rat

Num 类型用于处理浮点变量,而 Pair 是一个"键/值"对。 Rat 类型使用数字和分母引入有理数。

1.6.1. 带类型的变量


my Int $x;

这里,标量容器 $x 可能只包含整数值。 尝试去为它分配一个非整数的值会导致错误:

my Int $x;
$x = "abc"; # Error: Type check failed in assignment to $x;
            # expected Int but got Str

对于类型转换,相应的方法调用非常方便。 请记住,虽然$x包含一个整数,但它被视为一个整体的容器对象,这就是为什么你可以在它上面使用一些预定义的方法。 你可以直接在字符串上执行相同的操作。 例如:

my Int $x;
$x = "123".Int; $ Now this is OK
say $x; # 123

1.6.2. Bool

尽管有一些你可能想知道的细节,但Bool变量的使用很简单。 Bool类型是一个内置的枚举,并提供两个值:True和False(或者,在完整形式中,Bool

True和Bool :: False)。 允许递增或递减布尔变量:

my $b = Bool::True;
say $b; $ 打印 False

$b = Bool::False;
say $b; # True


say 42.Bool;   # True

my $pi = 3.14;
say $pi.Bool;  # True

say 0.Bool;    # False
say "00".Bool; # True

类似地,你可以在变量上调用Int方法并获取整数 布尔值的表示(或任何其他类型的值):

say Bool::True.Int; # 1

1.6.3. Int

Int 类型用于承载任意大小的整数变量。 例如,以下任务中没有数字丢失:

my Int $x = 12389147319583948275874801735817503285431532;
say $x;


say :16<D0CF11E0>


my Int $x = 735_817_503_285_431_532;

当然,当你打印该值时,所有下划线都消失了。 在Int对象上,你可以调用一些其他方便的方法,例如,将数字转换为字符或检查手中的整数是否为素数(是的,is-prime 是内置方法!)。

my Int $a = 65;
say $a.chr; # A

my Int $i = 17;
say $i.is-prime; # True

say 42.is-prime; # False

1.6.4. 字符串

Str 毫无疑问是一个字符串。 在 Raku 中,有一些操作字符串的方法。 再次,你将它们称为对象上的方法。

my $str = "My string";

say $str.lc; # my string
say $str.uc; # MY STRING

say $str.index('t'); # 4

现在让我们得到一个字符串的长度。 编写 $str.length的天真尝试会产生错误消息。 但是,还提供了一个提示:

No such method 'length' for invocant of type 'Str'. Did you mean any of these?


say "περλ 6".chars; # 6

习惯使用字符串作为对象的新方法可能需要一些时间。 例如,这是如何将printf作为字符串上的方法调用的:

"Today is %02i %s %i\n".printf($day, $month, $year);

1.6.5. 数组


my @a = 1, 2, 3, 5, 7, 11;
say @a.Int; # 数组长度
say @a.Str; # 空格分割的值

如果打印数组,则将其值作为方括号中以空格分隔的列表。 或者,你可以将其插入字符串中。

my @a = 1, 2, 3, 5, 7, 11;

say @a;                 # [1 2 3 5 7 11]
say "This is @a: @a[]"; # This is @a: 1 2 3 5 7 11

1.6.6. 散列


my %hash = Language => 'Perl', Version => 6;

say %hash.elems;  # number of pairs in the hash
say %hash.keys;   # the list of the keys
say %hash.values; # the list of the values


(Version Language)
(6 Raku)


for %hash.pairs {
    say $_.key;
    say $_.value;
kv 方法返回一个包含交替键和哈希值的列表:
say %hash.kv # (Version 6 Language Perl)

2. 运算符

即使对于那些不熟悉Perl 5的人来说,Raku中许多操作符的含义也很明显。另一方面,有时操作符的行为包含一些你可能没有想到的微小细节。 在本章中,我们将列出一些运算符,并在必要时给出一些注释。 操作员可以根据其合成属性分为几组。 这些组是前缀,中缀,后缀和此处未涉及的一些其他类型的运算符(例如cir-cumflex,它是“汉堡包”运算符,就像一对括号)。

2.1. 前缀

前缀运算符是那些位于其操作数之前的运算符。 显然,前缀运算符只需要一个操作数。 在某些情况下,当操作符号位于两个操作数之间时,操作符号可用作中缀操作符。

2.1.1. !, not

! 是布尔否定运算符。

say !True;    # False
say !(1 == 2) # True

not 运算符执行相同但优先级较低。

say not False; # True

2.1.2. +

+ 是一元加运算符,它将操作数转换为数字上下文。 该操作等同于Numeric方法的调用。

my Str $price  = '4' ~ '2';
my Int $amount = +$price;

say $amount;        # 42
say $price.Numeric; # 42

我们将在第6章中看到一元加的一个重要用例:+$/。 该构造将Match类的对象转换为数字,该对象包含有关正则表达式的匹配部分的信息。

2.1.3. -

  • 是一元减号,它改变了它的操作数的符号。 因为此运算符以静默方式调用Numeric方法,所以它也可以转换上下文,就像使用一元加运算符一样。

my Str $price = '4' ~ '2';
say -$price; # -42

2.1.4. ?, so

? 是一个一元运算符,通过调用,将上下文转换为布尔值Bool方法对象。

say ?42; # True

第二种形式, so, 是一个一元运算符, 其优先级更低。

say so 42;   # True
say so True; # True
say so 0.0;  # False

2.1.5. ~

~ 将对象强制转换为字符串。 请注意,我们现在正在讨论前缀或一元运算符。 如果代字号被用作中缀(参见本章后面有关什么是中缀),它可以作为字符串连接运算符,但它仍然处理字符串。

my Str $a = ~42;
say $a.WHAT;  #(Str)


2.1.6. ++

++ 是增量的前缀运算符。 首先,完成增量,然后返回一个新值。

my $x = 41;
say ++$x; # 42


my $a = 'a';
say ++$a; # b

一个实际的例子是增加包含数字的文件名。 文件扩展名将继续存在,并且只会增加数字部分。

my $f = "file001.txt";

say $f; # file002.txt

say $f; # file003.txt

2.1.7.  — 

 — 是减量的前缀形式。 它的工作方式与++前缀完全相同,但当然会使操作数更小(无论是字符串还是数字)。

my $x = 42;
say --$x; # 41

2.1.8. +^

+^ 是具有二进制补码的按位求反运算符。

my $x = 10;
my $y = +^$x;
say $y; # -11 (但是不是 -10)


2.1.9. ?^

?^ 是逻辑否定运算符。 请注意,这不是一个按位否定。 首先,将参数转换为布尔值,然后否定结果。

my $x = 10;
my $y = ?^$x;

say $y;      # False
say $y.WHAT; # (Bool)

2.1.10. ^

^是范围创建运算符或所谓的upto运算符。 它创建一个范围(它是Range类型的一个对象),从0到给定值(不包括它)。

.print for ^5; # 01234


.print for 0..4; # 01234

2.1.11. |

| 将复合对象展平为列表。 例如,当你将列表传递给子例程时,应该使用此运算符,子例程需要一个标量列表:

sub sum($a, $b) {
    $a + $b

my @data = (10, 20);
say sum(|@data); # 30

如果没有 | 运算符,编译器将报告错误,因为子例程需要两个标量,并且不能接受数组作为参数:

Calling sum(Positional) will never work with declared signature ($a, $b)

2.1.12. temp

temp 创建一个临时变量并在范围的末尾恢复其值(就像它在Perl 5中的本地内置运算符一样)。

my $x = 'x';
    temp $x = 'y';
    say $x; # y
say $x;


2.1.13. let

let 是一个前缀运算符,类似于temp,但可以正常使用异常。 如果由于异常而留下范围,则将恢复变量的先前值。

my $var = 'a';
try {
    let $var = 'b';
say $var; # a

使用 die,此示例代码将打印初始值a。 如果注释掉骰子的调用,则对b的赋值的效果将保持不变,并且该变量将包含try块之后的值b。 let 关键字看起来类似于我和我们的声明符,但它是一个前缀运算符。

2.2. 后缀


2.2.1. ++

++ 是一个后缀增量。 在表达式中使用当前值之后,将更改值。

say $x = 42;
say $x++; # 42
say $x;   # 43

2.2.2.  — 

 — 是后缀自减。


my $filename = 'file01.txt';
for 1..10 {
    say $filename++;

此示例使用递增的数字打印文件名列表:file01.txt,file02.txt,…​ file10.txt。

2.3. 方法后缀

Raku中有一些语法元素,以点开头。 这些运算符可能看起来像一个后缀运算符,但它们都是在对象上调用方法的形式。 与Perl 5不同,点操作符不执行任何字符串连接。

2.3.1. .

.method 在变量上调用方法。 这适用于真实对象和那些不是任何类的实例的变量,例如整数等内置类型。

say "0.0".Numeric; # 0
say 42.Bool; # True

class C {
    method m() {say "m()"}
my $c = C.new;
$c.m(); # m()

2.3.2. .=

.=method 是对象的方法的变异调用。 调用 $x.=method 与更详细的任务相同 $x = $x.method。 在下面的示例中,$o容器最初包含C类的对象,但在$o.=m()之后,该值将替换为D类的实例。

class D { }

class C {
    method m() {
        return D.new;

my $o = C.new;
say $o.WHAT; # (C)

say $o.WHAT; # (D)

2.3.3. .^

^method 在对象的元对象上调用方法。 元对象是HOW类的一个实例,包含有关该对象的一些其他信息。 应用于$i变量的以下两个操作是等效的,并打印可用于Int变量的方法列表。
my Int $i;
say $i.^methods();
say $i.HOW.methods($i);

2.3.4. .?

?method 如果定义了方法,则调用方法。 如果对象没有具有给定名称的方法,则返回 Nil。
class C {
    method m() {'m'}

my $c = C.new();
say $c.?m(); # m
say $c.?n(); # Nil

2.3.5. .+

+method 尝试在对象上调用具有给定名称的所有方法。 例如,当实例是对象层次结构的一部分并且其父实例也具有相同名称的方法时,可以使用此方法。 有关第4章中的类和类层次结构的更多信息。
class A {
    method m($x) {"A::m($x)"}
class B is A {
    method m($x) {"B::m($x)"}

my $o = B.new;
my @a = $o.+m(7);
say @a; # 打印 [B::m(7) A::m(7)]

这里,$o 对象在它自己的B类和它的类中都有m方法,父类A. $o.+m(7) 调用这两种方法并将其结果放入列表中。 如果未定义方法,则将引发异常。

2.3.6. .*

2.4. 中缀运算符

*method 使用给定的方法名称调用所有方法,并返回包含结果的parcel。 如果未定义方法,则返回空列表。 在其余部分,它的行为类似于 .+ 运算符。

中缀运算符放在两个操作数之间的程序中。 大多数中缀运算符都是二进制运算符,并且只有一个三元运算符,它需要三个操作数。 二元运算符的最简单示例是加法运算符+。 在右侧和左侧,它需要两个值,例如,两个变量:$a + $b。 重要的是要理解相同的符号或相同的字符序列可以是中缀或前缀操作符,具体取决于上下文。 在带加号的示例中,一元对应是一元加运算符,它将操作数强制转换为数字:+$str。

2.4.1. 算数运算符

+, -, *, /

+,-,* 和 / 是执行相应算术运算的运算符,不需要任何注释。 使用 Raku 时,请记住在执行操作之前,如果必要,操作将自动转换为数字类型。


% 是模运算符,返回整数除法的余数。 如有必要,首先将操作数转换为整数。

div, mod

div 是整数除法运算符。 如果浮点被截断,则结果舍入为前一个较低的整数。

say 10 div 3;  # 3
say -10 div 3; # 4

mod 是模的另一种形式:

say 10 % 3;   # 1
say 10 mod 3; # 1

与 / 和 % 运算符不同,div 和 mod 形式不会将操作数强制转换为数值。 比较以下两个例子。

say 10 % "3" # 1

使用 mod 运算符, 则出现错误:

say 10 mod "3";
Calling 'infix:<mod>' will never work with argument types  (Int, Str)
Expected any of: :(Real $a, Real $b)


say 10 mod +"3" # 1

或调用 .Int 方法

say 10 mod "3".Int; # 1

%% 是所谓的整除运算符:它告诉给定的操作数对是否可能没有余数的整数除法。

say 10 %% 3; # False
say 12 %% 3; # True
+&, +|, +^

&,! |和!+ ^是乘法的按位操作数,加法, 和XOR操作。 运算符中的加号表示如果需要,操作数将转换为整数类型。

?|, ?&, ?^

?|,!?&,和?^!将操作数转换为布尔类型(因此?中的?) 运算符名称)并执行OR,AND和XOR的逻辑运算。

+<, +>

+ <和 +> 是左右移位运算符。

say 8 +< 2;    # 32
say 1024 +> 8; # 4
== !=
<, >, ⇐, >=

2.4.2. 字符串运算符

eq, ne
lt, gt, le, ge

2.4.3. 通用比较运算符

before, after

2.5. 列表运算符

2.5.1. xx

2.5.2. Z

2.5.3. X

2.6. Junction 运算符

2.6.1. |, &, ^

2.7. 短路运算符

2.7.1. &&

2.7.2. ||

2.7.3. ^^

2.7.4. //

2.8. 其它中缀运算符

2.8.1. min, max

2.8.2. ?? !!

2.8.3. =

2.8.4. ⇒

2.8.5. ,

2.8.6. :

2.9. 元运算符

2.9.1. 赋值

2.9.2. 否定

2.9.3. 翻转运算符

2.9.4. 化简

2.9.5. 交叉运算符

2.9.6. Zip 元运算符

2.10. 超运算符

2.10.1. >>>> <<<< <<>> >><<

3. 正则表达式和 Grammars

Raku 中的 grammars 是众所周知的正则表达式的"下一个级别"。 Grammars 可以让你创建更复杂的文本解析器。 只使用 Raku 提供的 grammars 设施,即可在没有任何外部帮助的情况下创建新的特定领域的语言(DSL),语言翻译器或解释器。

3.1. 正则表达式

事实上,Raku 把正则表达式叫做正则。 基本语法与 Perl 5 略有不同,但大多数元素(如量词 * 或 +)看起来仍然很熟悉。 regex 关键字用于构建正则表达式。 让我们为工作日的短名称创建一个正则表达式。

my regex weekday
    {[Mon | Tue | Wed | Thu | Fri  | Sat | Sun]};


你可以在其他正则表达式中使用命名的正则表达式,方法是在一对尖括号中引用它的名称。 要将字符串与正则表达式匹配,请使用 smartmatch 运算符(~~)。

say 'Thu' ~~ m/<weekday>/;
say 'Thy' ~~ m/<weekday>/;


  weekday => 「Thu」

匹配的结果是 Match 类型的对象。 当你打印它时,你会在小方括号 「…​」 内看到所匹配到的子字符串 。

正则表达式是最简单的命名结构。 除此之外,还有 rules 和 tokens(因此,关键字是 ruletoken)。

token 与 rule 的不同之处在于它们如何处理空格。 在 rule 中,空格是正则表达式的一部分。 在 token 中,空格只是视觉分隔符。 我们将在下面的示例中看到更多相关信息。

my token number_token { <[\d]> <[\d]> }
my rule  number_rule  { <[\d]> <[\d]> }


<[…​]> 结构创建一个字符类。在上面的例子中, 两个字符的字符串 42 匹配 number_token token 但是不匹配 number_rule rule。

say 1 if "42" ~~ /<number_token>/;
say 1 if "42" ~~ /<number_rule>/;

3.2. $/ 对象

正如我们刚刚看到的,智能匹配运算符将字符串与正则表达式进行比较会返回一个 Match 类型的对象。 该对象存储在 $/ 变量中。 它还包含所有匹配的子字符串。 为了保留(捕获)子字符串,需要使用一对圆括号。 第一个匹配索引为 0,你可以使用完整语法 $/[0] 或缩短的 $0 来将其作为数组元素进行访问。

请记住,即使是 $0$0 等单独的元素仍然包含 Match 类型的对象。 要将它们转换为字符串或数字,可以使用强制语法。 例如,~$0 将对象转换为字符串,+$0 将对象转换为整数。

'Wed 15' ~~ /(\w+) \s (\d+)/;
say ~$0; # Wed
say ~$1; # 15

3.3. Grammars

Grammars 是正则表达式的发展。 从语法上讲,grammar 定义类似于类,但使用关键字 grammar。 在 grammar 里面,它包含 tokens 和 rules。 在下一节中,我们将在示例中探索 grammar。

3.3.1. 简单的解析器

Grammar 应用的第一个例子是定义赋值操作并包含打印指令的小语言的 grammar。以下是此语言的程序示例。

x = 42;
y = x;
print x;
print y;
print 7;

让我们开始编写该语言的 grammar。 首先,我们必须表达一个事实,即程序是由分号分隔的一系列语句。 因此,在顶层语法看起来像这样:

grammar Lang {
    rule TOP {
        ^ <statements> $
    rule statements {
        <statement>+ %% ';'

在这里,Lang 是 grammar 的名称,而 TOP 是解析将开始的起始规则。规则的内容是由一对符号 ^$ 包围的正则表达式,用于将规则绑定到文本的开头和结尾。换句话说,整个程序应该匹配 TOP 规则。规则的核心部分 <statements> 引用了另一条规则。规则将忽略其各部分之间的所有空格。因此,你可以自由地在 grammar 的定义中添加空格,以使其易于阅读。

第二条规则解释了 <statements> 的含义。<statements> 块是一系列单独的 statement。它应该包含至少一个 statement,如 + 量词所要求的那样,并且分隔符是分号。在 %% 符号后面是分隔符。在 grammar 中,这意味着指令之间必须有分隔符,但是你可以在最后一个之后省略分隔符。如果只有一个百分号字符而不是两个百分号字符,则规则也要求在最后一个语句之后有分隔符。

下一步是描述 statement。目前,我们的语言只有两个操作:赋值和打印。它们中的每一个都接受值或变量名。

rule statement {
    | <assignment>
    | <printout>

垂直条分隔备选分支,就像它在 Perl 5 中的正则表达式一样。为了使代码看起来更好看并简化维护,可以在第一个子规则之前添加额外的垂直条。 以下两个描述相同:

rule statement {
    | <printout>
rule statement {
    | <assignment>
    | <printout>

然后,让我们定义 assignmentprintout 的含义。

rule assignment {
    <identifier> '=' <expression>
rule printout {
    'print' <expression>

在这里,我们看到字符串字面量,即 '=''print'。 同样,它们周围的空格不会影响规则。

expression 与标识符(在我们的例子中是变量名)或常量值匹配。 因此,expressionidentifier 或没有附加字符串的 value

rule expression {
    | <identifier>
    | <value>

此时,我们应该编写标识符和值的规则。 对于那种 grammar,最好使用另一种名为 token 的方法。 在 token 中,空格很重要(那些与大括号相邻的空格除外)。


token identifier {

这里,<:alpha> 是包含所有字母字符的预定义字符类。


token value {

我们的第一个 grammar 已经完成。 现在可以使用它来解析文本文件。

my $parsed = Lang.parsefile('test.lang');

如果文件内容已经存储在变量中, 那么你可以使用 Lang.parse($str) 方法来解析它。(附录中有更多关于从文件中读取的内容)

如果解析成功, 即如果文件包含有效的文法, 那么 $parse 变量会包含一个 Match 类型的对象。可以把它转储出来(say $parsed)并看看里面是什么。

「x = 42;
y = x;
print x;
print y;
print 7;」
 statements => 「x = 42;
y = x;
print x;
print y;
print 7;」
  statement => 「x = 42」
   assignment => 「x = 42」
    identifier => 「x」
    expression => 「42」
     value => 「42」
  statement => 「y = x」
   assignment => 「y = x」
    identifier => 「y」
    expression => 「x」
     identifier => 「x」
  statement => 「print x」
   printout => 「print x」
    expression => 「x」
     identifier => 「x」
  statement => 「print y」
   printout => 「print y」
    expression => 「y」
     identifier => 「y」
  statement => 「print 7」
   printout => 「print 7」
    expression => 「7」
     value => 「7」

此输出对应于本节开头的示例程序。 它包含已解析程序的结构。 捕获的部分显示在括号 「…​」 中。 首先,打印整个匹配的文本。 实际上,由于 TOP 规则使用了一对 ^ …​ $ 结构,因此整个文本应该与规则匹配。

然后,打印解析树。 它从 <statements> 开始,然后 grammar 的其他部分完全按照文件中的程序包含的内容呈现。 在下一级别,你可以看到 identifiervalue token 的内容。

如果程序在文法上不正确,则该解析方法将返回空值(Any)。 如果只有程序的起始部分与规则匹配,则会发生同样的情况。

为方便起见,这是完整的 grammar:

grammar Lang {
    rule TOP        {
        ^ <statements> $
    rule statements {
        <statement>+ %% ';'
    rule statement  {
        | <assignment>
        | <printout>
    rule assignment {
        <identifier> '=' <expression>
    rule printout   {
        'print' <expression>
    rule expression {
        | <identifier>
        | <value>
    token identifier {
    token value {

3.3.2. 解释器

到目前为止,grammar 看到了程序的结构,并且可以判断它是否在 grammar 上是正确的,但它不会执行程序中包含的任何指令。 在本节中,我们将扩展解析器,以便它可以实际执行程序。

我们的示例语言使用变量和整数值。值是常量并描述自己。对于变量,我们需要创建一个存储。在最简单的情况下,所有变量都是全局变量,并且需要一个散列:my %var;

我们现在要实现的第一个 action 是赋值。 它将获取值并将其保存在变量存储中。 在 grammar 的 assignment rule 中,期望在等号的右侧是一个 expression。 表达式可以是变量也可以是数字。为了简化变量名查找,让我们使 grammar 更复杂一些,并将赋值和打印规则分别拆分为两个备选项。

rule assignment {
    | <identifier> '=' <value>
    | <identifier> '=' <identifier>
rule printout {
    | 'print' <value>
    | 'print' <identifier>

3.4. Actions

Raku 中的 grammar 允许响应 rule 或 token 匹配的 action。 action 是在解析的文本中找到相应的 rule 或 token 时执行的代码块。 action 会接收一个对象 $/,你可以在其中查看匹配的详细信息。 例如,$<identifier> 的值将包含 Match 类型的对象,其中包含有关 grammar 实际消耗的子字符串的信息。

rule assignment {
    | <identifier> '=' <value>
          { say "$<identifier>=$<value>" }
    | <identifier> '=' <identifier>

如果你使用上面的 action 更新 grammar 并针对同一示例文件运行程序,那么你将在输出中看到子字符串 x=42

Match 对象在用双引号插值时转换为字符串,如给定示例中所示:"$<identifier>=$<value>"。 要使用带引号的字符串外部的文本值,你应该进行明确的类型转换:

rule assignment {
    | <identifier> '=' <value>
          {%var{~$<identifier>} = +$<value> }
    | <identifier> '=' <identifier>

到目前为止,我们已经有了一个为变量赋值的 action,并且可以处理文件的第一行。 变量存储将包含 {x ⇒ 42} 对。

assignment rule 的第二个备选项中,<identifier> 名称被提及了两次; 这就是为什么你可以引用它作为 $<identifier> 的数组元素的原因。

rule assignment {
    | <identifier> '=' <value>
          %var{~$<identifier>} = +$<value>
    | <identifier> '=' <identifier>
          %var{~$<identifier>[0]} =

对代码的这一添加使得可以解析两个变量的赋值:y = x%var 散列将包含两个值:{x ⇒ 42, y ⇒ 42}

或者,可以使用捕获圆括号。 在这种情况下,要访问捕获的子字符串,请使用特殊变量,例如 $0

rule assignment {
    | (<identifier>) '=' (<value>)
          %var{$0} = +$1
    | (<identifier>) '=' (<identifier>)
          %var{$0} = %var{$1}

这里,当变量用作散列键时,不再需要一元运算符 ~ ,但仍需要 $1 之前的一元 + 以将 Match 对象转换为数字。

同样,给打印创建 action。

rule printout {
    | 'print' <value>
          say +$<value>
    | 'print' <identifier>
          say %var{$<identifier>}

现在,grammar 能够完成语言设计所需的所有 action,并将打印请求的值:


只要我们在规则中使用捕获圆括号,解析树就会包含名为 01 的条目以及命名字符串,例如 identifier。 在解析 y = x 字符串时你可以清楚地看到它:

statement => 「y = x」
 assignment => 「y = x」
  0 => 「y」
   identifier => 「y」
  1 => 「x」
   identifier => 「x」


my %var;

grammar Lang {
    rule TOP {
        ^ <statements> $
    rule statements {
        <statement>+ %% ';'
    rule statement {
        | <assignment>
        | <printout>
    rule assignment {
        | (<identifier>) '=' (<value>)
              %var{$0} = +$1
        | (<identifier>) '=' (<identifier>)
              %var{$0} = %var{$1}
    rule printout {
        | 'print' <value>
              say +$<value>
        | 'print' <identifier>
              say %var{$<identifier>}
    token identifier {
    token value {


为方便起见,可以将 action 代码放在单独的类中。 当 action 更复杂并包含不止一两行代码时,这会有很大帮助。

要创建外部 action,请创建一个类,稍后将在调用 grammar 的 parseparsefile 方法时通过 :actions 参数引用该类。 与内置 action 一样,外部类中的 action 会接收 Match 类型的 $/ 对象。


grammar G {
    rule TOP {^ \d+ $}

class A {
    method TOP($/) {say ~$/}

G.parse("42", :actions(A));

Grammar G 和 action 类 A 都有一个名为 TOP 的方法。通用名称将 action 与相应的规则相关联。 当 grammar 解析提供的测试字符串并使用 ^ \d $ 规则消耗值 42 时,将触发 A::TOP action,并将 $/ 参数传递给它,并立即打印。

3.5. AST 和属性

现在,我们准备在将 assignmentprintout 规则分别分割成两个备选项之后再次简化 grammar。 困难在于如果没有拆分,就无法理解触发了哪个分支。 你需要从 value token 中读取值,或者从 identifier token 中获取变量名,并在变量存储中查找它。

Raku 的 grammar 提供了一种很好的机制,它在语言解析理论中很常见,即抽象语法树, 缩写为 AST。

首先,更新规则并从其中删除一些替代规则。 包含两个分支的唯一规则是 expression 规则。

rule assignment {
    <identifier> '=' <expression>
rule printout {
    'print' <expression>
rule expression {
    | <identifier>
    | <value>

在解析阶段构建的语法树可以包含前面步骤中计算的结果。 Match 对象有一个字段 ast,专门用于保持每个节点上的计算值。 可以简单地读取值以获得先前完成的 action 的结果。 树被称为抽象,因为计算值的方式不是很重要。 重要的是,当触发 action 时,你只需一个地点就可以获得完成 action 所需的结果。

该 action 可以通过调用 $/.make 方法保存自己的结果(并因此在树上进一步传递)。 你保存在那里的数据可以通过 made 字段访问,该字段具有同义词 ast

让我们填充 identifiervalue token 的语法树的属性。 与标识符的匹配产生变量名; 找到值时,action 会生成一个数字。 以下是 action 类的方法。

method identifier($/) {
method value($/) {

向前移动一步,在我们构建表达式的值的地方。 它可以是变量值或整数。

因为 expression 规则有两个备选项,第一项任务是了解哪一个匹配。 为此,检查 $/ 对象中是否存在相应的字段。

(如果在 action 方法的签名中使用推荐的变量名 $/ ,则可以以不同方式访问其字段。完整语法为 $/<identifier>,但是有另一个版本 $<identifier>。)

expression 方法的两个分支表现不同。 对于数字,它直接从捕获的子字符串中提取值。 对于变量,它从 %var 散列中获取值。 在这两种情况下,结果都使用 make 方法存储在 AST 中。

method expression($/) {
    if $<identifier> {
    else {

要使用尚未定义的变量,我们可以添加 defined-or 运算符以使用零值初始化变量。

$/.make(%var{$<identifier>} // 0);

现在,表达式将具有归属于它的值,但不再知道值的来源。 它可以是文件中的变量值或常量。 这使得 assignmentprintout action 更简单:

method printout($/) {
    say $<expression>.ast;

打印值所需的只是从 ast 字段中获取它。

对于 assignment,它有点复杂但仍然可以写成单行。

method assignment($/) {
    %var{$<identifier>} = $<expression>.made;

该方法获取 $/ 对象并使用其 identifierexpression 元素的值。 第一个转换为字符串,并成为 %var 散列的键。 从第二个开始,我们通过获取 made 属性来获取值。

最后,让我们停止使用全局变量存储并将哈希移动到 action 类中(我们在 grammar 本身中不需要它)。因此它将被声明为 has %!var; 并在 action 主体中用作私有键变量:%!var{…​}

在此更改之后,在使用 grammar 对其进行解析之前,创建 actions 类的实例非常重要:


以下是带有 action 的解析器的完整代码。

grammar Lang {
    rule TOP {
        ^ <statements> $
    rule statements {
        <statement>+ %% ';'
    rule statement {
        | <assignment>
        | <printout>
    rule assignment {
        <identifier> '=' <expression>
    rule printout {
        'print' <expression>
    rule expression {
        | <identifier>
        | <value>
    token identifier {
    token value {

class LangActions {
    has %var;

    method assignment($/) {
        %!var{$<identifier>} = $<expression>.made;
    method printout($/) {
        say $<expression>.ast;
    method expression($/) {
        if $<identifier> {
            $/.make(%!var{$<identifier>} // 0);
        else {
    method identifier($/) {
    method value($/) {


3.6. 计算器

在考虑语言解析器时,实现计算器就像编写一个 "Hello,World!"程序。 在本节中,我们将为计算器创建一个 grammar,可以处理四个算术运算符和圆括号。计算器示例的隐藏优势是你必须教它遵循运算符优先级和嵌套表达式。

我们的计算器 grammar 将期望在顶层有单个表达式。 运算符的优先级将通过传统的 grammar 构建方法自动实现,其中表达式包括项和因式。


<term>+ %% ['+'|'-']

这里使用了 Raku 的 %% 符号。你可以使用更传统的量词来重写该规则:

<term> [['+'|'-'] <term>]*


<factor>+ %% ['*'|'/']

项和因式都可以包含值或圆括号组。 组基本上是另一种表达方式。

rule group {
    '(' <expression> ')'

此规则引用 expression 规则,因此可以启动另一个递归循环。

是时候引入增强的 value token 了,以便它接受浮点值。 这个任务很简单; 它只需要创建一个与尽可能多的格式匹配的正则表达式。我将跳过负数和科学记数法格式的数字。

token value {
    | \d+['.' \d+]*
    | '.' \d+

这里是计算器的完整 grammar:

grammar Calc {
    rule TOP {
        ^ <expression> $
    rule expression {
        | <term>+ %% $<op>=(['+'|'-'])
        | <group>
    rule term {
        <factor>+ %% $<op>=(['*'|'/'])
    rule factor {
        | <value>
        | <group>
    rule group {
        '(' <expression> ')'
    token value {
        | \d+['.' \d+]*
        | '.' \d+

注意某些规则中的 $<op>=(…​) 结构。 这是命名捕获。 该名称通过 $/ 变量简化了对值的访问。 在这种情况下,你可以将值作为 $<op>,并且在更新规则后不必担心变量名称的可能更改,因为它发生在编号变量 $0$1 等处。

现在,为编译器创建 action。 在 TOP 级别,规则返回计算后的值,它从 expressionast 字段中获取。

class CalcActions {
    method TOP($/) {
        $/.make: $<expression>.ast

基础规则 groupsvalue 的 action 就像我们刚才看到的一样简单。

method group($/) {
    $/.make: $<expression>.ast

method value($/) {
    $/.make: +$/

其余的 action 有点复杂。 factor action 包含两个可选分支,就像 factor 规则一样。

method factor($/) {
    if $<value> {
        $/.make: +$<value>
    else {
        $/.make: $<group>.ast

转到 term action。 在这里,我们必须处理具有可变长度的列表。 规则的正则表达式具有 + 量词,这意味着它可以捕获一个或多个元素。 此外,由于规则处理乘法运算符和除法运算符,因此必须区分这两种情况。 $<op> 变量包含 * 或 / 字符。


expression => 「3*4*5」
 term => 「3*4*5」
  factor => 「3」
   value => 「3」
  op => 「*」
  factor => 「4」
   value => 「4」
  op => 「*」
  factor => 「5」
   value => 「5」

正如你所看到的,顶层有 factorop 条目。 你将在 action 中看到 $<factor>$<op> 的值。 至少有一个 $<factor> 将始终可用。 节点的值已经知道并且在 ast 属性中可用。 因此,你需要做的就是遍历这两个数组的元素并执行乘法或除法。

method term($/) {
    my $result = $<factor>[0].ast;

    if $<op> {
        my @ops = $<op>.map(~*);
        my @vals = $<factor>[1..*].map(*.ast);

        for 0..@ops.elems - 1 -> $c {
            if @ops[$c] eq '*' {
                $result *= @vals[$c];
            else {
                $result /= @vals[$c];
    $/.make: $result;

在此代码片段中,星号出现在占位符的新角色中,该角色告诉 Perl 它应该处理此时可以获取的数据。 这听起来很奇怪,但它完美而直观地工作。

带有运算符符号列表的 @ops 数组包含我们在对 $<op> 的值进行字符串化后得到的元素:

my @ops = $<op>.map(~*);

值本身将落在 @vals 数组中。 为了确保两个数组 @vals@ops 的值彼此对应,得到从第二个元素开始的 $<factor> 的切片:

my @vals = $<factor>[1..*].map(*.ast);

最后,expression action 要么采用 group 的计算值,要么执行加法和减法的序列。 该算法接近 term action 中的一个。

method expression($/) {
    if $<group> {
        $/.make: $<group>.ast
    else {
        my $result = $<term>[0].ast;

        if $<op> {
            my @ops = $<op>.map(~*);
            my @vals = $<term>[1..*].map(*.ast);
            for 0..@ops.elems -1 -> $c {
                if @ops[$c] eq '+' {
                    $result += @vals[$c];
                else {
                    $result -= @vals[$c];
        $/.make: $result;

计算器的大部分代码都已准备就绪。 现在,我们需要从用户读取字符串,将其传递给解析器,然后打印结果。

my $calc = Calc.parse(

say $calc.ast;


$ raku calc.pl '39 + 3.14 * (7 - 18 / (505 - 502)) - .14'


在 github.com/ash/lang 上,你可以找到本章演示的代码的延续,它结合了语言翻译器和计算器,允许用户在变量赋值和打印指令中编写算术表达式。 这是一个解释器可以处理的示例:

x = 40 + 2;
print x;

y = x - (5/2);
print y;

z = 1 + y * x;
print z;

print 14 - 16/3 + x;