字面量表达式
Syntax
LiteralExpression →
CHAR_LITERAL
| STRING_LITERAL
| RAW_STRING_LITERAL
| BYTE_LITERAL
| BYTE_STRING_LITERAL
| RAW_BYTE_STRING_LITERAL
| C_STRING_LITERAL
| RAW_C_STRING_LITERAL
| INTEGER_LITERAL
| FLOAT_LITERAL
| true
| false
_字面量表达式_是由单个词法单元(而不是词法单元序列)组成的表达式,它立即直接表示它求值到的值,而不是通过名称或其他求值规则引用它。
字面量是常量表达式的一种形式,因此(主要)在编译时求值。
前面描述的每种词法字面量形式都可以组成字面量表达式,关键字 true 和 false 也可以。
#![allow(unused)]
fn main() {
"hello"; // string type
'5'; // character type
5; // integer type
}
在下面的描述中,词法单元的_字符串表示_是输入中与 Lexer 语法片段中词法单元的产生式匹配的字符序列。
Note
此字符串表示从不包含紧跟在
U+000A(LF) 之后的字符U+000D(CR):这对之前已被转换为单个U+000A(LF)。
转义
下面的文本字面量表达式的描述使用了几种形式的_转义_。
每种转义形式的特征是:
- 转义序列:以
U+005C(\)开头的字符序列 - 转义值:单个字符或空字符序列
在下面的转义定义中:
- _八进制数字_是范围 [
0-7] 中的任何字符。 - _十六进制数字_是范围 [
0-9]、[a-f] 或 [A-F] 中的任何字符。
简单转义
下表第一列中出现的每个字符序列都是转义序列。
在每种情况下,转义值是第二列相应条目中给出的字符。
| 转义序列 | 转义值 |
|---|---|
\0 | U+0000 (NUL) |
\t | U+0009 (HT) |
\n | U+000A (LF) |
\r | U+000D (CR) |
\" | U+0022 (QUOTATION MARK) |
\' | U+0027 (APOSTROPHE) |
\\ | U+005C (REVERSE SOLIDUS) |
8 位转义
转义序列由 \x 后跟两个十六进制数字组成。
转义值是其 Unicode 标量值是将转义序列中的最后两个字符解释为十六进制整数的结果的字符,就像使用 u8::from_str_radix 以 16 为基数一样。
Note
因此,转义值的 Unicode 标量值在
u8范围内。
7 位转义
转义序列由 \x 后跟一个八进制数字然后一个十六进制数字组成。
转义值是其 Unicode 标量值是将转义序列中的最后两个字符解释为十六进制整数的结果的字符,就像使用 u8::from_str_radix 以 16 为基数一样。
Unicode 转义
转义序列由 \u{ 后跟一系列字符(每个字符都是十六进制数字或 _),然后是 } 组成。
转义值是其 Unicode 标量值是将转义序列中包含的十六进制数字解释为十六进制整数的结果的字符,就像使用 u32::from_str_radix 以 16 为基数一样。
Note
CHAR_LITERAL 或 STRING_LITERAL 词法单元的允许形式确保存在这样的字符。
字符串继续转义
转义序列由 \ 紧接着 U+000A (LF),以及下一个非空白字符之前的所有后续空白字符组成。为此,空白字符是 U+0009 (HT)、U+000A (LF)、U+000D (CR) 和 U+0020 (SPACE)。
转义值是空字符序列。
Note
此形式转义的效果是字符串继续跳过后续空白,包括额外的换行符。因此
a、b和c相等:#![allow(unused)] fn main() { let a = "foobar"; let b = "foo\ bar"; let c = "foo\ bar"; assert_eq!(a, b); assert_eq!(b, c); }跳过额外的换行符(如示例 c)可能令人困惑和意外。此行为将来可能会调整。在做出决定之前,建议避免依赖行继续跳过多个换行符。有关更多信息,请参阅此问题。
字符字面量表达式
字符字面量表达式由单个 CHAR_LITERAL 词法单元组成。
表达式的类型是原始 char 类型。
词法单元不能有后缀。
词法单元的_字面量内容_是词法单元的字符串表示中第一个 U+0027(')之后和最后一个 U+0027(')之前的字符序列。
字面量表达式的_表示字符_从字面量内容派生如下:
- 如果字面量内容是以下形式的转义序列之一,则表示字符是转义序列的转义值:
- 否则,表示字符是组成字面量内容的单个字符。
表达式的值是对应于表示字符的 Unicode 标量值的 char。
Note
CHAR_LITERAL 词法单元的允许形式确保这些规则总是产生单个字符。
字符字面量表达式的示例:
#![allow(unused)]
fn main() {
'R'; // R
'\''; // '
'\x52'; // R
'\u{00E6}'; // LATIN SMALL LETTER AE (U+00E6)
}
字符串字面量表达式
字符串字面量表达式由单个 STRING_LITERAL 或 RAW_STRING_LITERAL 词法单元组成。
表达式的类型是原始 str 类型的共享引用(具有 static 生命周期)。即,类型为 &'static str。
词法单元不能有后缀。
词法单元的_字面量内容_是词法单元的字符串表示中第一个 U+0022(")之后和最后一个 U+0022(")之前的字符序列。
字面量表达式的_表示字符串_是从字面量内容派生的字符序列,如下所示:
-
如果词法单元是 STRING_LITERAL,则字面量内容中出现的以下形式的每个转义序列都被替换为转义序列的转义值。
这些替换按从左到右的顺序进行。例如,词法单元
"\\x41"被转换为字符\x41。
- 如果词法单元是 RAW_STRING_LITERAL,则表示字符串与字面量内容相同。
表达式的值是对静态分配的 str 的引用,包含表示字符串的 UTF-8 编码。
字符串字面量表达式的示例:
#![allow(unused)]
fn main() {
"foo"; r"foo"; // foo
"\"foo\""; r#""foo""#; // "foo"
"foo #\"# bar";
r##"foo #"# bar"##; // foo #"# bar
"\x52"; "R"; r"R"; // R
"\\x52"; r"\x52"; // \x52
}
字节字面量表达式
字节字面量表达式由单个 BYTE_LITERAL 词法单元组成。
表达式的类型是原始 u8 类型。
词法单元不能有后缀。
词法单元的_字面量内容_是词法单元的字符串表示中第一个 U+0027(')之后和最后一个 U+0027(')之前的字符序列。
字面量表达式的_表示字符_从字面量内容派生如下:
- 否则,表示字符是组成字面量内容的单个字符。
表达式的值是表示字符的 Unicode 标量值。
Note
BYTE_LITERAL 词法单元的允许形式确保这些规则总是产生单个字符,其 Unicode 标量值在
u8范围内。
字节字面量表达式的示例:
#![allow(unused)]
fn main() {
b'R'; // 82
b'\''; // 39
b'\x52'; // 82
b'\xA0'; // 160
}
字节字符串字面量表达式
字节字符串字面量表达式由单个 BYTE_STRING_LITERAL 或 RAW_BYTE_STRING_LITERAL 词法单元组成。
表达式的类型是元素类型为 u8 的数组的共享引用(具有 static 生命周期)。即,类型为 &'static [u8; N],其中 N 是下面描述的表示字符串中的字节数。
词法单元不能有后缀。
词法单元的_字面量内容_是词法单元的字符串表示中第一个 U+0022(")之后和最后一个 U+0022(")之前的字符序列。
字面量表达式的_表示字符串_是从字面量内容派生的字符序列,如下所示:
-
如果词法单元是 BYTE_STRING_LITERAL,则字面量内容中出现的以下形式的每个转义序列都被替换为转义序列的转义值。
这些替换按从左到右的顺序进行。例如,词法单元
b"\\x41"被转换为字符\x41。
- 如果词法单元是 RAW_BYTE_STRING_LITERAL,则表示字符串与字面量内容相同。
表达式的值是对静态分配的数组的引用,包含表示字符串中字符的 Unicode 标量值,按相同顺序。
Note
BYTE_STRING_LITERAL 和 RAW_BYTE_STRING_LITERAL 词法单元的允许形式确保这些规则总是产生在
u8范围内的数组元素值。
字节字符串字面量表达式的示例:
#![allow(unused)]
fn main() {
b"foo"; br"foo"; // foo
b"\"foo\""; br#""foo""#; // "foo"
b"foo #\"# bar";
br##"foo #"# bar"##; // foo #"# bar
b"\x52"; b"R"; br"R"; // R
b"\\x52"; br"\x52"; // \x52
}
C 字符串字面量表达式
C 字符串字面量表达式由单个 C_STRING_LITERAL 或 RAW_C_STRING_LITERAL 词法单元组成。
表达式的类型是标准库 CStr 类型的共享引用(具有 static 生命周期)。即,类型为 &'static core::ffi::CStr。
词法单元不能有后缀。
词法单元的_字面量内容_是词法单元的字符串表示中第一个 " 之后和最后一个 " 之前的字符序列。
字面量表达式的_表示字节_是从字面量内容派生的字节序列,如下所示:
- 如果词法单元是 C_STRING_LITERAL,则字面量内容被视为一系列项,每项要么是单个 Unicode 字符(不是
\),要么是转义。项序列按如下方式转换为字节序列:- 每个单个 Unicode 字符贡献其 UTF-8 表示。
- 每个简单转义贡献其转义值的 Unicode 标量值。
- 每个8 位转义贡献一个包含其转义值的 Unicode 标量值的字节。
- 每个 unicode 转义贡献其转义值的 UTF-8 表示。
- 每个字符串继续转义不贡献字节。
- 如果词法单元是 RAW_C_STRING_LITERAL,则表示字节是字面量内容的 UTF-8 编码。
Note
C_STRING_LITERAL 和 RAW_C_STRING_LITERAL 词法单元的允许形式确保表示字节从不包含空字节。
表达式的值是对静态分配的 CStr 的引用,其字节数组包含表示字节后跟空字节。
C 字符串字面量表达式的示例:
#![allow(unused)]
fn main() {
c"foo"; cr"foo"; // foo
c"\"foo\""; cr#""foo""#; // "foo"
c"foo #\"# bar";
cr##"foo #"# bar"##; // foo #"# bar
c"\x52"; c"R"; cr"R"; // R
c"\\x52"; cr"\x52"; // \x52
c"æ"; // LATIN SMALL LETTER AE (U+00E6)
c"\u{00E6}"; // LATIN SMALL LETTER AE (U+00E6)
c"\xC3\xA6"; // LATIN SMALL LETTER AE (U+00E6)
c"\xE6".to_bytes(); // [230]
c"\u{00E6}".to_bytes(); // [195, 166]
}
整数字面量表达式
整数字面量表达式由单个 INTEGER_LITERAL 词法单元组成。
如果词法单元有后缀,后缀必须是原始整数类型之一的名称:u8、i8、u16、i16、u32、i32、u64、i64、u128、i128、usize 或 isize,表达式具有该类型。
如果词法单元没有后缀,表达式的类型由类型推断确定:
- 如果可以从周围的程序上下文中_唯一_确定整数类型,则表达式具有该类型。
- 如果程序上下文对类型约束不足,则默认为有符号 32 位整数
i32。
- 如果程序上下文对类型过度约束,则被视为静态类型错误。
整数字面量表达式的示例:
#![allow(unused)]
fn main() {
123; // type i32
123i32; // type i32
123u32; // type u32
123_u32; // type u32
let a: u64 = 123; // type u64
0xff; // type i32
0xff_u8; // type u8
0o70; // type i32
0o70_i16; // type i16
0b1111_1111_1001_0000; // type i32
0b1111_1111_1001_0000i64; // type i64
0usize; // type usize
}
表达式的值从词法单元的字符串表示确定如下:
-
通过检查字符串的前两个字符来选择整数基数,如下所示:
0b表示基数 20o表示基数 80x表示基数 16- 否则基数为 10。
- 如果基数不是 10,则从字符串中删除前两个字符。
- 从字符串中删除任何后缀。
- 从字符串中删除任何下划线。
- 字符串被转换为
u128值,就像使用u128::from_str_radix以选定基数一样。如果值不适合u128,则是编译器错误。
u128值通过数值类型转换转换为表达式的类型。
Note
如果字面量不适合表达式的类型,最终的类型转换将截断字面量的值。
rustc包含一个名为overflowing_literals的 lint 检查,默认为deny,会拒绝发生这种情况的表达式。
浮点数字面量表达式
浮点数字面量表达式有两种形式之一:
- 单个 FLOAT_LITERAL 词法单元
- 单个 INTEGER_LITERAL 词法单元,具有后缀且没有基数指示符
如果词法单元有后缀,后缀必须是原始浮点类型之一的名称:f32 或 f64,表达式具有该类型。
如果词法单元没有后缀,表达式的类型由类型推断确定:
- 如果可以从周围的程序上下文中_唯一_确定浮点类型,则表达式具有该类型。
- 如果程序上下文对类型约束不足,则默认为
f64。
- 如果程序上下文对类型过度约束,则被视为静态类型错误。
浮点数字面量表达式的示例:
#![allow(unused)]
fn main() {
123.0f64; // type f64
0.1f64; // type f64
0.1f32; // type f32
12E+99_f64; // type f64
5f32; // type f32
let x: f64 = 2.; // type f64
}
表达式的值从词法单元的字符串表示确定如下:
- 从字符串中删除任何后缀。
- 从字符串中删除任何下划线。
- 字符串被转换为表达式的类型,就像使用
f32::from_str或f64::from_str。
Note
例如,
-1.0是取反运算符对字面量表达式1.0的应用,而不是单个浮点数字面量表达式。
Note
inf和NaN不是字面量词法单元。可以使用f32::INFINITY、f64::INFINITY、f32::NAN和f64::NAN常量代替字面量表达式。在rustc中,足够大以至于被求值为无穷大的字面量将触发overflowing_literalslint 检查。
布尔字面量表达式
布尔字面量表达式由关键字 true 或 false 之一组成。
表达式的类型是原始布尔类型,其值为:
- 如果关键字是
true则为 true - 如果关键字是
false则为 false