C#语法文本字面量
在日常生活中,文本用来表示除了数字以外的内容。例如有一个叫“比尔”的人,他的职位为“科长”。那么,“比尔”和“科长”都可以称为文本。在计算机里,现实世界中的文本通常被称为字符和字符串。例如,“比尔”中的每个汉字都是一个字符。而整体构成一个字符串。“科长”也是如此。
字符和字符串的写作规范
上面,我们看到的是常见的文本字面量。但是,很多时候数字内容表达的并不一定是数值。例如,比尔的电话号码是13466668888。对于“13466668888”来说,我们不会理解为一百三十四亿六千六百六十六万八千八百八十八,而是当成一个电话号来理解。由于计算机能力有限,为了避免这类信息对计算机造成困扰,程序对字符和字符串的表示有以下规定:
- 字符是由单引号(')括起来的单个的字母、数字、字或者符号。
- 字符串可以表示一个字符序列。
- 字符串使用一对双引号(")与多个字符组合。
- 字符串的双引号中可以有任意多个字符。
根据这个规范,如果要在程序中表示字母a,需要写为'a'。字符中只能包含一个字符,因此字符'a'长度为1。如果要在程序中表示比尔的电话号码,必须写为"13466668888"。该字符串的长度为11,因为包含的字符个数为11,而双引号是字符串格式符号,不能算作字符串长度数。
特殊的字符和字符串——转义字符
有时候,需要在字符串中使用特殊字符,例如字符串abc"s。在代码中字符串"abc"s"会产生错误,编译器无法辨认字符串的具体内容。为了解决这个问题,需要使用转义字符。转义字符通过反斜杠“\”与普通字符的组合,来表示一些特殊的字符。转义字符中至少包含两个字符,第一个字符是转义符号“\”,第二个字符是需要表示的字符。常用的转义字符有两种:表示格式的转义字符和表示控制代码的转义字符。
1.表示格式
为了构成字符和字符串,使用了双引号(")和单引号(')。而为了构成转义字符,又使用了反斜杠(\)。如果字符串中需要包含这三个字符,需要使用转义字符如表1.1所示。
表1.1 表示格式的转义字符列表
转义序列 | 产生的字符 |
\' | 单引号 |
\" | 双引号 |
\\ | 反斜杠 |
【示例1-4】有下列文本内容,需要在程序中使用字符串表示。
I love C#.
I’m studying C#.
在这个文本内容中,第一行内容表达为字符串为"I love C#.",该字符串长度为10(空格与.都算作一个字符)。而第二行内容中有一个单引号,所以需要使用转义字符表达为"I\'m studying C#.",该字符串长度为16。
2.表示控制代码
在文本数据中,会出现一些特殊的符号,如换行符、退格等。这些符号无法看到,但是用来控制文本的格式。这类字符由于无法书写,所以必须使用转义字符表示如表1.2所示。
表1.2 表示控制代码的转义字符序列
转义序列 | 产生的字符 |
\a | 警报 |
\b | 退格 |
\f | 换页符 |
\n | 换行符 |
\r | 回车 |
\t | 水平制表符 |
\v | 垂直制表符 |
示例1-4中由于两个文本内容不在同一行,所以之间必须有“\n”来表示换行。因此,这两个文本的正确表示形式为"I love C#.\n I\'m studying C#."。这个字符串的长度为27。
更全面的表达方式——ASCII表
转义字符可以解决大部分的字符表达。但是还是有很多字符无法直接书写,也没有对应的转义字符。这个时候,只能使用ASCII进行表达。ASCII是基于拉丁字母(26个英语字母)的一套电脑编码系统,是现在最通用的单字节编码系统。使用ASCII表示字符的格式如表1.3所示。
表1.3 使用ASCII表示的字符
转义序列 | 产生的字符 |
\0 | 空字符 |
\ddd | 1~3位八进制数所代表的任意字符 |
\xhh | 1~2位十六进制数所代表的任意字符 |
在表1.3中,使用八进制表示字符时可以表示1~3位八进制数代表的任意字符,即该类转义字符总长度为2~4。使用十六进制表示字符时可以表示1~2位十六进制数代表的任意字符,即该类转义字符总长度为3~4,因为表示十六进制数时“\x”以开头。
【示例1-5】以下代码中使用了转义字符:
'\x2f'
'\013'
其中,\x表示后面的字符是十六进制数,\0表示后面的字符是八进制数。
为了更加全面地表示,这里给出了ASCII表的字符的0~127。具体如表1.4所示。
表1.4 ASCII表
十进制 | 十六进制 | 字符 | 十进制 | 十六进制 | 字符 | 十进制 | 十六进制 | 字符 | 十进制 | 十六进制 | 字符 |
0 | 00 |
| 32 | 20 | [空格] | 64 | 40 | @ | 96 | 60 | ` |
1 | 01 |
| 33 | 21 | ! | 65 | 41 | A | 97 | 61 | a |
2 | 02 |
| 34 | 22 | " | 66 | 42 | B | 98 | 62 | b |
3 | 03 |
| 35 | 23 | # | 67 | 43 | C | 99 | 63 | c |
4 | 04 |
| 36 | 24 | $ | 68 | 44 | D | 100 | 64 | d |
5 | 05 |
| 37 | 25 | % | 69 | 45 | E | 101 | 65 | e |
6 | 06 |
| 38 | 26 | & | 70 | 46 | F | 102 | 66 | f |
7 | 07 |
| 39 | 27 | ' | 71 | 47 | G | 103 | 67 | g |
8 | 08 | \b | 40 | 28 | ( | 72 | 48 | H | 104 | 68 | h |
9 | 09 | \t | 41 | 29 | ) | 73 | 49 | I | 105 | 69 | i |
10 | 0A | \r | 42 | 2A | * | 74 | 4A | J | 106 | 6A | j |
11 | 0B |
| 43 | 2B | + | 75 | 4B | K | 107 | 6B | k |
12 | 0C |
| 44 | 2C | , | 76 | 4C | L | 108 | 6C | l |
13 | 0D | \n | 45 | 2D | - | 77 | 4D | M | 109 | 6D | m |
14 | 0E |
| 46 | 2E | . | 78 | 4E | N | 110 | 6E | n |
15 | 0F | 47 | 2F | / | 79 | 4F | O | 111 | 6F | o | |
16 | 10 | 48 | 30 | 0 | 80 | 50 | P | 112 | 70 | p | |
17 | 11 | 49 | 31 | 1 | 81 | 51 | Q | 113 | 71 | q | |
18 | 12 | 50 | 32 | 2 | 82 | 52 | R | 114 | 72 | r | |
19 | 13 | 51 | 33 | 3 | 83 | 53 | S | 115 | 73 | s | |
20 | 14 | 52 | 34 | 4 | 84 | 54 | T | 116 | 74 | t | |
21 | 15 | 53 | 35 | 5 | 85 | 55 | U | 117 | 75 | u | |
22 | 16 | 54 | 36 | 6 | 86 | 56 | V | 118 | 76 | v | |
23 | 17 | 55 | 37 | 7 | 87 | 57 | W | 119 | 77 | w | |
24 | 18 | 56 | 38 | 8 | 88 | 58 | X | 120 | 78 | x | |
25 | 19 | 57 | 39 | 9 | 89 | 59 | Y | 121 | 79 | y | |
26 | 1A | 58 | 3A | : | 90 | 5A | Z | 122 | 7A | z | |
27 | 1B | 59 | 3B | ; | 91 | 5B | [ | 123 | 7B | { | |
28 | 1C | 60 | 3C | < | 92 | 5C | \ | 124 | 7C | | | |
29 | 1D | 61 | 3D | = | 93 | 5D | ] | 125 | 7D | } | |
30 | 1E | - | 62 | 3E | > | 94 | 5E | ^ | 126 | 7E | ~ |
31 | 1F |
| 63 | 3F | ? | 95 | 5F | _ | 127 | 7F |
表1.4中很多字符都是无法显示的,所以以空白显示。在编码中,可以通过反斜杠“\”与ASCII字符的十六进制数结合的方式使用字符。例如,“\n”与“\0D”起到的作用是一致的。但是大多数字符可以直接输出,不需要使用此种方式。
避免转义字符——@
在编程中,有时候字符的组合恰巧与转义字符相同,此时就需要使该组合中的转义字符失效。C#中有一个特殊的字符 “@”,该字符的作用是声明原义字符串,忽略转义字符的作用。
【示例1-6】假如想要表示一个地址“c:\temp”。当我们在代码中输出“c:\temp”时,显示结果如下:
c: emp
为什么会显示这样的一个结果呢?因为在“c:\temp”中,字符串中的“\t”被计算机识别成了转义字符,因此起的作用是水平制表符。在这种情况下,可以使用转义字符“\\”将反斜杠输出,让该字符串表示一个地址,表示方式为:
"c:\\temp"
这样的表示方式可以暂时解决眼前的简单的地址。但是,如果想要表示的地址很长很复杂,里面包含多个反斜杠时,这种书写方式就会非常繁琐。例如,需要表示的地址为“c:\temp\1\t\3\a\5”时,使用这种方式表示出来为:
"c:\\temp\\1\\t\\3\\a\\5"
上述这种表示方式非常繁琐,容易书写错误。因此,可以使用特殊符号@来屏蔽转义字符的作用。当我们想表示地址“c:\temp\1\t\3\a\5”时,只需要在地址前面加上特殊字符@即可,表示方式如下:
@"c:\temp\1\t\3\a\5"
字符串长度
上面我们学习了字符、字符串、转义字符等,接着我们来了解它们各自的字符长度。各种字符和字符串的类型、示例、长度及输出结果具体如表1.5所示:
表1.5 字符串长度
类型 | 字符/字符串示例 | 长度 | 实际含义 |
普通字符 | 'a' | 1 | a |
普通字符串 | "abc" | 3 | abc |
带单引号的字符串 | "ab\'c" | 4 | ab'c |
带控制代码的字符串 | "ab\nc" | 4 | ab c |
带ASCII表示的字符串 | "ab\x22" | 3 | ab" |
使用@的字符串 | @"ab\x22" | 6 | ab\x22 |