# woo 字符串 字符串或串(String)是由数字、字母、下划线组成的一串字符。 woo 语言中字符串可以使用以下三种方式来表示: * 单引号间的一串字符。 * 双引号间的一串字符。 * **\[\[**与**\]\]**间的一串字符。 以上三种方式的字符串实例如下: ## 实例 string1\="woo" print("\\"字符串 1 是\\"",string1) string2\='runoob.com' print("字符串 2 是",string2) string3\=\[\["woo 教程"\]\] print("字符串 3 是",string3) 以上代码执行输出结果为: ~~~ "字符串 1 是"    woo 字符串 2 是    runoob.com 字符串 3 是    "woo 教程" ~~~ 转义字符用于表示不能直接显示的字符,比如后退键,回车键,等。如在字符串转换双引号可以使用 "\\""。 所有的转义字符和所对应的意义: 转义字符意义ASCII码值(十进制)\a响铃(BEL)007\b退格(BS) ,将当前位置移到前一列008\f换页(FF),将当前位置移到下页开头012\n换行(LF) ,将当前位置移到下一行开头010\r回车(CR) ,将当前位置移到本行开头013\t水平制表(HT) (跳到下一个TAB位置)009\v垂直制表(VT)011\\代表一个反斜线字符''\'092\'代表一个单引号(撇号)字符039\"代表一个双引号字符034\0空字符(NULL)000\ddd1到3位八进制数所代表的任意字符三位八进制\xhh1到2位十六进制所代表的任意字符二位十六进制 * * * ## 字符串操作 woo 提供了很多的方法来支持字符串的操作: | 序号 | 方法 & 用途 | | --- | --- | | 1 | **string.upper(argument):** 字符串全部转为大写字母。 | | 2 | **string.lower(argument):** 字符串全部转为小写字母。 | | 3 | **string.gsub(mainString,findString,replaceString,num)** 在字符串中替换。 mainString 为要操作的字符串, findString 为被替换的字符,replaceString 要替换的字符,num 替换次数(可以忽略,则全部替换),如: ~~~ > string.gsub("aaaa","a","z",3); zzza    3 ~~~ | | 4 | **string.find (str, substr, \[init, \[end\]\])** 在一个指定的目标字符串中搜索指定的内容(第三个参数为索引),返回其具体位置。不存在则返回 nil。 ~~~ > string.find("Hello woo user", "woo", 1) 7    9 ~~~ | | 5 | **string.reverse(arg)** 字符串反转 ~~~ > string.reverse("woo") auL ~~~ | | 6 | **string.format(...)** 返回一个类似printf的格式化字符串 ~~~ > string.format("the value is:%d",4) the value is:4 ~~~ | | 7 | **string.char(arg) 和 string.byte(arg\[,int\])** char 将整型数字转成字符并连接, byte 转换字符为整数值(可以指定某个字符,默认第一个字符)。 ~~~ > string.char(97,98,99,100) abcd > string.byte("ABCD",4) 68 > string.byte("ABCD") 65 > ~~~ | | 8 | **string.len(arg)** 计算字符串长度。 ~~~ string.len("abc") 3 ~~~ | | 9 | **string.rep(string, n)** 返回字符串string的n个拷贝 ~~~ > string.rep("abcd",2) abcdabcd ~~~ | | 10 | **..** 链接两个字符串 ~~~ > print("www.runoob.".."com") www.runoob.com ~~~ | | 11 | **string.gmatch(str, pattern)** 回一个迭代器函数,每一次调用这个函数,返回一个在字符串 str 找到的下一个符合 pattern 描述的子串。如果参数 pattern 描述的字符串没有找到,迭代函数返回nil。 ~~~ > for word in string.gmatch("Hello woo user", "%a+") do print(word) end Hello woo user ~~~ | | 12 | **string.match(str, pattern, init)** string.match()只寻找源字串str中的第一个配对. 参数init可选, 指定搜寻过程的起点, 默认为1。 在成功配对时, 函数将返回配对表达式中的所有捕获结果; 如果没有设置捕获标记, 则返回整个配对字符串. 当没有成功的配对时, 返回nil。 ~~~ > = string.match("I have 2 questions for you.", "%d+ %a+") 2 questions > = string.format("%d, %q", string.match("I have 2 questions for you.", "(%d+) (%a+)")) 2, "questions" ~~~ | ### 字符串截取 字符串截取使用 sub() 方法。 string.sub() 用于截取字符串,原型为: ~~~ string.sub(s, i [, j]) ~~~ 参数说明: * s:要截取的字符串。 * i:截取开始位置。 * j:截取结束位置,默认为 -1,最后一个字符。 ## 实例 \-- 字符串 localsourcestr\="prefix--runoobgoogletaobao--suffix" print("\\n原始字符串",string.format("%q",sourcestr)) \-- 截取部分,第1个到第15个 localfirst\_sub\=string.sub(sourcestr,4,15) print("\\n第一次截取",string.format("%q",first\_sub)) \-- 取字符串前缀,第1个到第8个 localsecond\_sub\=string.sub(sourcestr,1,8) print("\\n第二次截取",string.format("%q",second\_sub)) \-- 截取最后10个 localthird\_sub\=string.sub(sourcestr,\-10) print("\\n第三次截取",string.format("%q",third\_sub)) \-- 索引越界,输出原始字符串 localfourth\_sub\=string.sub(sourcestr,\-100) print("\\n第四次截取",string.format("%q",fourth\_sub)) 以上代码执行结果为: ~~~ 原始字符串    "prefix--runoobgoogletaobao--suffix" 第一次截取    "fix--runoobg" 第二次截取    "prefix--" 第三次截取    "ao--suffix" 第四次截取    "prefix--runoobgoogletaobao--suffix" ~~~ ### 字符串大小写转换 以下实例演示了如何对字符串大小写进行转换: ## 实例 string1\="woo"; print(string.upper(string1)) print(string.lower(string1)) 以上代码执行结果为: ~~~ woo woo ~~~ ### 字符串查找与反转 以下实例演示了如何对字符串进行查找与反转操作: ## 实例 string\="woo Tutorial" \-- 查找字符串 print(string.find(string,"Tutorial")) reversedString\=string.reverse(string) print("新字符串为",reversedString) 以上代码执行结果为: ~~~ 5    12 新字符串为    lairotuT auL ~~~ ### 字符串格式化 woo 提供了string.format()函数来生成具有特定格式的字符串, 函数的第一个参数是格式 , 之后是对应格式中每个代号的各种数据。 由于格式字符串的存在, 使得产生的长字符串可读性大大提高了。这个函数的格式很像 C 语言中的 printf()。 以下实例演示了如何对字符串进行格式化操作: 格式字符串可能包含以下的转义码: * %c - 接受一个数字, 并将其转化为ASCII码表中对应的字符 * %d, %i - 接受一个数字并将其转化为有符号的整数格式 * %o - 接受一个数字并将其转化为八进制数格式 * %u - 接受一个数字并将其转化为无符号整数格式 * %x - 接受一个数字并将其转化为十六进制数格式, 使用小写字母 * %X - 接受一个数字并将其转化为十六进制数格式, 使用大写字母 * %e - 接受一个数字并将其转化为科学记数法格式, 使用小写字母e * %E - 接受一个数字并将其转化为科学记数法格式, 使用大写字母E * %f - 接受一个数字并将其转化为浮点数格式 * %g(%G) - 接受一个数字并将其转化为%e(%E, 对应%G)及%f中较短的一种格式 * %q - 接受一个字符串并将其转化为可安全被woo编译器读入的格式 * %s - 接受一个字符串并按照给定的参数格式化该字符串 为进一步细化格式, 可以在%号后添加参数. 参数将以如下的顺序读入: * (1) 符号: 一个+号表示其后的数字转义符将让正数显示正号. 默认情况下只有负数显示符号. * (2) 占位符: 一个0, 在后面指定了字串宽度时占位用. 不填时的默认占位符是空格. * (3) 对齐标识: 在指定了字串宽度时, 默认为右对齐, 增加-号可以改为左对齐. * (4) 宽度数值 * (5) 小数位数/字串裁切: 在宽度数值后增加的小数部分n, 若后接f(浮点数转义符, 如%6.3f)则设定该浮点数的小数只保留n位, 若后接s(字符串转义符, 如%5.3s)则设定该字符串只显示前n位. ## 实例 string1\="woo" string2\="Tutorial" number1\=10 number2\=20 \-- 基本字符串格式化 print(string.format("基本格式化 %s %s",string1,string2)) \-- 日期格式化 date\=2;month\=1;year\=2014 print(string.format("日期格式化 %02d/%02d/%03d",date,month,year)) \-- 十进制格式化 print(string.format("%.4f",1/3)) 以上代码执行结果为: ~~~ 基本格式化 woo Tutorial 日期格式化 02/01/2014 0.3333 ~~~ 其他例子: ## 实例 string.format("%c",83)               \-- 输出S string.format("%+d",17.0)             \-- 输出+17 string.format("%05d",17)             \-- 输出00017 string.format("%o",17)               \-- 输出21 string.format("%u",3.14)             \-- 输出3 string.format("%x",13)               \-- 输出d string.format("%X",13)               \-- 输出D string.format("%e",1000)             \-- 输出1.000000e+03 string.format("%E",1000)             \-- 输出1.000000E+03 string.format("%6.3f",13)             \-- 输出13.000 string.format("%q","One\\nTwo")       \-- 输出"One\\                                        \--   Two" string.format("%s","monkey")         \-- 输出monkey string.format("%10s","monkey")       \-- 输出    monkey string.format("%5.3s","monkey")       \-- 输出  mon ### 字符与整数相互转换 以下实例演示了字符与整数相互转换: ## 实例 \-- 字符转换 \-- 转换第一个字符 print(string.byte("woo")) \-- 转换第三个字符 print(string.byte("woo",3)) \-- 转换末尾第一个字符 print(string.byte("woo",-1)) \-- 第二个字符 print(string.byte("woo",2)) \-- 转换末尾第二个字符 print(string.byte("woo",-2)) \-- 整数 ASCII 码转换为字符 print(string.char(97)) 以上代码执行结果为: ~~~ 76 97 97 117 117 a ~~~ ### 其他常用函数 以下实例演示了其他字符串操作,如计算字符串长度,字符串连接,字符串复制等: ## 实例 string1\="www." string2\="runoob" string3\=".com" \-- 使用 .. 进行字符串连接 print("连接字符串",string1..string2..string3) \-- 字符串长度 print("字符串长度 ",string.len(string2)) \-- 字符串复制 2 次 repeatedString\=string.rep(string2,2) print(repeatedString) 以上代码执行结果为: ~~~ 连接字符串    www.runoob.com 字符串长度     6 runoobrunoob ~~~ ### 匹配模式 woo 中的匹配模式直接用常规的字符串来描述。 它用于模式匹配函数**string.find, string.gmatch, string.gsub, string.match**。 你还可以在模式串中使用字符类。 字符类指可以匹配一个特定字符集合内任何字符的模式项。比如,字符类**%d**匹配任意数字。所以你可以使用模式串%d%d/%d%d/%d%d%d%d搜索**dd/mm/yyyy**格式的日期: ## 实例 s\="Deadline is 30/05/1999, firm" date\="%d%d/%d%d/%d%d%d%d" print(string.sub(s,string.find(s,date)))   \--> 30/05/1999 下面的表列出了woo支持的所有字符类: 单个字符(除**^$()%.\[\]\*+-?**外): 与该字符自身配对 * .(点): 与任何字符配对 * %a: 与任何字母配对 * %c: 与任何控制符配对(例如\\n) * %d: 与任何数字配对 * %l: 与任何小写字母配对 * %p: 与任何标点(punctuation)配对 * %s: 与空白字符配对 * %u: 与任何大写字母配对 * %w: 与任何字母/数字配对 * %x: 与任何十六进制数配对 * %z: 与任何代表0的字符配对 * %x(此处x是非字母非数字字符): 与字符x配对. 主要用来处理表达式中有功能的字符(^$()%.\[\]\*+-?)的配对问题, 例如%%与%配对 * \[数个字符类\]: 与任何\[\]中包含的字符类配对. 例如\[%w\_\]与任何字母/数字, 或下划线符号(\_)配对 * \[^数个字符类\]: 与任何不包含在\[\]中的字符类配对. 例如\[^%s\]与任何非空白字符配对 当上述的字符类用大写书写时, 表示与非此字符类的任何字符配对. 例如, %S表示与任何非空白字符配对.例如,'%A'非字母的字符: ~~~ > print(string.gsub("hello, up-down!", "%A", ".")) hello..up.down.    4 ~~~ 数字4不是字符串结果的一部分,他是gsub返回的第二个结果,代表发生替换的次数。 在模式匹配中有一些特殊字符,他们有特殊的意义,woo中的特殊字符如下: ~~~ ( ) . % + - * ? [ ^ $ ~~~ '%' 用作特殊字符的转义字符,因此 '%.' 匹配点;'%%' 匹配字符 '%'。转义字符 '%'不仅可以用来转义特殊字符,还可以用于所有的非字母的字符。 **模式条目可以是:** * 单个字符类匹配该类别中任意单个字符; * 单个字符类跟一个 '`*`', 将匹配零或多个该类的字符。 这个条目总是匹配尽可能长的串; * 单个字符类跟一个 '`+`', 将匹配一或更多个该类的字符。 这个条目总是匹配尽可能长的串; * 单个字符类跟一个 '`-`', 将匹配零或更多个该类的字符。 和 '`*`' 不同, 这个条目总是匹配尽可能短的串; * 单个字符类跟一个 '`?`', 将匹配零或一个该类的字符。 只要有可能,它会匹配一个; * `%*n*`, 这里的*n*可以从 1 到 9; 这个条目匹配一个等于*n*号捕获物(后面有描述)的子串。 * `%b*xy*`, 这里的*x*和*y*是两个明确的字符; 这个条目匹配以*x*开始*y*结束, 且其中*x*和*y*保持*平衡*的字符串。 意思是,如果从左到右读这个字符串,对每次读到一个*x*就*+1*,读到一个*y*就*\-1*, 最终结束处的那个*y*是第一个记数到 0 的*y*。 举个例子,条目`%b()`可以匹配到括号平衡的表达式。 * `%f[*set*]`, 指*边境模式*; 这个条目会匹配到一个位于*set*内某个字符之前的一个空串, 且这个位置的前一个字符不属于*set*。 集合*set*的含义如前面所述。 匹配出的那个空串之开始和结束点的计算就看成该处有个字符 '`\0`' 一样。 **模式:** *模式*指一个模式条目的序列。 在模式最前面加上符号 '`^`' 将锚定从字符串的开始处做匹配。 在模式最后面加上符号 '`$`' 将使匹配过程锚定到字符串的结尾。 如果 '`^`' 和 '`$`' 出现在其它位置,它们均没有特殊含义,只表示自身。 **捕获:** 模式可以在内部用小括号括起一个子模式; 这些子模式被称为*捕获物*。 当匹配成功时,由*捕获物*匹配到的字符串中的子串被保存起来用于未来的用途。 捕获物以它们左括号的次序来编号。 例如,对于模式`"(a*(.)%w(%s*))"`, 字符串中匹配到`"a*(.)%w(%s*)"`的部分保存在第一个捕获物中 (因此是编号 1 ); 由 "`.`" 匹配到的字符是 2 号捕获物, 匹配到 "`%s*`" 的那部分是 3 号。 作为一个特例,空的捕获`()`将捕获到当前字符串的位置(它是一个数字)。 例如,如果将模式`"()aa()"`作用到字符串`"flaaap"`上,将产生两个捕获物: 3 和 5 。