企业🤖AI智能体构建引擎,智能编排和调试,一键部署,支持知识库和私有化部署方案 广告
* [1、查看文件内容或者合并文件:cat \[-AbeEnstTuv\] \[--help\] \[--version\] fileName](https://www.kancloud.cn/chunyu/php_basic_knowledge/1882194#span_stylefontsize15px1cat_AbeEnstTuv_help_version_fileNamespan_1) * [2、显示文件的详细信息:stat \[option\] filename](https://www.kancloud.cn/chunyu/php_basic_knowledge/1882194#span_stylefontsize15px2stat_option_filenamespan_19) * [3、只查看文件的开头部分的内容:head \[option\] \[文件\]](https://www.kancloud.cn/chunyu/php_basic_knowledge/1882194#span_stylefontsize15px3head_option_span_73) * [4、查看文件最尾部的内容:tail \[option\] \[文件\]](https://www.kancloud.cn/chunyu/php_basic_knowledge/1882194#span_stylefontsize15px4tail_option_span_83) * [5、显示文件属性:lsattr \[-adlRvV\]\[文件或目录...\]](https://www.kancloud.cn/chunyu/php_basic_knowledge/1882194#span_stylefontsize15px5lsattr_adlRvVspan_99) * [6、改变文件属性:chattr \[-RV\]\[-v\]\[+-=\]\[文件或目录...\]](https://www.kancloud.cn/chunyu/php_basic_knowledge/1882194#span_stylefontsize15px6chattr_RVvspan_110) * [7、统计文件的字数:wc \[-clw\]\[文件\]](https://www.kancloud.cn/chunyu/php_basic_knowledge/1882194#span_stylefontsize15px7wc_clwspan_133) * [8、查看文本汇总的重复列:uniq \[-cdu\]\[-f\]\[-s\]\[-w\]\[输入文件\]\[输出文件\]](https://www.kancloud.cn/chunyu/php_basic_knowledge/1882194#span_stylefontsize15px8uniq_cdufswspan_142) * [9、排序文本内容:sort \[-bcdfimMnr\]\[-o\]\[-t\]\[+-\]\[文件\]](https://www.kancloud.cn/chunyu/php_basic_knowledge/1882194#span_stylefontsize15px9sort_bcdfimMnrotspan_159) * [10、显示每行从开头算起 num1 到 num2 的文字:cut \[option\] 文件](https://www.kancloud.cn/chunyu/php_basic_knowledge/1882194#span_stylefontsize15px10_num1__num2_cut_option_span_202) * [11、文本处理文件:awk '{\[pattern\] action}' {filenames}](https://www.kancloud.cn/chunyu/php_basic_knowledge/1882194#span_stylefontsize15px11awk_pattern_action_filenamesspan_218) # 1、查看文件内容或者合并文件:cat \[-AbeEnstTuv\] \[--help\] \[--version\] fileName > * \-n 或 --number:由 1 开始对所有输出的行数编号。 > * \-b 或 --number-nonblank:和 -n 相似,只不过对于空白行不编号。 > * \-s 或 --squeeze-blank:当遇到有连续两行以上的空白行,就代换为一行的空白行。 > * \-v 或 --show-nonprinting:使用 ^ 和 M- 符号,除了 LFD 和 TAB 之外。 > * \-E 或 --show-ends: 在每行结束处显示 $。 > * \-T 或 --show-tabs: 将 TAB 字符显示为 ^I。 > * \-A, --show-all:等价于 -vET。 > * \-e:等价于"-vE"选项; > * \-t:等价于"-vT"选项; | 命令 | 注释 | | --- | --- | | cat textfile | 把textfile的文档内容输出打印出来 | | cat -n textfile1 > textfile2 | 把 textfile1 的文档内容加上行号后输入 textfile2 这个文档里 | | cat -b textfile1 textfile2 > textfile3 | 把 textfile1 和 textfile2 的文档内容加上行号(空白行不加)之后将内容附加到 textfile3 文档里 | | cat /dev/null > textfile2 | 清空textfile2文档内容 | # 2、显示文件的详细信息:stat \[option\] filename > * \-f :不显示文件本身的信息,显示文件所在文件系统的信息 > * \-t:以更简洁的方式输出,只显示摘要信息 > * \-c:格式化输出。如 stat -c 格式代码  filename | \-c:格式化输出参数 | 注释 | | --- | --- | | %A | 用文件权限代码表示,如-rw-r--r-- | | %a | 用八进制数字表示文件权限 | | %b | 占用的区块数量 | | %B | 用%b计算区块数量时,每一区块的大小,预设是512bytes | | %D | 用16进制表示设备编号 | | %d | 用10进制表示设备编号 | | %F | 显示文件形态,即文件类型 | | %f | raw mode以16进制表示 | | %G | 文件拥有者的组名 | | %g | 文件拥有着的群组编号 | | %h | 硬链接的数量 | | %i | inode编号 | | %N | 将符号链接的文件明和其指向的文件的文件名,用引号包含,'[1.sh](http://1.sh/)'->'[h.sh](http://h.sh/)' | | $n | 文件名 | | %o | IO区块的大小,预设是4096bytes | | %s | 文件大小 | | %T | 16进制表示Minor次要设备代码 | | %t | 16进制表示Major主要设备代码 | | %U | 文件拥有者的使用者名称 | | %u | 文件拥有者的使用者编号 | | %X | 访问时间,时间戳显示 | | %x | 访问时间 | | %Y | 修改时间,时间戳显示 | | %y | 修改时间 | | %Z | 最近改动时间,时间戳显示 | | %z | 最近改动时间 | ![](https://img.kancloud.cn/b5/62/b562f8dba415d52942ed06d829160d68_567x174.png) 简单的介绍一下stat命令显示出来的文件其他信息:  File:显示文件名,Size:显示文件大小,Blocks:文件使用的数据块总数,IO Block:IO块大小,regular file:文件类型(常规文件),Device:设备编号,Inode:Inode号,Links:链接数,Access:文件的权限,Gid、Uid:文件所有权的Gid和Uid,以及linux下的三个时间: 1、 Access Time(访问时间):简写为atime,表示文件的访问时间。当文件内容被访问时,更新这个时间  2、Modify Time(修改时间):简写为mtime,表示文件内容的修改时间,当文件的数据内容被修改时,更新这个时间。  3、 Change Time(最近改动时间):简写为ctime,表示文件的状态时间,当文件的状态被修改时,更新这个时间,例如文件的链接数,大小,权限,Blocks数。 > 1、当读取文件时,access time会发生改变,modify、change time会发生改变 > 2、当修改文件时,acces、modify、change time都会发生改变 > 3、当修改属性时,change time会发生改变,access、modify time不会发生改变 > 4、more、less、cat、tail 等命令会改变 access time,ls、stat命令不会改变access time > 5、通过 chown、chmod修改文件属性时,会更新change time,touch命令会同时更新这三个时间 | 命令 | 注释 | | --- | --- | | stat test.txt | 显示文件的详细信息 | | stat -c %a%A test.txt | 644-rw-r--r-- | | ls -lc test.txt | 查看文件的最近改动时间(change time) | | ls -lu test.txt | 查看文件的最近访问时间(access time) | | ls -l test.txt | 查看文件的最近修改时间(modify time) | # 3、只查看文件的开头部分的内容:head \[option\] \[文件\] > * \-q 隐藏文件名 > * \-v 显示文件名 > * \-c 显示的字节数。 > * \-n 显示的行数。默认为 10,即显示 10 行的内容。 | 命令 | 注释 | | --- | --- | | head -c 20 text.txt | 显示文件前 20 个字节 | | head -n 20 text.txt | 显示文件前 20 行 | # 4、查看文件最尾部的内容:tail \[option\] \[文件\] > * \-f 循环读取 > * \-q 不显示处理信息 > * \-v 显示详细的处理信息 > * \-c 显示的字节数 > * \-n 显示文件的尾部 n 行内容 > * \--pid=PID 与-f合用,表示在进程ID,PID死掉之后结束 > * \-q, --quiet, --silent 从不输出给出文件名的首部 > * \-s, --sleep-interval=S 与-f合用,表示在每次反复的间隔休眠S秒 | 命令 | 注释 | | --- | --- | | tail -f filename | 把 filename 文件里的最尾部的内容显示在屏幕上,并且不断刷新,只要 filename 更新就可以看到最新的文件内容 | | tail notes.log | 显示 notes.log 文件的最后 10 行 | | tail -c 10 notes.log | 显示文件 notes.log 的最后 10 个字符 | # 5、显示文件属性:lsattr \[-adlRvV\]\[文件或目录...\] > * \-a  显示所有文件和目录,包括以"."为名称开头字符的额外内建,现行目录"."与上层目录".."。 > * \-d  显示,目录名称,而非其内容。 > * \-l  此参数目前没有任何作用。 > * \-R  递归处理,将指定目录下的所有文件及子目录一并处理。 > * \-v  显示文件或目录版本。 > * \-V  显示版本信息。 | 命令 | 注释 | | --- | --- | | lsattr test | 显示test文件的文件属性 | # 6、改变文件属性:chattr \[-RV\]\[-v\]\[+-=\]\[文件或目录...\] > 这项指令可改变存放在ext2文件系统上的文件或目录属性,这些属性共有以下8种模式: > > 1. a:让文件或目录仅供附加用途。 > 2. b:不更新文件或目录的最后存取时间。 > 3. c:将文件或目录压缩后存放。 > 4. d:将文件或目录排除在倾倒操作之外。 > 5. i:不得任意更动文件或目录。 > 6. s:保密性删除文件或目录。 > 7. S:即时更新文件或目录。 > 8. u:预防意外删除。 > > 参数: > > * \-R 递归处理,将指定目录下的所有文件及子目录一并处理。 > * \-v 设置文件或目录版本。 > * \-V 显示指令执行过程。 > * +开启文件或目录的该项属性。 > * \-关闭文件或目录的该项属性。 > * \= 指定文件或目录的该项属性。 | 命令 | 注释 | | --- | --- | | chattr +i test.txt | 用chattr命令防止系统中某个关键文件被修改。此时使用lsattr命令查看属性:----i--------e-- test.txt | | chattr +a text.txt | 让某个文件只能往里面追加数据,但不能删除,适用于各种日志文件。此时使用lsattr命令查看属性:----a--------e-- test.txt | # 7、统计文件的字数:wc \[-clw\]\[文件\] > * \-c或--bytes或--chars 只显示Bytes数。 > * \-l或--lines 只显示行数。 > * \-w或--words 只显示字数。 | 命令 | 注释 | | --- | --- | | wc test.log | 默认的情况下,wc将计算指定文件的行数、字数,以及字节数 | | cat /proc/cpuinfo | grep 'core id' | sort -u| wc -l | 与grep配合使用,统计文件内某字符的行数,此命令为查询cpu核数 | # 8、查看文本汇总的重复列:uniq \[-cdu\]\[-f\]\[-s\]\[-w\]\[输入文件\]\[输出文件\] > 注意:该命令是用于去掉文件中相邻数据重复的行,经常与sort命令配合使用 > > * \-c 在每列旁边显示该行重复出现的次数。 > * \-d 仅显示重复出现的行列。 > * \-f 忽略比较指定的栏位。 > * \-s 忽略比较指定的字符。 > * \-u 仅显示出一次的行列。 > * \-w 指定要比较的字符。 > * \[输入文件\] 指定已排序好的文本文件。如果不指定此项,则从标准读取数据; > * \[输出文件\] 指定输出的文件。如果不指定此选项,则将内容显示到标准输出设备(显示终端) | 命令 | 注释 | | --- | --- | | uniq test.log | 打印删除重复行之后的结果 | | uniq -u test.log | 打印出文本中仅出现一次的行 | | uniq -c test.log test1.log | 检查文件并删除文件中重复出现的行,并在行首显示该行重复出现的次数,并将结果输入至test1.log文件中 | | sort test.log | uniq | 如果文件内重复行并不相邻,uniq 命令是不起作用的,需要先用sort进行排序,再使用uniq命令 | # 9、排序文本内容:sort \[-bcdfimMnr\]\[-o\]\[-t\]\[+-\]\[文件\] > * \-b 忽略每行前面开始出的空格字符。 > * \-c 检查文件是否已经按照顺序排序。 > * \-d 排序时,处理英文字母、数字及空格字符外,忽略其他的字符。 > * \-f 排序时,将小写字母视为大写字母。 > * \-h 按照文件大小倒叙显 > * \-i 排序时,除了040至176之间的ASCII字符外,忽略其他的字符。 > * \-m 将几个排序好的文件进行合并。 > * \-M 将前面3个字母依照月份的缩写进行排序,比如JAN小于FEB。 > * \-n 依照数值的大小排序。 > * \-u 去重排序。 > * \-o 将排序后的结果存入指定的文件。 > * \-r 降序排序,默认的排序方式是升序。 > * \-t 指定排序时所用的栏位分隔字符 > * \-k 定义排序键值字段,当出现多个-k选项时候,会先从第一个键值开始排序,找出匹配该键值的记录后,再进行第二个键值字段的排序,以此类推 | 命令 | 注释 | | --- | --- | | sort test.log | 默认情况下,将文本内容的第一列以ASCII 码的次序排列 | | sort -o test1.log -u test.log | 去重排序test.log内容,并将结果保存至test1.log | ~~~ // -t与-k参数使用实例 [root@izwz91quxhnlkan8kjak5hz ~]# cat test google:150:2000 baidu:100:3000 sougou:90:4000 sohu:100:4500 [root@izwz91quxhnlkan8kjak5hz ~]# sort -t : -k 2n test // 以冒号隔开的第二个字段以整数类型进行排序 sougou:90:4000 baidu:100:3000 sohu:100:4500 google:150:2000 [root@izwz91quxhnlkan8kjak5hz ~]# sort -t : -k2n -k3nr test // 以冒号隔开的第二个字段进行排序,当数值相等时,以第三个字段进行排序 sougou:90:4000 sohu:100:4500 baidu:100:3000 google:150:2000 [root@izwz91quxhnlkan8kjak5hz ~]# sort -t : -k1.1 test // 以冒号隔开的第一个字段的第一个字母进行排序 baidu:100:3000 google:150:2000 sohu:100:4500 sougou:90:4000 ~~~ # 10、显示每行从开头算起 num1 到 num2 的文字:cut \[option\] 文件 > * \-b :以字节为单位进行分割。这些字节位置将忽略多字节字符边界,除非也指定了 -n 标志。 > * \-c :以字符为单位进行分割(适用于中文)。 > * \-d :自定义分隔符,默认为制表符。 > * \-f :与-d一起使用,指定显示哪个区域。 > * \-n : > * n:只有第n项 > * n-:从第n项一直到行尾 > * n-m:从第n项到第m项(包括m) > * \-m:从一行的开始到第m项(包括m) > * \-:从一行的开始到结束的所有项 | 命令 | 注释 | | --- | --- | | head -5 /etc/passwd | cut -d : -f 1,3-5 | 以冒号隔开的passwd文件前五行内容,显示第一、第三至五项字段 | | head -5 /etc/passwd | cut -b 1-3 | 取每行的第1-3字字节 | # 11、文本处理文件:awk '{\[pattern\] action}' {filenames} > option: > > * \-F fs or --field-separator fs:指定输入文件折分隔符,fs是一个字符串或者是一个正则表达式,如-F: > * \-v var=value or --asign var=value:赋值一个用户定义变量 > * \-f scripfile or --file scriptfile:从脚本文件中读取awk命令 > > 脚本关键字: > > * BEGIN{ 这里面放的是执行前的语句 } > * END {这里面放的是处理完所有的行后要执行的语句 } > * {这里面放的是处理每一行时要执行的语句} > > 内建变量: > > * $n:当前记录的第n个字段,字段间由FS分隔 > * $0:完整的输入记录 > * ARGC:命令行参数的数目 > * ARGIND:命令行中当前文件的位置(从0开始算) > * ARGV:包含命令行参数的数组 > * CONVFMT:数字转换格式(默认值为%.6g)ENVIRON环境变量关联数组 > * ERRNO:最后一个系统错误的描述 > * FIELDWIDTHS:字段宽度列表(用空格键分隔) > * FILENAME:当前文件名 > * FNR:各文件分别计数的行号 > * FS:字段分隔符(默认是任何空格) > * IGNORECASE:如果为真,则进行忽略大小写的匹配 > * NF:一条记录的字段的数目 > * NR:已经读出的记录数,就是行号,从1开始 > * OFMT:数字的输出格式(默认值是%.6g) > * OFS:输出记录分隔符(输出换行符),输出时用指定的符号代替换行符 > * ORS:输出记录分隔符(默认值是一个换行符) > * RLENGTH:由match函数所匹配的字符串的长度 > * RS:记录分隔符(默认是一个换行符) > * RSTART:由match函数所匹配的字符串的第一个位置 > * SUBSEP:数组下标分隔符(默认值是/034) | 命令实例 | 注释 | | --- | --- | | cat test.txt | awk -F/ '{print $1}' | 读取test.txt文件,按 /分割,并输出第一段内容。'{print $NF}':最后一列;'{print $NF-1}':倒数第二列 | | awk '{if(NR=2) print $1}' score.txt | 输出第二行到第四行的第一列 | | awk '/mall/' test.txt 效果同:sed -n '/mall/p' url.txt | 显示文件中含有mall的行 | | awk -F/ '{print $1,$3}' OFS="$" test.txt | 按 /分割,并输出第一段,第三段内容,并指定分隔符“$” | | awk 'BEGIN{IGNORECASE=1} /this/' test.txt | 忽略大小写,匹配this字符 | | awk 'BEGIN{printf "%.2f%\\n",('5'/'20')\*100}' | 计算百分比 | | cat test.txt | awk NF | wc -l | 过滤空行后,统计文件总行数 | | awk -f cal.awk score.txt | 从脚本文件中读取awk命令 | | awk '{sum+=$3} END {print sum}' score.txt | 计算score.txt文件第三列的总和 | | cat transit\_log\_elapsed.txt | awk '{print $1,$2,$(NF-3),$(NF-2),$(NF-1),$NF}' | 获取第一二列和最后的几列 | | cat transit\_log\_elapsed.txt | awk 'NR==1 {print $0} END {print $0}' | 获取第一行和最后一行 | | cat transit\_log\_elapsed.txt | awk -F= '$3>50{print $0}' | 只获取某一列的数字大于指定数值的行 | ~~~ // 只获取文件内elapsed的值大于50的行 SIS3.0.58.0 ~ # cat transit_log_elapsed.txt | awk -F= '$3>50{print $0}' time="2021-05-07T10:13:25+08:00" elapsed=95.835122 time="2021-05-07T10:13:27+08:00" elapsed=54.939698 time="2021-05-07T10:13:29+08:00" elapsed=51.889203 time="2021-05-07T10:13:32+08:00" elapsed=63.37284 time="2021-05-07T10:13:43+08:00" elapsed=3030.551248 time="2021-05-07T10:13:46+08:00" elapsed=51.853267 time="2021-05-07T10:13:47+08:00" elapsed=80.545366 time="2021-05-07T10:13:47+08:00" elapsed=97.63666 time="2021-05-07T10:13:49+08:00" elapsed=57.14669 ~~~