文件查看命令 · PHP知识总结

* [1、查看文件内容或者合并文件：cat \[-AbeEnstTuv\] \[--help\] \[--version\] fileName](https://www.kancloud.cn/chunyu/php_basic_knowledge/1882194#span_stylefontsize15px1cat_AbeEnstTuv_help_version_fileNamespan_1) * [2、显示文件的详细信息：stat \[option\] filename](https://www.kancloud.cn/chunyu/php_basic_knowledge/1882194#span_stylefontsize15px2stat_option_filenamespan_19) * [3、只查看文件的开头部分的内容：head \[option\] \[文件\]](https://www.kancloud.cn/chunyu/php_basic_knowledge/1882194#span_stylefontsize15px3head_option_span_73) * [4、查看文件最尾部的内容：tail \[option\] \[文件\]](https://www.kancloud.cn/chunyu/php_basic_knowledge/1882194#span_stylefontsize15px4tail_option_span_83) * [5、显示文件属性：lsattr \[-adlRvV\]\[文件或目录...\]](https://www.kancloud.cn/chunyu/php_basic_knowledge/1882194#span_stylefontsize15px5lsattr_adlRvVspan_99) * [6、改变文件属性：chattr \[-RV\]\[-v\]\[+-=\]\[文件或目录...\]](https://www.kancloud.cn/chunyu/php_basic_knowledge/1882194#span_stylefontsize15px6chattr_RVvspan_110) * [7、统计文件的字数：wc \[-clw\]\[文件\]](https://www.kancloud.cn/chunyu/php_basic_knowledge/1882194#span_stylefontsize15px7wc_clwspan_133) * [8、查看文本汇总的重复列：uniq \[-cdu\]\[-f\]\[-s\]\[-w\]\[输入文件\]\[输出文件\]](https://www.kancloud.cn/chunyu/php_basic_knowledge/1882194#span_stylefontsize15px8uniq_cdufswspan_142) * [9、排序文本内容：sort \[-bcdfimMnr\]\[-o\]\[-t\]\[+-\]\[文件\]](https://www.kancloud.cn/chunyu/php_basic_knowledge/1882194#span_stylefontsize15px9sort_bcdfimMnrotspan_159) * [10、显示每行从开头算起 num1 到 num2 的文字：cut \[option\] 文件](https://www.kancloud.cn/chunyu/php_basic_knowledge/1882194#span_stylefontsize15px10_num1__num2_cut_option_span_202) * [11、文本处理文件：awk '{\[pattern\] action}' {filenames}](https://www.kancloud.cn/chunyu/php_basic_knowledge/1882194#span_stylefontsize15px11awk_pattern_action_filenamesspan_218) # 1、查看文件内容或者合并文件：cat \[-AbeEnstTuv\] \[--help\] \[--version\] fileName > * \-n 或 --number：由 1 开始对所有输出的行数编号。 > * \-b 或 --number-nonblank：和 -n 相似，只不过对于空白行不编号。 > * \-s 或 --squeeze-blank：当遇到有连续两行以上的空白行，就代换为一行的空白行。 > * \-v 或 --show-nonprinting：使用 ^ 和 M- 符号，除了 LFD 和 TAB 之外。 > * \-E 或 --show-ends: 在每行结束处显示 $。 > * \-T 或 --show-tabs: 将 TAB 字符显示为 ^I。 > * \-A, --show-all：等价于 -vET。 > * \-e：等价于"-vE"选项； > * \-t：等价于"-vT"选项； | 命令 | 注释 | | --- | --- | | cat textfile | 把textfile的文档内容输出打印出来 | | cat -n textfile1 > textfile2 | 把 textfile1 的文档内容加上行号后输入 textfile2 这个文档里 | | cat -b textfile1 textfile2 > textfile3 | 把 textfile1 和 textfile2 的文档内容加上行号（空白行不加）之后将内容附加到 textfile3 文档里 | | cat /dev/null > textfile2 | 清空textfile2文档内容 | # 2、显示文件的详细信息：stat \[option\] filename > * \-f ：不显示文件本身的信息，显示文件所在文件系统的信息 > * \-t：以更简洁的方式输出，只显示摘要信息 > * \-c：格式化输出。如 stat -c 格式代码 filename | \-c：格式化输出参数 | 注释 | | --- | --- | | %A | 用文件权限代码表示，如-rw-r--r-- | | %a | 用八进制数字表示文件权限 | | %b | 占用的区块数量 | | %B | 用%b计算区块数量时，每一区块的大小，预设是512bytes | | %D | 用16进制表示设备编号 | | %d | 用10进制表示设备编号 | | %F | 显示文件形态，即文件类型 | | %f | raw mode以16进制表示 | | %G | 文件拥有者的组名 | | %g | 文件拥有着的群组编号 | | %h | 硬链接的数量 | | %i | inode编号 | | %N | 将符号链接的文件明和其指向的文件的文件名，用引号包含，'[1.sh](http://1.sh/)'->'[h.sh](http://h.sh/)' | | $n | 文件名 | | %o | IO区块的大小，预设是4096bytes | | %s | 文件大小 | | %T | 16进制表示Minor次要设备代码 | | %t | 16进制表示Major主要设备代码 | | %U | 文件拥有者的使用者名称 | | %u | 文件拥有者的使用者编号 | | %X | 访问时间，时间戳显示 | | %x | 访问时间 | | %Y | 修改时间，时间戳显示 | | %y | 修改时间 | | %Z | 最近改动时间，时间戳显示 | | %z | 最近改动时间 | ![](https://img.kancloud.cn/b5/62/b562f8dba415d52942ed06d829160d68_567x174.png) 简单的介绍一下stat命令显示出来的文件其他信息： File：显示文件名，Size：显示文件大小，Blocks：文件使用的数据块总数，IO Block：IO块大小，regular file：文件类型（常规文件），Device：设备编号，Inode：Inode号，Links：链接数，Access：文件的权限，Gid、Uid：文件所有权的Gid和Uid，以及linux下的三个时间： 1、 Access Time（访问时间）：简写为atime，表示文件的访问时间。当文件内容被访问时，更新这个时间 2、Modify Time（修改时间）：简写为mtime，表示文件内容的修改时间，当文件的数据内容被修改时，更新这个时间。 3、 Change Time（最近改动时间）：简写为ctime，表示文件的状态时间，当文件的状态被修改时，更新这个时间，例如文件的链接数，大小，权限，Blocks数。 > 1、当读取文件时，access time会发生改变，modify、change time会发生改变 > 2、当修改文件时，acces、modify、change time都会发生改变 > 3、当修改属性时，change time会发生改变，access、modify time不会发生改变 > 4、more、less、cat、tail 等命令会改变 access time，ls、stat命令不会改变access time > 5、通过 chown、chmod修改文件属性时，会更新change time，touch命令会同时更新这三个时间 | 命令 | 注释 | | --- | --- | | stat test.txt | 显示文件的详细信息 | | stat -c %a%A test.txt | 644-rw-r--r-- | | ls -lc test.txt | 查看文件的最近改动时间（change time） | | ls -lu test.txt | 查看文件的最近访问时间（access time） | | ls -l test.txt | 查看文件的最近修改时间（modify time） | # 3、只查看文件的开头部分的内容：head \[option\] \[文件\] > * \-q 隐藏文件名 > * \-v 显示文件名 > * \-c 显示的字节数。 > * \-n 显示的行数。默认为 10，即显示 10 行的内容。 | 命令 | 注释 | | --- | --- | | head -c 20 text.txt | 显示文件前 20 个字节 | | head -n 20 text.txt | 显示文件前 20 行 | # 4、查看文件最尾部的内容：tail \[option\] \[文件\] > * \-f 循环读取 > * \-q 不显示处理信息 > * \-v 显示详细的处理信息 > * \-c 显示的字节数 > * \-n 显示文件的尾部 n 行内容 > * \--pid=PID 与-f合用,表示在进程ID,PID死掉之后结束 > * \-q, --quiet, --silent 从不输出给出文件名的首部 > * \-s, --sleep-interval=S 与-f合用,表示在每次反复的间隔休眠S秒 | 命令 | 注释 | | --- | --- | | tail -f filename | 把 filename 文件里的最尾部的内容显示在屏幕上，并且不断刷新，只要 filename 更新就可以看到最新的文件内容 | | tail notes.log | 显示 notes.log 文件的最后 10 行 | | tail -c 10 notes.log | 显示文件 notes.log 的最后 10 个字符 | # 5、显示文件属性：lsattr \[-adlRvV\]\[文件或目录...\] > * \-a 　显示所有文件和目录，包括以"."为名称开头字符的额外内建，现行目录"."与上层目录".."。 > * \-d 　显示，目录名称，而非其内容。 > * \-l 　此参数目前没有任何作用。 > * \-R 　递归处理，将指定目录下的所有文件及子目录一并处理。 > * \-v 　显示文件或目录版本。 > * \-V 　显示版本信息。 | 命令 | 注释 | | --- | --- | | lsattr test | 显示test文件的文件属性 | # 6、改变文件属性：chattr \[-RV\]\[-v\]\[+-=\]\[文件或目录...\] > 这项指令可改变存放在ext2文件系统上的文件或目录属性，这些属性共有以下8种模式： > > 1. a：让文件或目录仅供附加用途。 > 2. b：不更新文件或目录的最后存取时间。 > 3. c：将文件或目录压缩后存放。 > 4. d：将文件或目录排除在倾倒操作之外。 > 5. i：不得任意更动文件或目录。 > 6. s：保密性删除文件或目录。 > 7. S：即时更新文件或目录。 > 8. u：预防意外删除。 > > 参数： > > * \-R 递归处理，将指定目录下的所有文件及子目录一并处理。 > * \-v 设置文件或目录版本。 > * \-V 显示指令执行过程。 > * +开启文件或目录的该项属性。 > * \-关闭文件或目录的该项属性。 > * \= 指定文件或目录的该项属性。 | 命令 | 注释 | | --- | --- | | chattr +i test.txt | 用chattr命令防止系统中某个关键文件被修改。此时使用lsattr命令查看属性：----i--------e-- test.txt | | chattr +a text.txt | 让某个文件只能往里面追加数据，但不能删除，适用于各种日志文件。此时使用lsattr命令查看属性：----a--------e-- test.txt | # 7、统计文件的字数：wc \[-clw\]\[文件\] > * \-c或--bytes或--chars 只显示Bytes数。 > * \-l或--lines 只显示行数。 > * \-w或--words 只显示字数。 | 命令 | 注释 | | --- | --- | | wc test.log | 默认的情况下，wc将计算指定文件的行数、字数，以及字节数 | | cat /proc/cpuinfo | grep 'core id' | sort -u| wc -l | 与grep配合使用，统计文件内某字符的行数，此命令为查询cpu核数 | # 8、查看文本汇总的重复列：uniq \[-cdu\]\[-f\]\[-s\]\[-w\]\[输入文件\]\[输出文件\] > 注意：该命令是用于去掉文件中相邻数据重复的行，经常与sort命令配合使用 > > * \-c 在每列旁边显示该行重复出现的次数。 > * \-d 仅显示重复出现的行列。 > * \-f 忽略比较指定的栏位。 > * \-s 忽略比较指定的字符。 > * \-u 仅显示出一次的行列。 > * \-w 指定要比较的字符。 > * \[输入文件\] 指定已排序好的文本文件。如果不指定此项，则从标准读取数据； > * \[输出文件\] 指定输出的文件。如果不指定此选项，则将内容显示到标准输出设备（显示终端） | 命令 | 注释 | | --- | --- | | uniq test.log | 打印删除重复行之后的结果 | | uniq -u test.log | 打印出文本中仅出现一次的行 | | uniq -c test.log test1.log | 检查文件并删除文件中重复出现的行，并在行首显示该行重复出现的次数，并将结果输入至test1.log文件中 | | sort test.log | uniq | 如果文件内重复行并不相邻，uniq 命令是不起作用的，需要先用sort进行排序，再使用uniq命令 | # 9、排序文本内容：sort \[-bcdfimMnr\]\[-o\]\[-t\]\[+-\]\[文件\] > * \-b 忽略每行前面开始出的空格字符。 > * \-c 检查文件是否已经按照顺序排序。 > * \-d 排序时，处理英文字母、数字及空格字符外，忽略其他的字符。 > * \-f 排序时，将小写字母视为大写字母。 > * \-h 按照文件大小倒叙显 > * \-i 排序时，除了040至176之间的ASCII字符外，忽略其他的字符。 > * \-m 将几个排序好的文件进行合并。 > * \-M 将前面3个字母依照月份的缩写进行排序，比如JAN小于FEB。 > * \-n 依照数值的大小排序。 > * \-u 去重排序。 > * \-o 将排序后的结果存入指定的文件。 > * \-r 降序排序，默认的排序方式是升序。 > * \-t 指定排序时所用的栏位分隔字符 > * \-k 定义排序键值字段，当出现多个-k选项时候，会先从第一个键值开始排序，找出匹配该键值的记录后，再进行第二个键值字段的排序，以此类推 | 命令 | 注释 | | --- | --- | | sort test.log | 默认情况下，将文本内容的第一列以ASCII 码的次序排列 | | sort -o test1.log -u test.log | 去重排序test.log内容，并将结果保存至test1.log | ~~~ // -t与-k参数使用实例 [root@izwz91quxhnlkan8kjak5hz ~]# cat test google:150:2000 baidu:100:3000 sougou:90:4000 sohu:100:4500 [root@izwz91quxhnlkan8kjak5hz ~]# sort -t : -k 2n test // 以冒号隔开的第二个字段以整数类型进行排序 sougou:90:4000 baidu:100:3000 sohu:100:4500 google:150:2000 [root@izwz91quxhnlkan8kjak5hz ~]# sort -t : -k2n -k3nr test // 以冒号隔开的第二个字段进行排序，当数值相等时，以第三个字段进行排序 sougou:90:4000 sohu:100:4500 baidu:100:3000 google:150:2000 [root@izwz91quxhnlkan8kjak5hz ~]# sort -t : -k1.1 test // 以冒号隔开的第一个字段的第一个字母进行排序 baidu:100:3000 google:150:2000 sohu:100:4500 sougou:90:4000 ~~~ # 10、显示每行从开头算起 num1 到 num2 的文字：cut \[option\] 文件 > * \-b ：以字节为单位进行分割。这些字节位置将忽略多字节字符边界，除非也指定了 -n 标志。 > * \-c ：以字符为单位进行分割（适用于中文）。 > * \-d ：自定义分隔符，默认为制表符。 > * \-f ：与-d一起使用，指定显示哪个区域。 > * \-n ： > * n：只有第n项 > * n-:从第n项一直到行尾 > * n-m：从第n项到第m项(包括m) > * \-m：从一行的开始到第m项(包括m) > * \-：从一行的开始到结束的所有项 | 命令 | 注释 | | --- | --- | | head -5 /etc/passwd | cut -d : -f 1,3-5 | 以冒号隔开的passwd文件前五行内容，显示第一、第三至五项字段 | | head -5 /etc/passwd | cut -b 1-3 | 取每行的第1-3字字节 | # 11、文本处理文件：awk '{\[pattern\] action}' {filenames} > option： > > * \-F fs or --field-separator fs：指定输入文件折分隔符，fs是一个字符串或者是一个正则表达式，如-F: > * \-v var=value or --asign var=value：赋值一个用户定义变量 > * \-f scripfile or --file scriptfile：从脚本文件中读取awk命令 > > 脚本关键字： > > * BEGIN{ 这里面放的是执行前的语句 } > * END {这里面放的是处理完所有的行后要执行的语句 } > * {这里面放的是处理每一行时要执行的语句} > > 内建变量： > > * $n：当前记录的第n个字段，字段间由FS分隔 > * $0：完整的输入记录 > * ARGC：命令行参数的数目 > * ARGIND：命令行中当前文件的位置(从0开始算) > * ARGV：包含命令行参数的数组 > * CONVFMT：数字转换格式(默认值为%.6g)ENVIRON环境变量关联数组 > * ERRNO：最后一个系统错误的描述 > * FIELDWIDTHS：字段宽度列表(用空格键分隔) > * FILENAME：当前文件名 > * FNR：各文件分别计数的行号 > * FS：字段分隔符(默认是任何空格) > * IGNORECASE：如果为真，则进行忽略大小写的匹配 > * NF：一条记录的字段的数目 > * NR：已经读出的记录数，就是行号，从1开始 > * OFMT：数字的输出格式(默认值是%.6g) > * OFS：输出记录分隔符（输出换行符），输出时用指定的符号代替换行符 > * ORS：输出记录分隔符(默认值是一个换行符) > * RLENGTH：由match函数所匹配的字符串的长度 > * RS：记录分隔符(默认是一个换行符) > * RSTART：由match函数所匹配的字符串的第一个位置 > * SUBSEP：数组下标分隔符(默认值是/034) | 命令实例 | 注释 | | --- | --- | | cat test.txt | awk -F/ '{print $1}' | 读取test.txt文件，按 /分割，并输出第一段内容。'{print $NF}'：最后一列；'{print $NF-1}'：倒数第二列 | | awk '{if(NR=2) print $1}' score.txt | 输出第二行到第四行的第一列 | | awk '/mall/' test.txt 效果同：sed -n '/mall/p' url.txt | 显示文件中含有mall的行 | | awk -F/ '{print $1,$3}' OFS="$" test.txt | 按 /分割，并输出第一段，第三段内容，并指定分隔符“$” | | awk 'BEGIN{IGNORECASE=1} /this/' test.txt | 忽略大小写，匹配this字符 | | awk 'BEGIN{printf "%.2f%\\n",('5'/'20')\*100}' | 计算百分比 | | cat test.txt | awk NF | wc -l | 过滤空行后，统计文件总行数 | | awk -f cal.awk score.txt | 从脚本文件中读取awk命令 | | awk '{sum+=$3} END {print sum}' score.txt | 计算score.txt文件第三列的总和 | | cat transit\_log\_elapsed.txt | awk '{print $1,$2,$(NF-3),$(NF-2),$(NF-1),$NF}' | 获取第一二列和最后的几列 | | cat transit\_log\_elapsed.txt | awk 'NR==1 {print $0} END {print $0}' | 获取第一行和最后一行 | | cat transit\_log\_elapsed.txt | awk -F= '$3>50{print $0}' | 只获取某一列的数字大于指定数值的行 | ~~~ // 只获取文件内elapsed的值大于50的行 SIS3.0.58.0 ~ # cat transit_log_elapsed.txt | awk -F= '$3>50{print $0}' time="2021-05-07T10:13:25+08:00" elapsed=95.835122 time="2021-05-07T10:13:27+08:00" elapsed=54.939698 time="2021-05-07T10:13:29+08:00" elapsed=51.889203 time="2021-05-07T10:13:32+08:00" elapsed=63.37284 time="2021-05-07T10:13:43+08:00" elapsed=3030.551248 time="2021-05-07T10:13:46+08:00" elapsed=51.853267 time="2021-05-07T10:13:47+08:00" elapsed=80.545366 time="2021-05-07T10:13:47+08:00" elapsed=97.63666 time="2021-05-07T10:13:49+08:00" elapsed=57.14669 ~~~