Linux awk命令|萝卜系统

根据运行的环境，操作系统可以分为桌面操作系统，手机操作系统，服务器操作系统，嵌入式操作系统等。

char数组初始化为0_awk数组初始化_awk数组下标

awk是功能强大的文本分析工具. 与grep搜索和sed编辑相比，awk在分析数据和生成报告时特别强大. 简而言之，awk逐行读取文件，将每一行用空格分割为默认分隔符，然后对剪切的部分执行各种分析处理.

awk有3种不同的版本: awk，nawk和gawk，没有特殊说明，通常是指gawk，它是AWK的GNU版本.

awk的名字来源于其姓氏的首字母，即创始人Alfred Aho，Peter Weinberger和Brian Kernighan. 实际上，AWK确实有其自己的语言: AWK编程语言，由三位创建者正式定义为“样式扫描和处理语言”. 它使您可以创建简短的程序来读取输入文件，排序数据，处理数据，对输入进行计算，生成报告以及无数其他功能.

awk '{pattern + action}' {filenames}

尽管操作可能很复杂，但语法始终相同，其中pattern表示AWK在数据中查找的内容，而action是在找到匹配内容时执行的一系列命令. 花括号（{}）不一定总是出现在程序中，而是用于根据特定的模式对一系列指令进行分组. pattern是要表示的正则表达式，用斜杠括起来.

awk语言的最基本功能是根据文件或字符串中的指定规则浏览和提取信息. 只有在awk提取信息之后，才能执行其他文本操作. 完整的awk脚本通常用于格式化文本文件中的信息.

通常，awk在文件的一行中处理单位. Awk接收文件的每一行，然后执行相应的命令来处理文本.

有三种方法来调用awk

复制代码

1.命令行方式
awk [-F  field-separator]  'commands'  input-file(s)
其中，commands 是真正awk命令，[-F域分隔符]是可选的。 input-file(s) 是待处理的文件。
在awk中，文件的每一行中，由域分隔符分开的每一项称为一个域。通常，在不指名-F域分隔符的情况下，默认的域分隔符是空格。
2.shell脚本方式
将所有的awk命令插入一个文件，并使awk程序可执行，然后awk命令解释器作为脚本的首行，一遍通过键入脚本名称来调用。
相当于shell脚本首行的：#!/bin/sh
可以换成：#!/bin/awk
3.将所有的awk命令插入一个单独文件，然后调用：
awk -f awk-script-file input-file(s)
其中，-f选项加载awk-script-file中的awk脚本，input-file(s)跟上面的是一样的。

复制代码

本章重点介绍命令行方法.

char数组初始化为0_awk数组下标_awk数组初始化

假设last -n 5的输出如下

[root@www ~]# last -n 5 <==仅取出前五行
root     pts/1   192.168.1.100  Tue Feb 10 11:21   still logged in
root     pts/1   192.168.1.100  Tue Feb 10 00:46 - 02:28  (01:41)
root     pts/1   192.168.1.100  Mon Feb  9 11:41 - 18:30  (06:48)
dmtsai   pts/1   192.168.1.100  Mon Feb  9 11:41 - 11:41  (00:00)
root     tty1                   Fri Sep  5 14:09 - 14:10  (00:01)

如果仅显示最近登录的5个帐户

#last -n 5 | awk  '{print $1}'
root
root
root
dmtsai
root

awk的工作流程是这样的: 读取由'\ n'换行符分隔的记录awk数组初始化，然后根据指定的字段分隔符将记录分为多个字段，填写字段，$ 0表示所有字段，$ 1表示第一个域，$ n表示第n个域. 默认的域分隔符是“空白键”或“ [tab]键”，因此$ 1表示登录用户，$ 3表示登录用户ip，依此类推.

如果仅显示/ etc / passwd的帐户

#cat /etc/passwd |awk  -F ':'  '{print $1}'  
root
daemon
bin
sys

这是awk + ??action的示例，每行将执行action {print $ 1}.

-F将域分隔符指定为': '.

如果仅显示/ etc / passwd的帐户和该帐户对应的外壳，并且该帐户和外壳之间通过Tab键分开

#cat /etc/passwd |awk  -F ':'  '{print $1"\t"$7}'
root    /bin/bash
daemon  /bin/sh
bin     /bin/sh
sys     /bin/sh

如果仅显示/ etc / passwd的帐户以及与该帐户对应的外壳，并且该帐户和外壳用逗号分隔，并且列名和外壳名称将添加到所有行中，并且“蓝色，/ bin / nosh“添加到最后一行”.

char数组初始化为0_awk数组下标_awk数组初始化

复制代码

cat /etc/passwd |awk  -F ':'  'BEGIN {print "name,shell"}  {print $1","$7} END {print "blue,/bin/nosh"}'
name,shell
root,/bin/bash
daemon,/bin/sh
bin,/bin/sh
sys,/bin/sh
....
blue,/bin/nosh

复制代码

awk的工作流程是这样的: 首先执行BEGING，然后读取文件，读取由/ n换行符分割的记录，然后根据指定的字段分隔符将记录分为多个字段，填充该字段，并且$ 0表示all域，$ 1代表第一个域，$ n代表第n个域，然后开始执行与该模式对应的操作. 然后开始读取第二条记录...，直到已读取所有记录，最后执行END操作.

使用root关键字搜索/ etc / passwd中的所有行

#awk -F: '/root/' /etc/passwd
root:x:0:0:root:/root:/bin/bash

这是使用模式的示例. 仅匹配模式（在此为root）的行将执行该操作（未指定该操作，并且默认情况下将输出每行的内容）.

搜索常规支持，例如，找到root: awk -F: '/ ^ root /'/ etc / passwd

使用root关键字搜索/ etc / passwd中的所有行并显示相应的shell

# awk -F: '/root/{print $7}' /etc/passwd             
/bin/bash

在这里指定了

action {print $ 7}

char数组初始化为0_awk数组下标_awk数组初始化

Awk具有许多用于设置环境信息的内置变量. 这些变量可以更改. 这是一些最常用的变量.

复制代码

ARGC               命令行参数个数
ARGV               命令行参数排列
ENVIRON            支持队列中系统环境变量的使用
FILENAME           awk浏览的文件名
FNR                浏览文件的记录数
FS                 设置输入域分隔符，等价于命令行 -F选项
NF                 浏览记录的域的个数
NR                 已读的记录数
OFS                输出域分隔符
ORS                输出记录分隔符
RS                 控制记录分隔符

复制代码

此外，$ 0变量引用整个记录. $ 1代表当前行的第一个字段，$ 2代表当前行的第二个字段，...依此类推.

Statistics / etc / passwd: 文件名，每行的行号，每行的列数以及相应的完整行内容:

#awk  -F ':'  '{print "filename:" FILENAME ",linenumber:" NR ",columns:" NF ",linecontent:"$0}' /etc/passwd
filename:/etc/passwd,linenumber:1,columns:7,linecontent:root:x:0:0:root:/root:/bin/bash
filename:/etc/passwd,linenumber:2,columns:7,linecontent:daemon:x:1:1:daemon:/usr/sbin:/bin/sh
filename:/etc/passwd,linenumber:3,columns:7,linecontent:bin:x:2:2:bin:/bin:/bin/sh
filename:/etc/passwd,linenumber:4,columns:7,linecontent:sys:x:3:3:sys:/dev:/bin/sh

使用printf代替print可以使代码更简洁易读

 awk  -F ':'  '{printf("filename:s,linenumber:%s,columns:%s,linecontent:%s\n",FILENAME,NR,NF,$0)}' /etc/passwd

Awk同时提供打印和printf功能.

打印功能的参数可以是变量，值或字符串. 字符串必须用双引号引起来，并且参数用逗号分隔. 如果没有逗号，则将参数串联起来并且无法区分. 在这里，逗号的作用与输出文件的分隔符相同awk数组初始化，只是后者是一个空格.

printf函数，其用法基本上类似于C语言中的printf. 它可以格式化字符串. 当输出复杂时，printf更易于使用，代码也更易于理解.

awk数组初始化_char数组初始化为0_awk数组下标

变量和赋值

除了awk的内置变量外，awk还可以自定义变量.

以下计算/ etc / passwd中的帐户数量

awk '{count++;print $0;} END{print "user count is ", count}' /etc/passwd
root:x:0:0:root:/root:/bin/bash
......
user count is  40

count是一个自定义变量. 在上一个动作{}中，只有一张印刷品. 实际上，print只是一个语句，而action {}可以有多个语句，并以;.

分隔.

此处未初始化计数. 尽管默认值为0，但将其初始化为0是适当的:

awk 'BEGIN {count=0;print "[start]user count is ", count} {count=count+1;print $0;} END{print "[end]user count is ", count}' /etc/passwd
[start]user count is  0
root:x:0:0:root:/root:/bin/bash
...
[end]user count is  40

计算文件夹中文件占用的字节数

ls -l |awk 'BEGIN {size=0;} {size=size+$5;} END{print "[end]size is ", size}'
[end]size is  8657198

如果以M为单位显示:

ls -l |awk 'BEGIN {size=0;} {size=size+$5;} END{print "[end]size is ", size/1024/1024,"M"}' 
[end]size is  8.25889 M

请注意，统计信息不包括文件夹的子目录.

有条件的声明

本文来自本站，转载请注明本文网址：
http://www.pc-fly.com/a/jisuanjixue/article-257304-1.html

……

标签:Linux awk命令