awk实践_基础实践_基础知识-天翼云

awk实践_基础实践_基础知识

2025-01-07 09:44:04 阅读次数：19

1.1.1 基础知识

学习目标

这一节，我们从基础知识、语法解读、小结三个方面来学习

基础知识

简介

在日常计算机管理中，总会有很多数据输出到屏幕或者文件，这些输出包含了标准输出、标准错误输出。默认情况下，这些信息全部输出到默认输出设备---屏幕。然而，大量的数据输出中，只有一小部分是我们需要重点关注的，我们需要把我们需要的或者关注的这些信息过滤或者提取以备后续需要时调用。早先的学习中，我们学过使用grep来过滤这些数据，使用cut、tr命令提出某些字段，但是他们都不具备提取并处理数据的能力，都必须先过滤，再提取转存到变量，然后在通过变量提取去处理，比如：

内存使用率的统计步骤
	1) 通过free -m提取出内存总量，赋值给变量 memory_totle
	2）通过free -m提取出n内存使用量，赋值给变量memory_use
	3）通过数学运算计算内存使用率
	
	需要执行多步才能得到内存使用率，那么有没有一个命令能够集过滤、提取、运算为一体呢？当然，就是今天我要给大家介绍的命令：awk

awk简介

awk全称 Aho Weinberger Kernighan报告生成器，awk的三个字母是来自于三个作者的首字母。它是一个功能非常强大的文档编辑工具，它不仅能以行为单位还能以列为单位处理文件，并且还具有格式化文本输出功能。目前它受自由软件基金会（FSF）进行开发和维护，通常也称它为 GNU AWK，AWK有多种版本：
    AWK：原先来源于 AT & T 实验室的的AWK
    NAWK：New awk，AT & T 实验室的AWK的升级版
    GAWK：即GNU AWK。所有的GNU/Linux发布版都自带GAWK，它与AWK和NAWK完全兼容

原理解读
	awk 认为文件中的每一行是一条记录，记录与记录的分隔符为换行符,每一列是一个字段 字段与字段的分隔符默认是一个或多个空格或tab制表符.
	
	awk的工作方式是逐行读取文本数据，将每一行数据视为一条记录（record）每条记录以字段分隔符分成若干字段，然后输出各个字段的值.然后以查找匹配某个特定模式的文本行，并对这些文本执行制定动作。

语法解读

基本格式

格式：
    awk [参数] '[动作]' [文件名]
    awk [参数] –f 动作文件 var=value [文件名]
    awk [参数] 'BEGIN段 [动作] END段' [文件名]
注意：
	动作的格式  '匹配条件{打印动作}'

常见参数：
    -F				指定列的分隔符，默认一行数据的列分隔符是空格
    -f file 		指定读取程序的文件名
    -v var=value	自定义变量

awk程序运行优先级是:
    1 BEGIN: 在开始处理数据流之前执行，可选项
    2 动作: 如何处理数据流，必选项
    3 END: 处理完数据流后执行，可选项

常见动作
    print	显示内容
    $0		显示当前行所有内容
    $n		显示当前行的第n列内容，如果存在多个$n，它们之间使用逗号(,)隔开
注意:
	如果打印的内容是变量,则无需在变量两侧加上双引号,其他的都应该加双引号

其他功能

printf 格式化显示内容
	printf [-v var] format [item1,item2,...]
	注意：
		printf输出需要指定换行符号，format的格式必须与后面item对应
		常见格式：
			%c		显示字符的ASCII码		%d|i 	显示十进制整数		%e|E	显示科学计数法数值
			%f		显示浮点数			 %s		 显示字符串			%u	  显示无符号整数
			%%		显示%本身				
		修饰符：
			%#[.#]	第一个#控制显示宽度，第二个#表示小数点后的精度，例如%3.1f
			%-		左对齐，%-15s
			%+		显示数值的正负符号，%+d

常见内置变量
    FILENAME 	当前输入文件的文件名，该变量是只读的
    NR 			指定显示行的行号
    FNR			多文件时候，分别计数
    NF 			表示字段数量
    OFS 		输出格式的列分隔符，缺省是空格
    FS 			输入文件的列分隔符，缺省是连续的空格和Tab
    RS			输入记录分隔符,指定输入时的换行符,原换行符($)仍有效
    ORS			输出记录分隔符,输出时用指定符号代替换行符
    ARGC|ARGV[n] 获取命令的参数个数|参数内容

准备工作

[root@localhost ~]# cat awk.txt
nihao awk1 awk2 awk3
nihao awk4 awk5 awk6
nihao awk7 awk8 awk9

活动

应用商城

合作伙伴

开发者

支持与服务

了解天翼云

awk实践_基础实践_基础知识

awk实践_基础实践_基础知识

1.1.1 基础知识

相关文章

【mongodb基础-6】mongodb query in java

【shell基础（12）循环之while、select】while：管道、重定向循环读取文件；select：菜单拓展循环

【CPP11新特性，列表初始化】列表初始化与初始化列表是不是一个概念？列表是怎么初始化的？

【数组分三段快排】分而治之的快排算法

【分治——归并排序】排序数组的归并方法

【CPP】队列简介及其简化模拟实现

【Dos】Dos 常用命令

Python中的三目(元)运算符

Python 之父的解析器系列之七：PEG 解析器的元语法

Python 3.9 新特性：任意表达式可作为装饰器！

作者介绍

最新文章

流程控制_if条件控制_语法解读

流程控制_if条件控制_其他实践

内容格式化_输入格式化_EOF原理

内容格式化_输出格式化_echo解读

表达式_表达式_数字表达式

表达式_表达式进阶_逻辑组合

热门文章

awk实践_基础实践_优先级实践

数组实践_基础操作_数组基础

流程控制_for循环_嵌套循环

数组实践_综合实践_数组关联

内容格式化_输出格式化_echo解读

sed命令_基础实践_增加操作

热门标签

相关产品

弹性云主机

天翼云电脑（公众版）

对象存储

云硬盘

随机文章

sed命令_基础实践_增加操作

流程控制_函数进阶_数组传递

sed命令_基础实践_加载保存

数组实践_基础操作_数组取值

流程控制_for循环_for基础

sed命令_进阶实践_匹配进阶