Linux中的日志分析利器:ail grep awk
创始人
2025-07-08 13:51:26
0

一个日志查询分析的例子

项目发布上线后,接下来需要做什么?开Party,庆祝项目上线。但是Party开到一半,服务运行出了点问题。领导要你马上调查原因并给出合适的解决办法。项目才刚上线,日志监控系统都还没来得及完善。你该怎么处理?

登录服务器,查询日志文件定位相关日志,并分析原因。所以在linux服务器上进行日志查询,成为了必备的技能。

于是你登上了服务器,找到了对应服务的日志文件,输入了:

tail -f .log

但这只能看最新的日志输出,不能看到过去的某个时间点的日志,或者根据某些特定的字符进行筛选。

于是你输入了命令:

tail -n 20000 .log | grep "ERROR" -A 50 -B 50

查看了最近20000行中出现ERROR的日志并包括其前50行和后50行。

一顿操作后你调查出了具体原因,并给出了问题的解决方法。但是你想调查一下问题出现的频次:

tail -n 2000 .log | grep 'ERROR' | awk '{count++;} END {print "error count:", count}'

随后你分析出了出现问题的更深层次的原因,并出具了根本原因分析报告。

在不具备完善的ELK日志收集分析系统的情况下,日志查询分析只能依靠Linux基础的日志查询分析工具:tail, grep, awk等命令。

tail命令

tail命令用于查看日志文件,常见用法如下:

显示文件的最后10行:

tail 

显示文件的最后200行:

tail -n 200 

显示文件第200行开始到末尾的内容:

tail -n +200  

循环读取文件:

tail -f 

更多tail命令相关的信息,可以通过tail --help命令查看。

grep命令

grep命令用于在一个或多个输入文件中,搜索与正则匹配的行,并将匹配的行标准输出。

在日志查询中,通常用来将tail的输出结果进行过滤日志,常见用法如下:

(1) 显示最近2000行日志中,包含Error(区分大小写)的日志行如包含SystemError,InputError, Error等单词的行

tail -n 2000  | grep 'Error' 

(2) 显示最近2000行日志中,包含Error单词(区分大小写)的日志行:

tail -n 2000  | grep -w 'Error' 

-w表示匹配单词。

(3) 如果不区分大小写,则可以用以下命令:

tail -n 2000  | grep -wi 'Error'

-i参数则表示不区分大小写。

(4) 如果需要显示不包含Error的日志行,则可以用以下命令:

tail -n 2000 postman.log | grep -wiv 'Error'

-v表示对匹配的条件取反.

(5) 如果需要进行正则匹配则可以加入-e参数,-E参数则表示扩展正则匹配

tail -n 2000 postman.log | grep -e '.*Error.*'  
tail -n 2000 postman.log | grep -E '.*Error.*|.*error.*'

(6) -A参数可以包含匹配行的前n行,-B参数则包含匹配行的后n行,上文的提到的命令

tail -n 20000 .log | grep "ERROR" -A 50 -B 50

则表示匹配包含ERROR字符的行,以及前50行和后50行。

更多grep命令相关的信息,也可以通过grep --help命令查看。

awk命令

awk是一个文本处理工具,主要用于数据扫描,过滤,统计汇总等。

awk基本语法则是:

awk ' {}  {}...'

上面提到的一个关于awk的命令则是统计了一下日志中出现ERROR字符的行数。

tail -n 2000 .log | grep 'ERROR' | awk '{count++;} END {print "error count:", count}'

更简单的实现方式则可以通过awk的内置变量实现,如列出ls命令输出的结果行数:

ls | awk 'END{print NR}'

END是awk中的一个关键字,后面接的代码块只会在读取完所有数据记录最后执行一次。与之相反的则是BEGIN,后面接的代码块只会在读取数据记录前执行一次。

awk是一个十分强大的文本分析工具,如果有日志分析需求,awk足以应对日常所需。更多关于awk的教程可以自行在网上搜索相关资料,或者查看官网教程:https://www.gnu.org/software/gawk/manual/html_node/index.html

总结

总之,基于linux的日志查询分析,结合tail、grep、awk这三个命令的运用,就完全满足日常的日志分析需求了。tail控制日志查找范围,grep进行关键词筛选,awk用于分析统计。

相关内容

热门资讯

PHP新手之PHP入门 PHP是一种易于学习和使用的服务器端脚本语言。只需要很少的编程知识你就能使用PHP建立一个真正交互的...
网络中立的未来 网络中立性是什... 《牛津词典》中对“网络中立”的解释是“电信运营商应秉持的一种原则,即不考虑来源地提供所有内容和应用的...
各种千兆交换机的数据接口类型详... 千兆交换机有很多值得学习的地方,这里我们主要介绍各种千兆交换机的数据接口类型,作为局域网的主要连接设...
全面诠释网络负载均衡 负载均衡的出现大大缓解了服务器的压力,更是有效的利用了资源,提高了效率。那么我们现在来说一下网络负载...
什么是大数据安全 什么是大数据... 在《为什么需要大数据安全分析》一文中,我们已经阐述了一个重要观点,即:安全要素信息呈现出大数据的特征...
如何允许远程连接到MySQL数... [[277004]]【51CTO.com快译】默认情况下,MySQL服务器仅侦听来自localhos...
如何利用交换机和端口设置来管理... 在网络管理中,总是有些人让管理员头疼。下面我们就将介绍一下一个网管员利用交换机以及端口设置等来进行D...
P2P的自白|我不生产内容,我... 现在一提起P2P,人们就会联想到正在被有关部门“围剿”的互联网理财服务。×租宝事件使得劳...
Intel将Moblin社区控... 本周二,非营利机构Linux基金会宣布,他们将担负起Moblin社区的管理工作,而这之前,Mobli...
施耐德电气数据中心整体解决方案... 近日,全球能效管理专家施耐德电气正式启动大型体验活动“能效中国行——2012卡车巡展”,作为该活动的...