学分高考 web前端

分析Nginx访问日志需要学什么?

发布时间: 2022-05-17 04:36:01

分析Nginx访问日志需要学什么?需要掌握Spark SQL核心知识,分析Nginx访问日志掌握SparkSQL数据分析能力,SparkSQL调优方式及其核心思想。通过思维导图的方式对学习课程所涉及的知识。

分析Nginx访问日志需要学什么

1、Spark SQL介绍

Spark SQL在Spark生态圈的地位和作用,让大家对Spark SQL 的总体知识框架有个大概的轮廓。

2、认识Spark SQL

Spark SQL运行原理,Dataframe、DataSet和RDD的相互转化和使用场景,并讲解Parquet的使用。

2.1 Spark SQL和Hive

2.2 Spark SQL运行原理

2.3 Dataframe、DataSet和RDD的联系

2.4 Parquet列式存储

3、 Dataframe/DataSet常用操作

Dataframe的过滤,分组,排序操作和列值的增删改,以及对Join的优化。

3.1 一般操作:查找和过滤

3.2 聚合操作:groupBy和agg

3.3 单表操作:列的增删改与空值处理

3.4 多表操作:join

4、自定义函数和开窗函数

讲解自定义函数的使用,以及开窗函数在分组求TopN中的应用。

4.1 自定义函数:UDF

4.2 自定义聚合函数:UDAF

4.3 开窗函数:row_number()

5、Nginx访问日志分析完整实战

使用Spark SQL分析Nginx访问日志的项目。包括了数据清洗,存储,监控和优化。

5.1 项目场景介绍及分析

5.2 第一次数据清洗:格式化原始日志数据

5.3 第二次数据清洗:解析数据并按天以Parquet格式存储

5.4 将分析结果批量写入MySql

5.5 性能监控及优化

日志服务查询分析能力是完整SQL92,支持各种数理统计与计算。目前,日志服务支持保存查询语句为快速查询,对查询设置触发周期(间隔),并对执行结果设定判断条件并且告警。

温馨提示:
本文【分析Nginx访问日志需要学什么?】由作者教培参考提供。该文观点仅代表作者本人,学分高考系信息发布平台,仅提供信息存储空间服务,若存在侵权问题,请及时联系管理员或作者进行删除。
我们采用的作品包括内容和图片部分来源于网络用户投稿,我们不确定投稿用户享有完全著作权,根据《信息网络传播权保护条例》,如果侵犯了您的权利,请联系我站将及时删除。
内容侵权、违法和不良信息举报
Copyright @ 2024 学分高考 All Rights Reserved 版权所有. 湘ICP备17021685号