登录

如何解析所需字段-ELK应用

标签：无 2018-03-06 09:28 1921人阅读评论(0)

分类：

数据分析系统及工具

常说的ELK是指包括 elasticsearch、logstash 和 kibana 的一套技术栈，常用来处理日志等数据。

其部署架构多种多样。常见的一种分离式的部署方式为：应用->kafka->logstash->elasticsearch->kibana。采用这种部署架构，需要解决的问题就是从kafka中获取的message字段是一个单独的完整json串，如何将它解析成不同的字段以供之后做聚合等数据分析操作。

目前的解决方法是：

在logstash配置文件中添加filter项。

filter {

dissect {

mapping => {

“message” => “{%{?arg1}:%{&arg1},%{?arg2}:%{&arg2}}”

}

}

}

dissect适合对具有简单模式的字段进行解析切分。

而采用cjson生成的json串中会带有\n\t,\n和\t字符，dissect不支持对此类字符的匹配，所以有了以下修改，现将这些字符去掉。

filter {

mutate {

gsub => [“message”,”\n”,””]

gsub => [“message”,”\t”,””]

}

dissect {

mapping => {

“message” => “{%{?arg1}:%{&arg1},%{?arg2}:%{&arg2}}”

}

}

}

至此，kibana中会出现json中各个字段。

该解决方法仍有不足之处：

1. 如果字段本身含有:,等分割符，则会被误匹配截断。

2. 无法动态调整json串中的字段个数。

仍待解决。

查看评论

暂无评论

个人资料

杜梅婕

职位：员工

文章分类

发表时间

2018年(1)

阅读排行

如何解析所需字段-ELK应用(1921)

评论排行

如何解析所需字段-ELK应用(0)

地址：北京市朝阳区华严北里甲22号楼五层 | 邮编：100029
邮箱：nelist@iie.ac.cn
京ICP备15019404号-1