动态迁移:在 Kubernetes 集群中经常存在 Pod 主动或者被动的迁移,频繁的销毁、创建,我们无法和传统的方式一样人为的给每个服务下发日志采集配置。
【资料图】
日志存储方式多样性:容器的日志存储方式有很多不同的类型,例如 stdout、hostPath、emptyDir、pv 等。
Kubernetes 元信息:由于日志数据采集后会被集中存储,所以查询日志时,需要根据namespace、pod、container、node,甚至包括容器的环境变量、label 等维度来检索、过滤,此时要求Agent感知并默认在日志里注入这些元信息。
以上都是有别于传统日志采集配置方式的需求和痛点,究其原因,还是因为传统的方式脱离了Kubernetes,无法感知Kubernetes,无法和Kubernetes集成。
为了采集容器日志,我们先来看一下市面上一般都有哪些解决方案。
采集容器日志,Agent有两种部署方式:
DaemonSet:每个节点部署一个Agent
Sidecar:每个Pod增加一个Sidecar容器,运行日志Agent
两种部署方式的优劣都显而易见:
资源占用:DaemonSet每个节点上一个,而Sidecar每个Pod里一个,容器化形态下,往往一个Node上可能会跑很多的Pod,此时DaemonSet的方式远小于Sidecar,而且节点上Pod个数越多越明显 侵入性:Sidecar的方式,Agent需要注入到业务Pod中,不管是否有平台封装这一过程,还是采用Kubernetes webhook的方式默认注入,仍然改变了原本的部署方式 稳定性:日志采集在大部分的情况下,需要保障的是稳定性,最重要的是不能影响业务,如果采用Sidecar的方式,在Agent发生异常或者oom等情况,很容易对业务容器造成影响。另外,Agent比较多的时候,在连接数等方面会对下游服务比如Kafka造成一定的隐患。 隔离性:DaemonSet情况下,节点所有的日志都共用同一个Agent,而Sidecar方式,只会采集同一个Pod内的业务日志,此时Sidecar的隔离性理论上会好一些 性能:Sidecar由于只会采集该Pod里的日志,压力相对较小,极端情况下,达到Agent的性能瓶颈比DaemonSet方式概率也会小很多Tip:正常情况下,优先使用 DaemonSet 的方式采集日志,如果单个Pod日志量特别大,超过一般 Agent 发送吞吐量,可以单独对该 Pod 使用 Sidecar 的方式采集日志。
DaemonSet + Stdout
如果使用容器运行时的是docker,正常情况下我们可以在节点的docker路径中找到容器的stdout的日志,默认为/var/lib/docker/containers/{containerId}/{containerId}-json.log。在Kubernetes 1.14版本之前,kubelet会在/var/log/pods/在Kubernetes 1.14版本之后,改成了root@master0:/var/log/pods# tree .
|-- 6687e53201c01e3fad31e7d72fbb92a6
| `-- kube-apiserver
| |-- 865.log -> /var/lib/docker/containers/3a35ae0a1d0b26455fbd9b267cd9d6ac3fbd3f0b12ee03b4b22b80dc5a1cde03/3a35ae0a1d0b26455fbd9b267cd9d6ac3fbd3f0b12ee03b4b22b80dc5a1cde03-json.log
| `-- 866.log -> /var/lib/docker/containers/15a6924f14fcbf15dd37d1c185c5b95154fa2c5f3de9513204b1066bbe474662/15a6924f14fcbf15dd37d1c185c5b95154fa2c5f3de9513204b1066bbe474662-json.log
|-- a1083c6d-3b12-11ea-9af1-fa163e28f309
| `-- kube-proxy
| |-- 3.log -> /var/lib/docker/containers/4b63b5a90a8f9ca6b6f20b49b5ab2564f92df21a5590f46de2a46b031e55c80e/4b63b5a90a8f9ca6b6f20b49b5ab2564f92df21a5590f46de2a46b031e55c80e-json.log
| `-- 4.log -> /var/lib/docker/containers/fc7c315d33935887ca3479a38cfca4cca66fad782b8a120c548ad0b9f0ff7207/fc7c315d33935887ca3479a38cfca4cca66fad782b8a120c548ad0b9f0ff7207-json.log
/var/log/pods/__//.log
的形式。 所以,对于 Agent 采集标准输出日志来说,也就是采集节点上的这些日志文件。一种简单粗暴的采集方式是,使用DaemonSet部署日志Agent,挂载/var/log/pods目录,Agent的配置文件使用类似root@master-0:/var/log/pods# tree .
|-- kube-system_kube-apiserver-kind-control-plane_bd1c21fe1f0ef615e0b5e41299f1be61
| `-- kube-apiserver
| `-- 0.log
|-- kube-system_kube-proxy-gcrfq_f07260b8-6055-4c19-9491-4a825579528f
| `-- kube-proxy
| `-- 0.log
`-- loggie_loggie-csd4g_f1cc32e9-1002-4e64-bd58-fc6094394e06
`-- loggie
`-- 0.log
/var/log/pod.log
去通配日志文件,采集节点上所有的容器标准输出。 但是这样的局限在于: 无法注入更多元信息比如一些pod的label/env等,特别是在k8s1.14版本之前,甚至无法在采集的 path 里获取到 namespace/pod等信息 很难针对单个服务配置特殊的配置,比如某个文件需要使用特殊的多行日志采集,需要配置适合服务自身的日志格式切分等 会采集很多不必要的容器日志,造成采集、传输、存储压力 当然现在的一些日志Agent比如Filebeat/Fluentd都针对性的做了支持,比如可以将namespace/pod等信息注入日志中,但仍然没有解决大部分的问题。 所以,这种方式只适合简单的业务场景,后续也难以满足其他更多的日志需求。Tip:这也是我最初的解决方案,想到这就脸红!
(1) emtpyDir
emtpyDir 的生命周期跟随Pod,Pod销毁后其中存储的日志也会消失。
优点:使用简单,不同Pod都使用自己的emtpyDir,有一定的隔离性。
缺点:日志如果采集不及时,在Pod消耗后,存在丢失的可能性。
使用 emptyDir 挂载的日志文件,一般在节点的路径如下:/var/lib/kubelet/pods/${pod.UID}/volumes/kubernetes.io~empty-dir/${volumeName}
(2) hostPath
生命周期和Pod无关,Pod迁移或者销毁,日志文件还保留在现有磁盘上。
优点:生命周期和Pod无关,即使Pod销毁,日志文件依然在节点磁盘上,假设Agent没有采集日志,仍然可以找到日志文件 缺点:默认无隔离性,需要控制挂载的日志路径;另外,Pod迁移节点后,残留的日志文件长期积累容易占据磁盘,同时日志占据的磁盘无法控制使用的配额为了解决隔离性,避免多个Pod打印日志到相同的路径和文件中,我们需要使用 subPathExpr 字段从 Downward API 环境变量构造 subPath 目录名。该 VolumeSubpathEnvExpansion 功能从 Kubernetes1.15 开始默认开启,在1.17 GA。
(3) Pv
Pv的访问模式包括:
ReadWriteOnce(RWO):读写权限,并且只能被单个Node挂载。
ReadOnlyMany(ROX):只读权限,允许被多个Node挂载。
ReadWriteMany(RWX):读写权限,允许被多个Node挂载。
对于大部分的业务来说,都是Deployment无状态部署,需要挂载同一个Pv共享;对于一些中间件等有状态服务,一般会使用StatefulSet部署,每个Pod会使用独立的Pv。
优点:存储日志不容易丢失; 缺点:有一定的使用和运维复杂度;多个Pod共享同一个Pv时存在隔离性问题;很多的日志Agent对采集云盘上的日志文件支持不够成熟,可能存在一些隐患; 虽然同样可以在Node上找到使用Pv挂载的对应日志文件,但是Pv根据不同的底层实现,在Node上的路径会有一定的区别。目前市面上大部分日志Agent均对这些挂载方式没有感知,所以你能做的和上面使用stdout的方式类似,也就是简单粗暴的让Agent将路径都挂载,使用通配的方式采集所有的日志,使用上的局限和stdout的方式同样一致。另外,鉴于一些Agent对采集docker stdout有一定的支持,所以还存在一些使用上变种,比如利用webhook注入一个sidecar,读取Pod里的日志文件,转换成sidecar的stdout,然后采集sidecar的stdout日志,这里不再详述。
标签:
相比传统的主机日志采集,在Kubernetes集群中,采集容器日志有一些差异,使用方式上也有所区别。因此我们罗
近日,江西赣州一辆停靠在路边的货车驾驶室突然起火,浓烟滚滚货车周围还有多辆车一旦被引燃,将损失惨重不
扎着马尾,脸上总是挂着谦和的笑容,一双充满睿智的眼睛,说话慢声细语,给人的直观印象是沉稳干练。她就是
怎么把CAD表格导出到Excel?CAD表格导出教程-CAD图纸绘制完成后,有些时候会需要将图纸中的CAD表格导出到ex
1、拳拳的本意是紧握不舍,引伸为恳切,服膺:是铭记心中的意思。2、形容恳切地牢记不忘。3、可见日月:这
中新网4月22日电据中央气象台网站消息,我国中东部有大范围降水过程。22日至24日,西北地区东部、华北西部
【智车派新闻】近日,据智车派了解,浙江省政府办公厅印发《关于进一步扩大消费促进高质量发展若干举措》,
1、英语中表示动作的动词,按其动作发生过程的长短,可分为持续性动词和终止性动词。2、持续性动词(或称为
1、在火药发明之前,人们通过燃烧竹子来燃放鞭炮。2、春节放鞭炮起源于驱鬼的行为,但今天人们在春节放鞭炮
举报电话:0315-5906855举报邮箱:lbzhzfdd@163 com举报地址:唐山市路北区城市管理综合行政执法局“任性执
LNMP模式下,已经安装了某一个PHP版本,比如说8 1,现在要再多安装一个8 0。
1、《孔另境集 中国杂文》是2015年1月1日吉林出版集团股份有限公司出版的图书,作者是刘成信。2、。文章到
导读:最近很多玩家都在关注布娃娃战斗游乐场电锯人这款手游,想知道具体的公测时间,布娃娃战斗游乐场电锯
1、就是长宽高都是1米的方块,如此大小的体积内装下的液体,气体。2、流体或容器。本文到此分享完毕,希望
1、流放精华一看你就是在做:战士拿旋风斧的任务是要你在阿拉希高地上打三种护符(各要8个吧),是打水元素、
1、植脂末又称奶精,是以氢化植物油,酪蛋白为主要原料的新型产品。2、该产品在食品生产和加工中具有特殊的
2023城市四区优质高中招生计划对口分配表2023兰州新区、高新区优质高中招生计划对口分配表享受对口分配计划
厦门丧葬补助金和抚恤金咨询电话1、厦门市社会保险中心地址:厦门市湖里区云顶北路842号市行政服务中心二楼
2023年4月21日,沪胶小幅震荡下调,幅度50-100元 吨以内,国内市场现货胶价格普遍变动不大,平稳的多,少部
2023年4月17日,深圳市福田区住房和建设局发布关于受理福田区2023年产业人才住房配租申请的通告。通告提到
X 关闭
X 关闭