- 主题:k8s pod cpu使用情况,有什么获取的好方式吗?
springboot prometheus里process_cpu_usage,拿的是jvm/host的占比,jdk14以前
还有什么方式拿这个比较简洁?
--
修改:childewuque FROM 117.121.46.*
FROM 117.121.46.*
自建k8s,k8s自身工具能拿到,但是不能简洁地集成到grafana的actuator面板里
actuator/prometheus能拿到数值,但拿到的值不是jvm/pod
https://github.com/micrometer-metrics/micrometer/issues/1534
https://bugs.openjdk.java.net/browse/JDK-8228428
【 在 Xjt 的大作中提到: 】
: 为啥我们的prometheus就可以拿到每个pod cpu的使用率呢?
: 另外,如果是在云上,云本身都会有一堆工具吧?阿里云有k8s管理工具台,有Arms之类。。。
--
FROM 117.121.46.*
自建还是云更多的是公司策略了,这是老板们定的
【 在 Xjt 的大作中提到: 】
: 为啥要自建呢。。。自己造轮子的时代已经过去啦。
: 直接阿里云 SAE,连k8s你都感觉不到,spring cloud都不需要,只要上传spring boot代码就能弹性伸缩了
: AWS的话直接lambda,更方便
--
FROM 117.121.46.*
。。。有自己机房的企业还有很多,各种原因吧。
这个不是我关注的,哈哈
【 在 Xjt 的大作中提到: 】
: 除了金融,实在想不通啥老板这么想不开玩自建。。。
--
FROM 117.121.46.*
据悉快手等也是这样
做到一定程度,一定时间后,可能或多或少都是混着的
【 在 guestking 的大作中提到: 】
: 领导的想法,我也不知道
: 我们是在阿里云的虚机上面搭k8s环境
:
--
FROM 117.121.46.*
你们是在多云上,还是一个上面?
【 在 Xjt 的大作中提到: 】
: 线上系统出了问题,运维首先要接入,如果bug运维不管,那任何问题都可以甩锅说是开发的事情就好了。。。运维不管怎么能定位到具体是机器问题还是bug呢。。。要不怎么大家说 devops呢。。。
--
FROM 117.121.46.*
肯定不全是,虽然我不知道比例
【 在 Xjt 的大作中提到: 】
: 快手这种体量,肯定自建机房的。。。完全两码事吧
--
FROM 117.121.46.*
说明服务可以中断,没有高可用需求吧
【 在 guestking 的大作中提到: 】
: 我们还有自建机房
: 好在上面都是企业内部系统
: 换个网卡就要停止服务一晚上
: ...................
--
FROM 117.121.46.*
是的
【 在 guestking 的大作中提到: 】
: 高可用这种东西,你可以不要,但不能没有
: 总不能立项的时候说系统有比较大的可能不可用吧
: 我刚刚说的那种停机是计划内的
: ...................
--
FROM 117.121.46.*