本文为DeepFlow在首届云原生社区可观测性峰会上的演讲实录。回看链接[1],PPT下载[2]。很高兴有机会在第一届可观测性峰会上向大家介绍我们的产品DeepFlow,我相信它会是今天eBPF含量最高的一个分享。DeepFlow的能力很多,而我今天的分享会聚焦于一个点上说透,希望大家由此感知到eBPF带给可观测性的变革。那么我今天要分享的内容就是,DeepFlow如何利用eBPF技术,在不改代码、不改配置、不重启进程的前提下,自动绘制云原生应用...
2023-05-10 11:26:33 1431浏览 3点赞 3回复 1收藏
测试小姐姐正在对云原生的电商应用进行压测,但是如何对压测结果进行持续的观测呢?这一直是比较头痛的事情,本文将介绍如何利用DeepFlow的全景拓扑帮助小姐姐快速找到瓶颈点。DeepFlow全景拓扑无需业务修改代码、配置或者重启服务,利用BPFeBPF技术通过对业务零侵扰的方式构建而来,这是一种很便捷且低成本的方式来观测全链路压测的结果。01|背景介绍DeepFlow在线的Sandbox环境中部署了一个云原生的电商应用,此电商应用来源...
2023-04-23 11:48:54 750浏览 0点赞 1回复 0收藏
微服务架构已经是后端架构领域老生常谈的话题了,微服务治理、发现等技术已经在业界有了很多成熟的解决方案,Dubbo作为一个社区认可度较高的微服务治理框架也在这个方面颇有建树。但是在微服务架构中,服务的数量和复杂度都远超过之前的单体架构,如何保证服务的稳定和高效运行呢?这时候,可观测性就显得尤为重要。我们都知道Dubbo自身有指标监控[1],但仅聚焦在应用代码层面,同时指标只是可观测性主要的数据之一,我们还需要...
2023-04-18 15:35:26 634浏览 0点赞 0回复 0收藏
本文整理自云杉网络DeepFlow产品负责人向阳在QCon2023的演讲分享,主题为“基于eBPF的云原生可观测性深度实践”。分享从四个方面展开。第一部分回顾分布式追踪的十四年历史,剖析云原生时代下的新痛点。第二部分讲解AutoTracing——DeepFlow基于eBPF的一项颠覆性创新,零代码修改实现分布式追踪。第三部分讲解如何结合OpenTelemetry,发挥两项新技术的特长,实现全栈、全链路的分布式追踪。第四部分展望DeepFlow开源社区的未来...
2023-04-13 16:01:08 2005浏览 3点赞 3回复 1收藏
传统APM聚焦在代码层面,不具备全栈多维度无盲点看问题的能力,同时由于插码的阻碍往往难以覆盖所有微服务,DeepFlow依靠eBPF零代码修改采集全栈追踪数据并聚合生成了调用关系,可以增强传统APM的数据,大大缩短问题定界时间。对于已经使用传统APM工具的用户,可以考虑使用DeepFlow提供的API来增强应用依赖拓扑及调用追踪,以获得全栈数据追踪能力。本文以SkyWalking为例从落地实现角度来描述,如何将在传统APM中集成DeepFlow的...
2023-03-27 17:26:35 1873浏览 5点赞 3回复 3收藏
随着分布式服务架构的流行,特别是微服务等设计理念在现代应用普及开来,应用中的服务变得越来越分散,因此服务之间的通信变得越来越依赖网络,很有必要来谈谈实现微服务可观测性中越来越重要的一环——云原生网络的可观测。K8s是微服务设计理念能落地的最重要的承载体,本文主要聚焦谈谈K8s的网络可观测性,以及其给基础设施应用等团队能带来的价值。谈K8s网络可观测性之前,先简单了解下K8s的网络通信是如何实现的,CNCF定义...
2023-03-21 15:44:15 922浏览 1点赞 0回复 0收藏
应用异常时,基本可以分为服务访问不通和服务响应慢两个大类。其中服务响应慢的问题定位非常棘手,很多无头案。应用团队有日志和追踪,对于自认为的不可能不合理的事情都会甩给基础设施团队,又由于基础设施团队现有的监控数据缺乏应用的观测视角,通常成为一切「不是我的问题」超自然现象的终极背锅侠,其中以网络团队尤为严重。01|响应时延服务为什么响应慢???首先,我们需要一种方式来度量何为响应慢,参考Google在SREHa...
2023-03-06 11:41:42 1276浏览 7点赞 6回复 2收藏
故障发生在2023春节前两天,DeepFlow团队内部访问工单系统出现问题,影响了所有北京区的同事,这篇文章将详细记录如何利用DeepFlow定位到对这次问题根因(网关MSS误变更导致报文大于MTU,大数据报文被丢弃)。01|背景介绍工单系统是DeepFlow团队自主研发的一个跟踪工单的内部工具,部署在阿里公有云的容器服务(ACK)中,工单系统通过Ingress的方式对外提供服务,办公区与阿里云通过VPN连接,因此办公区可以直接使用域名访问工...
2023-02-14 11:56:08 2746浏览 9点赞 6回复 8收藏
undefined复制链接,查看回放视频++https:www.bilibili.comvideoBV1AM411b7E3vdsource8217e32e9012f691b56ca71735c1a472++···为了探究云原生应用系统的内部状态,我们希望向观测数据中注入尽量丰富的标签,这些标签以往通过开发人员手动在代码中注入,或通过配置Promtheus、OpenTelemetry实现,一方面造成了很大的工作量和资源开销,另一方面也导致不同信号源的数据标签不一致形成数据孤岛。DeepFlow依靠AutoTagging机制可以...
2023-02-01 11:51:35 2540浏览 6点赞 5回复 6收藏
undefined当项目中存在一些大型编译项目时,由于机器性能不足,导致研发花费大量时间等待构建,浪费生命,本文带你了解DeepFlow如何使用阿里云ECISpot弹性实例打造低成本高性能无限并发的GitlabRunner。0x0:背景一般使用GitlabCI都是创建一台虚拟机,注册为GitlabRunner。我们项目中的deepflowagent使用Rust编写,对编译机性能要求非常高,在多人同时提交代码时虚拟机经常卡顿,造成所有开发等待编译,浪费时间浪费生命。发现这...
2022-11-07 13:20:47 2359浏览 0点赞 0回复 0收藏
本文为云杉网络原力释放云原生可观测性分享会第十期直播实录。回看链接[1]。大家好,我是云杉网络DeepFlow的云原生工程师宋建昌,今天给大家带来的主题是《DeepFlow在KubeOVN环境的可观测实践》今天讲解的主要内容是:第一:DeepFlow高度自动化的可观测性能力;第二:DeepFlow一键开启KubeOVN的可观测性;第三:DeepFlow在KubeOVN环境下的实际应用。01|DeepFlow高度自动化的可观测性能力为什么需要可观测性,以及可观测的概念...
2022-11-04 15:56:01 2252浏览 1点赞 0回复 0收藏
第九期“原力释放云原生可观测性分享会”云杉网络产品专家李倩分享了DeepFlowAutoLogging功能,可以自动采集网络流日志,并提供丰富的性能指标和精细至每包的TCP时序日志,与应用调用日志结合提供完整的全栈回溯能力。b站回看地址:https:www.bilibili.comvideoBV1Z14y147XMvdsource8217e32e9012f691b56ca71735c1a472大家好,我是云杉网络DeepFlow的产品经理李倩,今天给大家带来的主题是《DeepFlowAutoLogging:自动采集应用调...
2022-08-25 15:44:33 5160浏览 5点赞 2回复 2收藏
01|认识DeepFlow直播间的朋友们大家好,很高兴能和大家分享DeepFlow首个开源版本的正式发布。我相信通过我今天的介绍,大家能够感受到一个高度自动化的可观测性新时代,让我们一起来去见证和开启。下面是DeepFlow社区版的架构图,有些朋友对DeepFlow还不太了解,我简单介绍一下。DeepFlow是云杉网络自研的可观测性平台,基于eBPF等技术的一系列创新,使得它具备高度的自动化,为开发者构建可观测性显著降低工作负担。我们可以...
2022-08-11 10:44:40 5174浏览 7点赞 4回复 2收藏
可观测性建设从去年开始在国内非常的火热,大家谈的越来越多。随着云原生、微服务的发展落地,可观测性建设逐渐成为了一个必不可少的工程手段。开发者通常需要去思考建设可观测性的方方面面:如何在不同的DevStack和InfraStack中埋点、如何插码、如何传递追踪上下文、如何生成指标追踪日志数据并进行关联,需要考虑的问题太多太杂,导致应用开发团队花了一半的时间用于可观测性的建设。一、可观测性建设的痛点1)建设可观测性平...
2022-06-01 17:05:20 4508浏览 0点赞 0回复 0收藏