为高质量支撑2024年客服大模型商用,中国移动构建了客服大模型“混合云”生产环境,确保大模型应用安全稳定运行、智算资源高效利用。面对当前跨云调用拓扑的复杂性,以及运维保障与业务运营中服务质量观测指标的缺失问题,多团队共同合作基于eBPF与Wasm技术构建客服大模型生产运行态可观测能力。01|大模型服务的观测需求在基于基础大模型构建的客服大模型中,虽然这些基础模型在自然语言处理方面表现出强大的计算能力,但其训...
2024-11-12 10:54:16 1715浏览 0点赞 0回复 0收藏
摘要:某银行分布式核心交易系统运行过程中,遇到了偶发性、无规律的交易失败,由于交易请求海量、通信关系复杂、应用实例动态等系统特点,传统监控工具的诊断能力受限,此类故障诊断极其困难。但在本篇案例中,您将看到DeepFlow可观测平台提供的FullStack(全栈)、EndtoEnd(全链路)、AnyRequest(每一次应用调用)观测能力,精细化分析每一次失败交易的端到端过程,用3分钟时间、5步操作,通过可观测性数据客观诊断出故障根...
2024-11-06 14:51:01 1899浏览 0点赞 0回复 0收藏
摘要:在某国有银行的信创云日常运维中,发现大量未知的垃圾文件,存在严重的系统运行隐患,其承载的分布式核心交易系统的运行稳定性随时可能受到影响,运维人员尝试寻找产生垃圾文件的源程序,但却发现传统监控工具对未知程序在未知时间、未知节点、未知路径,写入未知文件的故障诊断并不是一件容易的事情,而DeepFlow使用eBPF技术实现的可观测性可以为运维人员提供纤毫毕现的文件读写观测能力,让此类问题的诊断定位变得极其...
2024-10-15 10:28:18 2011浏览 0点赞 0回复 0收藏
摘要:金融行业信创迁移过程中,故障定界困难、定位周期长、开发测试速度缓慢、生产运行风险高等因素正在不断地拖慢相关工作的效率和速度。如何让金融科技部门的业务信创迁移更快、更高效、更平滑?DeepFlow通过eBPF带来的零侵扰、全栈、全链路可观测性技术,可以大幅度提升信创全系统的可观测性,从根本上扫除信创道路上故障诊断的技术阻碍。通过本篇案例您将了解到,某股份制银行在分布式核心交易业务向信创平台迁移的开发测...
2024-10-09 10:23:43 3387浏览 0点赞 0回复 0收藏
摘要:IO线程阻塞是Java程序经常出现的问题之一,此类故障发生时Java程序的请求、响应在IO线程向操作系统SocketBuffer读写过程中发生阻塞,由于在业务代码插桩无法观测到IO线程的工作情况和性能表现,因而导致故障非常隐蔽和难以诊断定位。通过本篇案例您将了解到,某银行的开发工程师如何使用eBPF技术带来的零侵扰追踪能力,在某次分布式核心交易系统上线信创平台的非功能测试(性能压测)故障诊断中,用3分钟时间锁定Java程序...
2024-09-24 14:25:34 6309浏览 0点赞 0回复 0收藏
本文分享借助DeepFlow在某头部劵商业务压测场景中通过调用链追踪快速定位问题的过程。解决在容器云内等复杂调用场景中解决传统监控手段覆盖不全面、排障定位无手段等痛点。分享利用DeepFlow如何快速在复杂的业务调用过程中抽丝剥茧,快速排除网络问题,定位Pod服务自身业务逻辑问题,展现DeepFlow产品价值。背景介绍某头部券商OCR识别业务压测多个后端服务Pod时,偶发性业务响应时延高问题,当出现故障时集中某一Pod出现时延3s...
2024-09-23 09:49:21 4278浏览 0点赞 0回复 0收藏
作者:肖圆,高级研发工程师,负责金山办公私有化产品运维平台研发、监控告警体系建设、可观测性体系建设。金山私有化项目在可观测性建设中,面临数据孤岛和缺乏全局视图的挑战,影响了问题排查效率。为此,引入DeepFlow和eBPF技术,打通了指标、追踪和日志数据的联动,提供了全局微服务调用关系。通过分阶段建设,已完成第一期目标,实现了从被动排障到主动观测的转变,提升了系统稳定性和运维效率。01|业务排障面临的痛点在...
2024-09-20 09:57:53 5911浏览 0点赞 0回复 0收藏
随着云原生技术的广泛应用,社会数字化快速发展,政府、金融、通信、电力、制造、消费等各行各业正在不断的被数字化、智能化改变,涌现出越来越多的大型、超大型IT业务。随之而来的是IT业务系统的复杂度越来越高,开发迭代速度越来越快,系统规模越来越大,运行风险越来越高,而业务抖动、业务故障的经济影响、社会影响也越来越广泛。为了应对新的IT生产力带来的业务保障能力的挑战,可观测性技术快速发展和成熟,成为云原生时...
2024-09-19 15:01:11 5406浏览 0点赞 0回复 0收藏
DeepFlow是一个基于eBPF技术的云原生监控平台。它不需要修改现有代码,就能展示应用的性能指标、访问路径和调用链等信息。使用DeepFlow,云原生应用可以自动获得详细的监控能力,减少开发者手动添加监控代码的麻烦,同时为DevOps和SRE团队提供从代码到基础设施的全面监控和诊断能力。部署前环境准备DeepFlow支持多种环境部署,本篇文章以K8sAllinOne环境为例来演示如何部署DeepFlow。在开始部署DeepFlow之前,需要先搭建K8s环境...
2024-09-14 15:39:22 7182浏览 0点赞 0回复 1收藏
作者:姜远川,后端研发工程师,来自富途技术工程部本文分享了富途证券引入基于eBPF的可观测性方案DeepFlow,以应对传统APM所面临的诸如代码侵入性强和覆盖不全面等挑战的过程。在TKE超级节点等复杂场景的落地过程中,我们与社区密切合作,解决了多项兼容性和性能问题。通过DeepFlow,我们快速定位了一个DNS解析引起的MySQL超时故障,验证了该方案的价值。未来,我们计划将内部观测平台和DeepFlow相结合,以持续拓展其应用场景...
2024-09-10 10:44:29 7737浏览 0点赞 0回复 0收藏
摘要:Java程序Hang是应用运维中经常遇到的故障类型,由于此类故障与操作系统调度、应用代码逻辑等均有复杂的相互催化关系,故障触发条件极难确定,因此也是故障诊断中最难啃的骨头之一。在此篇案例中您将看到,某银行在分布式核心系统“认证网关Hang”故障的诊断过程中,如何使用DeepFlow大模型智能体快速分析Java程序CPU持续剖析数据,在故障发生后3分钟内迅速定位出Hang的原因。01|简介近日,某银行分布式核心系统安全认证...
2024-09-05 09:44:21 7875浏览 0点赞 0回复 0收藏
DeepFlow可观测性平台以eBPF技术实现的零侵扰(ZeroCode)分布式追踪为核心,不仅实现了面向应用的全栈(FullStack)观测能力,同时通过开放的数据集成接口和智能标签(SmartEncoding)技术支持汇聚外部的Metrics、Tracing、Logging、Profiling等各类的海量观测数据,消除运维数据孤岛,为IT系统的运行维护、安全监测、运营分析提供统一的可观测性数据综合解决方案。在本篇实践案例中,将向您介绍如何在DeepFlow可观测性平台快...
2024-08-23 14:15:26 5721浏览 0点赞 0回复 0收藏
DeepFlow可观测性平台以eBPF技术实现的零侵扰(ZeroCode)分布式追踪为核心,不仅实现了面向应用的全栈(FullStack)观测能力,同时通过开放的数据集成接口和智能标签(SmartEncoding)技术支持汇聚外部的Metrics、Tracing、Logging、Profiling等各类的海量观测数据,消除运维数据孤岛,为IT系统的运行维护、安全监测、运营分析提供统一的可观测性数据综合解决方案。在本篇实践案例中,将向您介绍如何在DeepFlow可观测性平台快...
2024-08-23 11:00:51 5859浏览 0点赞 0回复 0收藏
DeepFlow可观测性平台以eBPF技术实现的零侵扰(ZeroCode)分布式追踪为核心,不仅实现了面向应用的全栈(FullStack)观测能力,同时通过开放的数据集成接口和智能标签(SmartEncoding)技术支持汇聚外部的Metrics、Tracing、Logging、Profiling等各类的海量观测数据,消除运维数据孤岛,为IT系统的运行维护、安全监测、运营分析提供统一的可观测性数据综合解决方案。在本篇实践案例中,将向您介绍如何在DeepFlow可观测性平台快...
2024-08-23 10:17:58 6779浏览 0点赞 0回复 0收藏
本文整理自云杉网络DeepFlow解决方案负责人李飞在“智能可观测运维技术MeetUp”的演讲内容,主题为「DeepFlow零侵扰数据能力构建AIOps的基石」。感谢中兴通讯和龙蜥社区的邀请,今天非常荣幸代表云杉网络和DeepFlow,向大家分享DeepFlow如何使用零侵扰的可观测性数据构建AIOps建设的基石,以及使用“大模型AI智能体”+“DeepFlow可观测性数据”逐步探索构建AIOps的进展和发现。01|回顾历史,AIOps建设中的数据质量之苦从我毕...
2024-07-24 15:04:34 3856浏览 0点赞 0回复 0收藏
6月22日,由开源中国主办,华为、上海浦东软件园联合主办的【云技术专场】OSC源创会·上海站·104期线下沙龙成功举办。来自云杉网络的DeepFlow高级产品经理李倩发表了《DeepFlow实战:eBPF技术如何提升故障排查效率》主题演讲,展示通过零侵扰数据采集、应用性能指标监控、分布式追踪和持续性能剖析等技术实现零侵扰的高效故障排查。随着云原生应用的发展,IT系统的复杂度呈指数级增加。连接微服务的基础设施越发复杂,路径数量...
2024-07-11 15:30:01 3208浏览 0点赞 0回复 0收藏
作者:闻长明,企迈科技质量运维总监企迈科技是数字化门店SaaS服务的领先者,通过全渠道连接门店与顾客,提升经营效率和竞争力。近几年业务规模迅速扩大,技术架构面临性能和稳定性挑战,促使企迈引入DeepFlow作为可观测性平台,通过eBPF技术实现零侵扰的数据采集和分析。DeepFlow帮助企迈优化性能、快速定位问题,并通过全栈调用链追踪和持续性能剖析提升服务质量。未来,企迈计划进一步融合eBPF数据与其他监控数据,构建全栈...
2024-07-08 10:53:40 3386浏览 0点赞 0回复 0收藏
背景01.软件定义汽车随着智能网联汽车技术的进步,软件和人工智能技术已成为汽车产业的重要支撑,推动了汽车从传统机械代步工具向新一代移动智能终端的转变。汽车电子电气架构的升级当下已从分布式向域控制中央集中式方向发展。通信架构由LINCAN总线向以太网方向发展。整车软件架构从面向信号的软硬件耦合架构向面向服务的分层解耦软件架构转变。从最初的各个子系统独立的ECU运算,到按功能划分的域控制器集成化运算,再到最终...
2024-06-28 17:23:36 1418浏览 0点赞 0回复 0收藏
摘要:APISIX被越来越多的用户选择作为IT应用系统的入口,由于故障定界能力的缺失,在IT业务故障诊断过程中,APISIX经常成为重点“怀疑对象”,一方面“劳师动众”投入大量运维人力定位,另一方面诊断方向“南辕北辙”,因而业务故障“久拖不决”。通过本篇文章复盘重现某全球领先的智能终端提供商近期对核心业务响应时延劣化故障的处理过程,您将直观了解到“南辕北辙”现象对诊断效率的决定性影响,以及DeepFlow可观测性平台...
2024-06-17 15:31:56 3260浏览 1点赞 0回复 0收藏
本文是基于DeepFlow构建API网关统一可观测性能力系列的第二篇,旨在阐述如何解决API网关可观测数据孤岛的问题。本文将介绍如何使用DeepFlow基于eBPF的零侵扰特性构建Kong网关的可观测性解决方案,在此基础上统一集成Kong插件已有的丰富数据源,消除孤岛、构建统一的可观测性平台,以全面监控和分析Kong网关。通过DeepFlow,Kong网关可以实现从流量监控、追踪分析、到性能优化的全面可观测性,消除数据分散并提供中心化的监控视...
2024-06-06 14:55:14 3664浏览 0点赞 0回复 0收藏