云栖大会|AI+Data,新一代智能数仓的实践与畅想

joytrian
发布于 2023-11-28 14:48
浏览
0收藏

2023云栖大会上,阿里云瑶池数据库宣布已全面实现Serverless化,并接入通义等大模型能力,大幅提升数据库一站式及智能化水平。其中,企业级智能数仓AnalyticDB与通义大模型家族深度集成,推出一站式全托管大模型解决方案。阿里云新发布的8大行业模型及“百炼”平台均采用AnalyticDB作为内置向量检索引擎,性能较开源增强了2~5倍,加速AIGC应用落地。

来自PingPong、厦门国际银行、三七互娱、易点天下等知名企业代表和瑶池数据库团队产品及技术资深专家们结合真实场景实践,深入分享了AnalyticDB的最新技术进展和特性解析。此外,阿里云瑶池还宣布与ClickHouse、SelectDB发布战略合作产品公测,推进技术合作和生态协同,构建合作共赢的生态体系。

云栖大会|AI+Data,新一代智能数仓的实践与畅想-鸿蒙开发者社区

在云栖大会上,阿里云AnalyticDB MySQL产品部负责人林亮分享了AnalyticDB MySQL三大核心技术方向

1)云原生化:基于统一资源池,支持不同类型和规模的工作负载,按需升降,并结合新的存算分离架构,进一步解耦状态和异步计算;

2)一体化:支持日志、数据库等源头的高效无缝接入,通过统一的平台,提供跨源联邦分析,实现数据处理和分析一体化;

3)智能化:提供向量存储检索和大模型AI分析等功能,探索数据价值;智能诊断优化,基于机器学习监控实例状态,并优化潜在的性能瓶颈。

云栖大会|AI+Data,新一代智能数仓的实践与畅想-鸿蒙开发者社区

阿里云数据库事业部高级产品经理戚亚东发表了题为《云原生数据仓库AnalyticDB MySQL版新特性介绍》的精彩演讲。在演讲中,他重点分享了最近发布的Multi-Cluster弹性模型、智能负载管理WLM、增量更新物化视图、全托管Spark等能力。其中,Multi-Cluster弹性模型相比Min-Max弹性模型,由于更好的隔离性,在相同资源下,查询并发度QPS可以提升25%以上,并且支持自动弹性。全托管Spark能力通过数据缓存、向量化执行等能力,相比开源社区同版本Spark,性能可以提升2.7倍以上,已经帮助多个客户实现30-50%的降本迁移。

云栖大会|AI+Data,新一代智能数仓的实践与畅想-鸿蒙开发者社区

阿里云AnalyticDB PostgreSQL产品部负责人姚奕玮在大会上介绍了在AIGC时代下,企业对于云原生数仓的需求,具体可以归纳为:性价比、与LLM融合、一站式。并且基于这些需求,介绍了AnalyticDB for PostgreSQL的发力点和核心技术:极具高性价比的流批一体融合引擎;支持实时写入和二级索引的存算分离Serverless架构;融合LLM、提供仓内智能的一站式AIGC服务;与PolarDB无缝集成的一站式HTAP服务;以及例如租户隔离、数据脱敏、异地容灾和一致性位点备份恢复等企业级能力。

云栖大会|AI+Data,新一代智能数仓的实践与畅想-鸿蒙开发者社区

关于AI能力加持的企业级智能数仓AnalyticDB PosgreSQL阿里云数据库事业部OLAP/工具产品经理薛菲进行了详细介绍。她表示,对于企业级大模型项目冷启动、规模化复制和AI普惠三个阶段,AnalyticDB PosgreSQL分别提供了开箱即用的企业级知识库服务、GPU和向量数仓多租户管理及弹性扩展能力、内置的一站式AIGC开发服务,帮助企业实现大模型应用的快速扩大和可持续化的发展。

云栖大会|AI+Data,新一代智能数仓的实践与畅想-鸿蒙开发者社区

ClickHouse作为全球流行的开源实时分析数据库,凭借其优异的性能得到了广大开发者和用户的青睐,在国内外有大量全球知名客户在使用ClickHouse。ClickHouse联合创始人、ClickHouse产品技术总裁Yury Izrailevsky发表了《云数据库ClickHouse企业版发布,产品和最佳实践介绍》演讲,他重申:“ClickHouse将继续保持在实时分析性能方面的领跑优势,当前对比其他分析产品在数据加载场景有37倍左右的性能优势,在查询方面具有20倍以上的性能优势 ,同时ClickHouse公司牵手阿里云战略合作发布阿里云ClickHouse企业版,并启动公测”。

ClickHouse企业版具有非开源的商业化SharedMergeTree引擎,基于存储计算分离的云原生架构,支持完全Serverless使用模式,可以帮助用户降低80%存储成本,50%的计算资源成本。

云栖大会|AI+Data,新一代智能数仓的实践与畅想-鸿蒙开发者社区

“数据分析越实时越能为业务带来更大的价值收益。”飞轮数据CEO,Apache Doris 项目创始人马如悦分享了当前最流行的实时数仓之一Doris以及其蓬勃发展的开源社区。在会上,重磅发布了100%兼容Doris的商业化云原生实时数仓阿里云数据库SelectDB版,并正式启动公测。云数据库SelectDB版具备云原生存算分离,共享存储,单实例多集群的资源隔离能力,比用户自建Doris降低30%的资源成本。

云栖大会|AI+Data,新一代智能数仓的实践与畅想-鸿蒙开发者社区

金融独角兽PingPong智能数据架构师张彦锋分享了《PingPong x AnalyticDB:实时数仓演进之路》。在会上,他介绍了PingPong数据平台的演进路线:从最初的在RDS MySQL中做分析遇到在线业务和分析业务隔离问题,最终演进到一体化的AnalyticDB MySQL版,在一个产品中支撑所有数据处理和分析业务。他表示,通过使用AnalyticDB MySQL版提供的数据冷热分层能力,存储成本下降50%以上。

云栖大会|AI+Data,新一代智能数仓的实践与畅想-鸿蒙开发者社区

厦门国际银行总行科技运维部数据管理二处经理王淇霖为现场和线上观众介绍了基于AnalyticDB PostgreSQL的升舱实践以及对新一代数仓架构的展望。他提到,通过AnalyticDB PostgreSQL,行内在线关联查询性能总体提升了2-3倍,同时实现了混合业务负载的资源隔离。

王淇霖表示,由于AnalyticDB PostgreSQL具备好的SQL兼容性、存储过程支持和细粒度的资源资源隔离,因此业务从大数据平台迁移到AnalyticDB PostgreSQL仅花费10天时间就完成,上线至今稳定运行无故障。为应对实时的业务需求,目前行已开始实现业务试点,希望未来能基于AnalyticDB PostgreSQL提供流批一体和AI原生能力,可以支撑实时和AI创新业务的快速落地。

云栖大会|AI+Data,新一代智能数仓的实践与畅想-鸿蒙开发者社区

迄今为止,37手游累计运营逾2000款手机游戏。游戏客户体验回答僵化、问题理解性低以及运营成本高一直是37手游的痛点和跳转。三七互娱37手游AI算法负责人彭佳铭向现场观众介绍了AnalyticDB PostgreSQL在智能游戏客户上的应用实践。他提到,37手游通过大模型和AnalyticDB PostgreSQL向量引擎实现了全新的AI智能客服体验升级,回答准确率总体提升了20%,对于用户的意图识别和共情能力上有显著的增强,同时服务效能也提升了15%,该框架可以规模化复制到其他手游中。

云栖大会|AI+Data,新一代智能数仓的实践与畅想-鸿蒙开发者社区

如何激活数据创新价值,以DataOps助力企业实现业务敏捷?易点天下高级技术总监贺鑫分享了公司广告营销平台的业务变迁过程以及DataOps平台的建设历程

平台搭建伊始依赖自建、开源、半托管的技术栈,技术栈多样化,缺失数据治理,数据获取效率低。通过构建统一入口、统一体验的DataOps平台,降低数据分析使用复杂度,技术选型从离线非实时的Hadoop、Spark升级到阿里云ClickHouse实时数仓。DataOps平台支持了更加实时的业务需求,提升了80%的业务收益,40%的数据计算成本。同时,在测试了阿里云ClickHouse企业版的Serverless能力后,对比社区兼容版可进一步降低20%-40%的计算资源用量,降低20%+的存储资源成本。


文章转载自公众号:阿里云瑶池数据库

分类
标签
已于2023-11-28 14:48:35修改
收藏
回复
举报
回复
    相关推荐