在9月19日举办的火山引擎“V-Tech数据驱动科技峰会”上,火山引擎宣布在数据平台VeDI上加装全新的“AI助手”,即便不会写代码的运营人员,通过与大模型的对话,也可以做好业务运营数据的取数、看数、归因分析等。目前,VeDI相关数据产品已启动邀测。

  字节跳动数据平台负责人罗旋在会上表示,“数据飞轮”模式,是从字节跳动内部大量实践中沉淀提炼出来的。他介绍,随着字节业务的不断发展,数据产品使用也出现了很多新的变化。一方面,使用人群越来越广,相对于早期,现在更多的非技术背景人员已经参与到数据消费的过程中。另一方面,消费场景也越来越多,从之前更加侧重辅助决策,拓展到监测预警、分析预测,实时业务决策等多个层面,覆盖了整个业务过程。

  字节跳动数据平台罗旋:数据平台已加装“AI助手”

  这一背景,就对数据产品提出了越来越高的要求,需要更高的数据时效性,支撑实时的决策&业务行动,同时也需要更强更多样化的能力,覆盖非常不一样的业务场景。

  尤为重要的是,企业迫切希望通过降低数据使用门槛,让更多非技术背景的员工能参与到数据消费的过程中,让各种背景的人群,都能够自由灵活的使用数据。

  大模型的出现,给数据工具的发展提供了新的探索方向——即利用大模型在交互和效率上的提升,降低数据产品使用门槛,加速企业“数据飞轮”的转动。

  火山引擎通过字节跳动内部的一系列探索实践,利用大模型强化了自身的数据产品,为企业的数据消费和利用提供了新的渠道和工具。

  首先,在数据资产管理上,探索了AI找数助手,通过大数据治理研发套件DataLeap-找数助手可以实现用自然语言问答的方式,检索包括表、数据集、仪表盘、数据指标、维度、业务知识库等等,做出拟人化总结。在与用户对话式交互的过程中,大语言模型(LLM)可以更好的理解用户真实意图,也可以给用户较贴近人工响应的体验,让“找数”本身的成本变得更低,整个过程有更大的可能用户可以自助的完成。

  在数据生产环节,则研发了基于大模型的DataLeap-开发助手,既可以将用户的自然语言描述,自动生成SQL代码,也可以针对存量已有的代码,做诊断优化、问题修复,代码的解释与注释等等,同时覆盖传统的文档搜索、函数使用、代码示例等辅助性需求。

  开发助手在很大程度上,减小了编程语言带来的障碍,降低了数据开发的准入门槛。一方面,不是特别精通SQL语言的人员,也开始能做一些简单ETL工作,另一方面,专业的数据研发人员,则可以从大量繁杂且基础的需求中解放出来,更聚焦复杂场景的需求,使生产效率得到大幅度的提升。

  在数据洞察环节,火山引擎还提供了DataWind-分析助手。用户只要输入自然语言,就可以查询想要的数据、生成表达式,或是由可视化图表组成的仪表盘。DataWind-分析助手则可以打通飞书等办公协同工具,使用户可以通过IM消息订阅+自然对话,做更多的延展分析,让数据分析能更加灵活,更加随时随地的发生。