声网发布 aPaaS 灵动会议：RTE + AI，打造下一代会议产品

9月24日，声网在北京举办了主题为“AI重塑会议协作”的产品发布会，正式发布了 aPaaS “灵动会议”，该产品通过领先的RTE技术，融合生成式 AI能力重塑会议协作使用体验，为客户提供低代码视频会议平台，并且采用了多云、多平台设计，提供 SFU+MCU 混合架构部署能力，支持客户进行灵活部署和扩展，全面满足客户会议、协作和调度需求。

“RTE 技术确保了低延迟、高质量的音视频传输，让视频会议沟通更加实时流畅；而生成式 AI 则通过对会议内容的分析和生成，提供智能化的辅助功能，如实时字幕、AI会议纪要等。两大技术支撑，让会议从传统的信息传输工具升级为智能协作平台，有效提升了会议效率和用户体验。"声网数字化行业负责人和利鹏介绍。

AI 成为下一代视频会议的新方向

随着技术的演变和企业转型对降本增效的需求，国内视频会议正在发生三大核心变革：AI赋能，会议向智变；MCU 退场，云会议崛起；以及从会议工具到业务能力。

首先是生成式 AI 技术的快速发展，会议系统正在经历从“信息通道”向“智能决策引擎”的转变，过去的会议系统只承担信息传递的功能，而如今，AI 赋能为会议提供了更多智能化的支持。其次，传统的 MCU 会议系统依赖昂贵的专用硬件，给企业带来了高成本的压力，而云会议系统凭借其灵活、兼容、高效的优势，逐步取代了传统 MCU 系统。

最后，由于企业数字化转型的深入，会议系统不再是孤立的工具。企业需要将会议功能与其现有的业务系统深度集成，无论是内部协作、客户支持还是市场营销，会议都必须与业务流程紧密结合。

随着市场的不断变化，尤其是政企，需要一款能够满足云会议架构需求、支持业务集成的开放API能力，同时具备创新AI引擎架构的产品，在此背景下，声网推出了“灵动会议”aPaaS 产品。

AI+RTE 解锁全新智能化会议体验

“灵动会议”产品采用RTE Core 和 AI Core 的双引擎深度融合，能够灵活适配多种会议场景业务需求。

基于声网自研的AI Agent 框架，“灵动会议”能够兼容市场上主流的 ASR（自动语音识别）、LLM（大语言模型）和 TTS（文本转语音）技术，具备 Workflow 编排能力。尤其是声网的 AI 框架支持多模态大模型的集成，这意味着企业不仅可以使用单一模型（如语音识别模型），还可以将多模态的大模型能力（如图像、音频、文本处理等）融合到一起，满足更复杂的会议场景需求。

同时，通过“灵动会议”产品底层的AI框架，开发者可以高效地集成会前、会中、会后场景的多种 AI 功能，如AI会议纪要、实时翻译、AI助手等，满足实时互动和会议场景的需求。并且，开发者还能通过“灵动会议”的产品架构将这些 AI 功能独立对外赋能其他产品，这意味着企业不仅能在会议场景中实现智能化升级，还可以通过灵动会议的 RTC 与 SIP 网关互通功能，应用于如 AI 电话客服等场景，大幅降低客服成本，提升运营效率。

在集成方式上，“灵动会议”采用aPaaS低代码设计，通过提供模块化的API、UI组件和即插即用的集成功能，使得开发者可以在较短的时间内完成集成，无需进行大量的底层开发。如果UI不能满足，“灵动会议”还提供多层次API接口与插件机制，支持基于SDK Core层和 RTE PaaS 层的定制，满足多场景需求，通过标准的插件机制，客户无需依赖原厂即可通过插件实现自己的会中功能，提升开发和上线效率。

“通过这些智能化功能的深度结合，灵动会议为用户带来了全新的会议体验。AI 不再是一个单一的工具模块，而是通过与声网 RTE 平台的深度融合，真正参与并优化会议的各个环节。这就是我们所说的AI会议——AI深度嵌入会议流程，重新定义了会议的方式，而不是简单地为会议提供AI功能的‘会议AI’。”和利鹏表示。

SFU+MCU 混合架构，支持灵活部署和扩展

在传统企业数字化转型时，视频会议不但要考虑和已有业务系统集成和打通，还需要充分利旧传统会议设备。当企业已经拥有传统 MCU 架构时，扩展到新的云视频架构的传统做法是使用视频网关将两种架构进行转换，但这种方法需要额外的设备并消耗更多资源。

而“灵动会议”产品提供了最新的解决方案：支持 SFU+MCU 混合架构。“MCU 模块与 SFU 模块直接集成，抛弃了传统的网关架构，通过裸流通信技术，实现终端设备与云端的直接互通，解决了网关集成时的画质损失问题，并且混合架构支持 MCU 上的多个硬件终端与云端 SFU 的软终端之间的多画面灵活组合，用户可以自主选择多个视频流进行合成，不再局限于画中画模式。这一解决方案适用于大规模会议和复杂网络环境，帮助企业实现音视频会议系统的全方位升级。”声网灵动会议技术负责人夏磊介绍。

此外，在部署方式上，“灵动会议”支持多种部署模式，包括私有化、混合云、公有云等，能够灵活适应企业的不同安全和合规要求。同时，“灵动会议”还支持混合云和公有云的无缝备份与切换，确保业务的连续性和数据的安全性。

音视频黑科技提升视频会议体验

对于如何能保障整体的视频会议体验？夏磊现场介绍，“灵动会议”依托声网 SD-RTN™ 软件定义实时网，能做到80% 丢包情况下，音视频通话流畅，以及极致的抗弱网能力，超低卡顿，国内视频平均卡顿率小于 1.1%，海外视频平均卡顿率小于 2%，随时随地提供高质量视频会议服务。

不仅如此，声网的多项音视频“黑科技”也在刷新视频会议互动场景体验天花板，有专为实时互动打造的自研高清语音引擎，视频增强策略、AI降噪和回声消除能力等技术，让用户拥有更高画质、更纯净、更流畅的视频会议体验。

现场，会畅通讯产品总监王晖针对 AI 重塑视频会议的思考。他表示，AI 在给视频会议场景带来全新体验的同时也带来了挑战，比如准确度、企业信息安全、实施成本等问题。

在这些问题上，涉及企业数据信息的服务，会畅通过混合云 2.0 帮助客户在本地部署，保障企业信息安全性；灵活度上，会畅平台支持集成三方 AI、翻译、H5等，为企业提供个性化需求；成本上，应当充分利用企业现有的资源，而不是重复采购建设，会畅会充分考虑到企业现有资源，如企业已有的传统硬件终端利旧、本地自有语音线路、本地自有AI模型，降低视频会议场景部署的实施成本。

圆桌：AI浪潮下，如何重塑会议与协作体验？

在发布会的最后，会畅通讯产品总监王晖、京东科技协同办公业务部产品经理曾冠、科达-摩云视讯销售总监俞中、声网数字化会议解决方案负责人尚敬超，围绕“AI浪潮下，如何重塑会议与协作体验？”话题进行深度交流和探讨。

在谈到AI为视频会议带来的改变时，王晖提到，利用 AI 为企业客户提供定制化的功能，在会前、会中、会后都加入AI，让会议沟通更加有效率，开会体验更佳。俞中则认为，随着底层音视频能力与AI自身学习能力的提升，视频会议的整体效果会演变得更加优秀，比如沉浸式的3D场景将会是 AI 大显身手的方向。

尚敬超认为，“AI 技术会让视频会议脱离工具属性，真正融入生活，例如原本成本较高的同声传译场景，通过 AI 也可以让多语言视频会议的成本进一步压缩，降低所有人的使用门槛。”

关于会议AI 的想象空间，曾冠认为，“通过 AI 和穿戴设备，未来的沟通方式将从信息沟通变为“所见即所得”，帮助用户快速获取想得到的内容，从而更好的服务于工作。”尚敬超认为，“未来的会议主要是AI参与，人只需要最终下一个指令做决策，从而摆脱无穷无尽低效会议的束缚。而这背后，实时性和辅助决策也是最重要的两点。”