对着支付宝智能助理说“帮我点一杯热美式咖啡”,收到指令后的机器人就能替你操作下单,并现场递上一杯热气腾腾的咖啡——这是2024年世界人工智能大会参观观众必打卡体验之一,来自“镇馆之宝”支付宝智能助理的“手作”咖啡。
7月4日,2024年世界人工智能大会(以下简称WAIC)在上海浦东开幕,获得“镇馆之宝”的支付宝智能助理在蚂蚁集团展区亮相,这是支付宝推出的一款全新的生活办事AI产品,它围绕用户的吃、喝、行、游、办事、买票、娱乐等数十种生活场景,不仅“有脑有嘴能对话”,还“有手有脚能办事”。此外,与智能助理并称为支付宝“三大AI管家”的AI金融助理、AI就医助理等拳头产品也亮相展区,三大管家背后的关键技术“智能认知决策技术与平台”也入选了本届WAIC“卓越人工智能奖(SAIL)TOP30”。蚂蚁集团围绕AI规模化应用的核心产品和关键技术首次全面亮相。
支付宝三大AI管家齐亮相,智能助理和背后关键技术双双获奖
“大模型进入应用时代,如何用最先进的技术做最普惠的服务,是蚂蚁AI一直在攻关的方向”,蚂蚁集团大模型应用负责人顾进杰在展区现场向记者讲述了蚂蚁三大核心AI应用和背后的技术思考。
据介绍,首次展示的“支付宝智能助理”是国内首款办事型的AI生活管家。依托支付宝这一国内最大的服务型App,用户不用找入口,通过“闲聊”就能完成办事、问诊、打车等服务。为了让智能助理的服务能力得到具象化展示,蚂蚁展区搭建了智能助理与咖啡机器人的联动。记者参与了现场体验,只需简单对话,就能获得一杯热气腾腾的咖啡。同时,AI点单这一新功能,也已在支付宝App开启测试,首批支持星巴克、瑞幸、喜茶、霸王茶姬、蜜雪冰城等12个茶饮品牌的支付宝小程序。用户通过支付宝智能助理下达指令,比如“我想点一杯星巴克的中杯冰拿铁”,AI便会进入小程序自动下单,用户确认并付款后,就能到附近的线下门店取到咖啡。
在展区现场,退休的视频博主王小燕也向记者讲述了她与AI新助手“支付宝智能助理”的故事。王小燕去年退休后在网上化名“阿旺”开始拍视频分享退休生活的点滴,教老年人用智能手机解决日常生活问题。近两个月,阿旺开始使用支付宝的“智能助理”,她的退休生活好像又多了一位小管家。以前觉得交水电费很麻烦,现在语音告诉“智能助理”就能轻松完成缴费。阿旺笑称,“这个助手不一般,它不仅懂得多,办事还利索!”
除了日常生活,在金融和医疗等专业领域,支付宝AI也正在向普通人提供低门槛的专业服务。
记者向AI金融助理提问“帮我推荐适合中产家庭的资产配置方案”,它即刻给出了“灵活取用、投资增值、风险管理、宏观经济和政策环境、持续关注市场动态”几大基本资产配置建议,并且推荐了“三笔钱”服务。现场工作人员介绍,支付宝AI金融助理的目标是让每一位投资者都拥有一位“私人理财专家”,只需一部手机,用户就能获得高质量的行情分析、持仓诊断、资产配置和投教陪伴等个性化的服务。目前,AI金融助理目前已经服务了4300万用户。
(观众现场体验支付宝AI金融管家)
看病求医,是普通人的日常刚需。利用AI大模型、数字人等技术,支付宝打造了“AI就医助理”方案,助力医疗机构为患者提供就医前、中、后全流程服务。蚂蚁展区展示的形象亲切的“安诊儿”,就是浙江省采用支付宝AI就医助理方案推出的全国首个AI陪诊员,帮助浙江省人民医院前台咨询量减少了50%。目前全国医院、医疗机构也正在借助这一方案打造更加便利、更具温情的就医服务。
本次大会,支付宝还联合组委会推出了“WAIC大会智能助手”,首次创造性地将AI融入真实的展会线下服务,打造“AI逛展搭子”。观众抵达会场后,在支付宝首页下拉,便能基于LBS技术唤起智能助理,获得一系列的智能观展服务,如在会前、会中获取本届大会的核心亮点、场馆导览、论坛议程等资讯,在会后也能实时查询附近的餐馆、充电宝、旅游景点等服务信息。
在数字人中心,观众还可与政务数字人小赣事、亚运数字人、央视数字主播等面对面,体验虚实结合的数字生活服务,观赏虚拟人小艺带来的唱跳表演。
据了解,支撑支付宝三大AI管家的关键技术—“智能认知决策技术与平台”,也获得本次大会重要奖项“卓越人工智能奖(SAIL)TOP30”。这项技术由蚂蚁集团和浙江大学,历时7年联合攻关,大幅提升了人工智能服务严谨产业的专业能力、准确性和自我学习能力,让AI和大模型做决策更聪明、更可靠。截至目前,项目技术已广泛应用于医疗民生、金融、政务等行业,服务了上海仁济医院、上海市一医院、浙江省卫健委等2600余家医院和机构,人保健康、浦发银行等数10家金融机构,推动人工智能真正规模化落地产业。该项目还获授权发明专利100余项,部分成果获2022年中国电子学会科技进步一等奖、2023年吴文俊人工智能科技进步一等奖等多个奖项。
两款AI鉴真产品首次亮相,揭秘AI如何监督AI
随着AI技术获得的门槛变低,一些黑灰产也瞄准了AI新型诈骗手段,为社会带来了安全隐患。为了唤起公众对AI安全的认知,联合行业对抗AI风险,并真正为行业提供鉴真辨伪的工具产品,蚂蚁研发了AIGC和深度伪造的鉴真产品,并在展区首次展出。
“多模态AI鉴真”是模拟蚂蚁大模型安全检测平台“蚁天鉴2.0”的AIGC检测和证照深度合成检测两大能力推出的互动产品。观众可选择证照、音频、视频等多样化素材,该互动会先对这些素材做一番伪造模拟生成。之后,该产品能对上述伪造的素材快速进行精准鉴别,并形成检测报告。在真实的生产场景,蚁天鉴AI鉴真解决方案,支持多模态内容真实性和深度伪造检测,防范深度合成技术滥用风险,图像识别准确率99.9%,达到信通院测评行业最高优秀级别,已经具备了引领性的AI安全对抗能力。
在“谍影重重”互动装置前,观众还可用一场情景剧的方式打开深度伪造(Deepfake )的攻防“魔盒”。首先,用户在该装置上传一张照片,可通过AI换脸合成一张新的人脸照片。下一步,可使用合成后的照片甚至视频去刷脸,该互动能够鉴别出该照片或者视频是否是AI合成,进而阻止风险行动。这一套装置背后,是蚂蚁数科安全科技品牌 ZOLOZ 搭建的端云一体的技术体系。“Deepfake攻和防是一个相对且不断精进的过程,你在进步,Deepfake也在进步,我们要做的就是跑在它的前面”,蚂蚁工作人员对记者说。
面向大模型大规模应用,蚂蚁展示关键技术布局
蚂蚁集团认为,大模型从智能涌现到应用涌现实现人人可得,需要布局关键技术,用以解决大模型的可信、经济、易用三大难题。本次会展中,蚂蚁展区展示了应对大模型大规模应用背后的系列关键技术。
大模型可信应用是指在面向专业领域(如金融、医疗等)应用时,构建一个以大模型为核心的专业智能服务体系。该体系应确保应用的专业性、真实性、可控性和安全性,以满足专业领域的高标准要求,可通过专业知识库、智能体、知识图谱、运筹优化等技术来实现。本次大会入选SAIL TOP30奖的“智能认知决策技术与平台”便是关键技术成果。
本次WAIC会上,蚂蚁带来了百灵大模型的最新研发成果,多模态能力全面提升。这项能力让大模型能“看”会“听”,能“说”会“画”,可支持音、视、图、文等多模态理解与生成,可以让大模型更像人一样感知和互动,支撑智能体体验升级,未来将应用在支付宝智能助理等多个AI智能体。
在大模型应用经济性方面,蚂蚁尝试通过绿色计算技术来提升异构算力系统的利用效率和能效,同时通过开源的方式,共建绿色计算开放生态。这其中就包括面向大模型训练的大规模智能分布式训练系统DLRover以及高性能 GPU 显存及传输优化管理器GLake。DLRover通过训练故障自愈等技术可以极大地提高大模型训练的稳定性,可以使集群有效训练时长占比达到97%以上,GLake通过显存加传输一体优化和全局显存池化技术,可以将训练显存需求降低2-10倍。
此外,蚂蚁还展示了ACT(Transformer for ACTions) “一键智能化”技术,让大模型自动执行操作,在手机上一键调起多样化的场景服务,提升易用性;还有轻量化的端侧大模型技术,让端侧轻松跑起智能应用。
面向未来更大规模的数据流动、训练需求,蚂蚁还展示了本次会上首发的“隐语Cloud”大模型密态计算服务。这项服务提供了密态推理、密态微调等一站式服务。从用户查询的隐私到训练数据的安全,再到模型IP的保护,使得用户可以低成本、高效率地获得密算服务。
从AI点咖啡,到AI鉴真,再到AI如何走向更广阔的产业,可管窥蚂蚁AI的目标即服务普通人、服务产业。这或许正是中国AI科技在这场全球科技竞争中的破局之道。