一键点、万物动！腾讯联合清华、港科大推出图生视频大模型“Follow Your Click”

3月15日，腾讯和清华大学、香港科技大学联合推出全新图生视频模型“Follow-Your-Click“，基于输入模型的图片，只需点击对应区域，加上少量提示词，就可以让图片中原本静态的区域动起来，一键转换成视频。

（动图）

当前的图生视频大模型中，一般的生成方法不仅需要用户在提示词中描述运动区域，还需要提供运动指令的详细描述，过程较为复杂。另外，从生成的效果来看，现有图像生成视频技术在移动图像的指定部分上缺乏控制，生成的视频往往需要移动整个场景，而不是图像上的某一个区域，精准度和灵活性上有所欠缺。

为了解决这些问题，腾讯混元大模型团队、清华和港科大的联合项目组提出了更实用和可控的图像到视频生成模型Follow-Your-Click，带来更加便捷的交互，也让图片“一键点，万物动”成为现实。

图像到视频生成的技术在电影内容制作、增强现实、游戏制作以及广告等多个行业的AIGC应用上有着广泛前景，是2024年最热门的AI技术之一。

据了解，本联合项目组中的腾讯混元大模型团队，正在持续研究和探索多模态技术，拥有行业领先的视频生成能力。此前，腾讯混元大模型作为技术合作伙伴，支持《人民日报》打造原创视频《江山如此多娇》，生成中国大美河山的精美视频片段，展示出了较强的内容理解、逻辑推理和画面生成能力。

论文链接：[2403.08268] Follow-Your-Click: Open-domain Regional Image Animation via Short Prompts

主页：Follow-Your-Click

Github：GitHub - mayuelala/FollowYourClick: [arXiv 2024] Follow-Your-Click: This repo is the official implementation of "Follow-Your-Click: Open-domain Regional Image Animation via Short Prompts"

为您推荐

睿是信息携手Arctera，深化服务中国市场，共筑数据管理新未来

第七届腾讯数据中心分享日启动，构建IDC生态助推新基建进程

续保乱象催生“自助”趋势,官方APP成车主“避风港”?

喜报！瑞数信息蝉联CCIA中国网络安全竞争力50强！

科技云报道执行主编张颖获评“中国云计算行业影响力人物”

百度智能云重磅发布“AI创投加速计划” 为入选企业提供亿级算力补贴！