湘声报讯 1月30日,万兴科技音视频多媒体大模型“天幕”在长沙马栏山视频文创园正式发布,这是中国首个音视频多媒体创作垂类大模型。
作为湖南首个通过算法备案、中国音视频多媒体大模型的先行者,万兴“天幕”基于15亿用户行为及100亿本土化高质量音视频数据沉淀,以音视频生成式AI技术为基础,聚焦数字创意创作场景,具有支持全球不同语言、算力数据及应用本土化及“专精特快”等鲜明特色和优势。发布会现场,万兴科技副总裁朱伟现场演示分享了“天幕”大模型包括一键式生成高质量主题视频、较高自由度的文生3D场景视频、超逼真的“AI歌手”翻唱定制服务、根据视频内容AI生成匹配的音乐、支持全球主流语种的“AI数字人播报”等多款多媒体能力应用。
省政协委员、万兴科技董事长吴太兵在主题演讲中介绍,大模型正从图文1.0时代,加速进入到以音视频多媒体为载体的2.0时代。“天幕”的优越表现是基于万兴科技在算力、数据等基础设施及技术人才等层面的积累沉淀,持续加码NPU+GPU算力强底座,已构建千卡集群、自研推理框架、进行全球多活架构布局,并拥有一站式数据生产管理平台,单日可完成百万级数据处理加工,并组建百人国际化算法团队全力赋能开展研发工作。其生成模式是视频大模型、音频大模型、图片大模型、语言大模型等多媒体融合的集成方式,“天幕”目前已迭代近百项音视频原子能力,可专业提升视频创作效率、精细化提升垂类质量、特色化补齐创作闭环、快速赋能应用智能化升级,实现从模型到应用场景为用户提供闭环解决方案,“天幕”众多AI功能目前已在万兴科技旗下多款创意软件产品,尤其是海外产品中规模化商用,拉动用户数快速增长。吴太兵当天还宣布“天幕”大模型研发中心将正式落户马栏山,未来将加速推进现有产品的智能化升级及全新AIGC产品的推出,持续拓展泛知识、泛营销、泛娱乐等垂类领域场景,联合更多行业内外的合作伙伴深度赋能音视频文创生态。
发布会上,万兴科技宣布与马投算力及华为云达成三方算力合作,并与中广天择达成大模型算料战略合作,推动高质量算料在大模型时代活起来、动起来、跑起来、用起来。
中国科学院院士王怀民、加拿大皇家科学院院士李明等进行主题演讲,共同论道大模型2.0时代下音视频等领域的新机遇、新趋势、新未来。
文 | 政协融媒记者 寻晓燕 通讯员 梁君艳 谢翔