首页*蓝狮在线登录*平台注册
全站搜索
  • 蓝狮在线注册
  • 蓝狮在线登录
  • 蓝狮在线招商
  • 公司地址:山东省招远市蓝狮在线集团公司

    中文版Sora计划在深发布
    作者:admin 发布于:2024-03-18 17:33

      ●“Open-Sora”作为一个开源的项目,其优势在于能够集结全世界技术人员的力量,让大家在自己擅长的领域发挥专业优势,同时也能够获得算力和数据方面的资源支持。

      ●我们想做的绝不是“下一代的抖音”,而是希望能将AI真正应用到行业中,更加精准地匹配产业链中的供给与需求。

      今年初,由OpenAI发布的文生视频大模型Sora震惊了世界。仅需输入文字指令,便可生成长达一分钟、高清分辨率、画面精致的动态视频,Sora优异的性能表现让许多人感叹,但同时,关于国内人工智能技术发展状况也不可避免地被提及。

      国内能否研发出中文版的Sora?3月12日,北京大学深圳研究生院-兔展智能AIGC联合实验室正式发布了“Open-Sora”计划,旨在复现一个“开源版Sora”。该项目由深圳兔展智能创始人、CEO董少灵与北京大学信息工程学院助理教授、博士生导师袁粒领衔发起,期望通过产业公司和科研机构的强强联手,以开源的方式对外传播中国团队的技术自信,号召全球社区一起做人类普惠的技术内容。

      不久前,马斯克对OpenAI提起了诉讼,指控OpenAI背离了创立之初的初衷,从一个开源的非营利组织转变为闭源、追求商业利益的机构。截至目前,发布近一个月的Sora还尚未面向全部公众开放,在其官方网站上也只有一份非常简短的技术报告,并未涉及模型背后的原理——在兔展智能创始人、CEO董少灵看来,“OpenAI”正逐渐变成“CloseAI”。

      “与之恰恰相反,我们Open-SoraPlan中的数据是完全开源的,全世界范围内的用户都可以直接拿去用,甚至利用它们来盈利。”作为技术模块的主要负责人,袁粒在发布现场向记者表示。据袁粒介绍,Open-Sora计划的核心技术框架包括视频编码器与解码器、DiffusionTransformer模型和条件注入模型三大模块,目前基于已经搭好的训练框架,能够支持动态输入、多尺度、多分辨率的训练,对于可变比例、可变时长的视频已经取得了较好的生成效果。

      与“财大气粗”的OpenAI相比,该团队在条件和算力存在一定缺口的情况下选择了更高效、低功耗的大模型训练方式,例如用“2D+1DDiffusionTransformer”替代计算量更大的3DDiffusionTransformer,以及同步推进除了文本控制外的更多条件控制的视频生成训练。

      该项目在GitHub上一经发布,就立马引起国际人工智能界相当一部分的关注。发布一周内就有超5000名技术开发人员为该项目标星,融合了30余次开源创作者的拉取请求(PullRequest),获得14万余次访问,代码被克隆超800次,来自美国、英国、加拿大、德国、澳大利亚、迪拜、沙特阿拉伯、伊朗等多个国家的技术人员参与其中,积极贡献。

      在袁粒看来,“Open-Sora”作为一个开源的项目,其优势在于能够集结全世界技术人员的力量,让大家在自己擅长的领域发挥专业优势,同时也能够获得算力和数据方面的资源支持。目前,该计划“初步验证当前框架有效性”的第一阶段目标已完成,第二阶段团队希望在有效框架基础上训练出能够生成20秒以上720p清晰度视频的模型,同时将“生成更加逼近Sora时长和效果的视频”作为第三阶段的拓展目标。

      尽管目前由于较大的算力缺口和数据要求,能够实现拓展目标的难度较大,但董少灵依然表示:“在技术方面中国并不比Sora弱,Sora能做的我们也能做,大家要树立这样的自信。”

      Open-Sora背后的底层模型,是兔展智能在去年推出的基于视觉为核心的原创多模态大模型“兔灵”,这是一个视觉占七成、语言占三成的全新混合体。同是作为视觉大模型,目前外界对Sora的想象止步于娱乐向视频的生产,但兔展智能对于Open-Sora的展望却远不止于此,对董少灵来说,将Open-Sora背后的底层模型打造成深植于产业、赋能产业发展的中国本土的视觉大模型,让产业的供给与用户的需求更精准的匹配,才是更有价值的事情。

      在董少灵的介绍里,“兔灵”是一个聚焦于设计领域的视觉大模型,能够根植于工业设计、建筑设计、室内设计、服装设计等多个设计类细分行业,在供给大于需求的时代让客户的个性化需求更加精准,同时节约设计成本、打通产业链,实现真正的“人工智能+”赋能行业。

      发布会现场,董少灵对目前大模型已经落地的项目进行了展示。其中在建筑设计方面,“兔灵”能够通过文本描述引导生成三维建筑模型,自由调整建筑视角,并结合AI局部重绘的能力补全设计效果图,这样一来实现方案设计及效果图制作提效97%,成本节约达14.6%。

      “我们想做的绝不是‘下一代的抖音’,而是希望能将AI真正应用到行业中,更加精准地匹配产业链中的供给与需求。”董少灵向记者表示。在他的展望中,随着Open-Sora计划的不断发展,“兔灵”大模型也将不断获得训练,未来,不具备设计专业技能的普通人也能够设计出个性化的物品,随之而来的则是建筑、服装、材料等各个行业产能的提高与产业链的完善。

      本次Open-Sora开源计划由兔展智能联合北京大学深圳研究生院共同成立的AIGC联合实验室发起,坚持“人类级使命”“奋斗者为本”“开放式创新”“真问题驱动”四大原则,共同探索产学研协同创新发展的新路径。未来,双方也将在推动视觉大模型更好赋能中国产业发展方面携手并进,为世界带来更多中国声音。

      声明:证券时报力求信息真实、准确,文章提及内容仅供参考,不构成实质性投资建议,据此操作风险自担

    相关推荐
  • 中文版Sora计划在深发布 数据完全开源目前第一阶段目标已完成
  • 中文版Sora计划在深发布
  • 开源版的Sora是什么样?北大深研院联合兔展智能发起“Open-Sora”计划
  • 服装设计效果图的表现手法教你花式描绘心中所想
  • 时尚家居服饰设计大赛 第十三届国际大学生时尚设计盛典专项赛
  • 童装原创设计让孩子穿上这种设计的衣服气质立马提升一个档次
  • 儿童服装设计的高清图片素材
  • 儿童服装的设计效果图展示
  • 服装设计童装
  • 儿童服饰设计模板图片大全
  • 脚注信息
    Copyright © 2028 蓝狮在线注册 TXT地图 HTML地图 XML地图
    友情链接: