比 Sora DiT 架构早两个月的 U-ViT,由这家中国 AIGC 公司提

「Sora 出来之后,团队就开始连轴转,没休息过。」这是 AI 科技评论了解到的,目前国内诸多 AIGC 创业公司的现状。
Sora 的确让世界范围内的创业公司措手不及。随之而来的,有一种悲观论调和怀疑态度:创业公司和 OpenAI 拼术是否有意义?是否有必要做同样的事情?有多大的生存空间?
诚然,要弥合和 OpenAI 的差距并非易事,基于算力、投资等前提条件, OpenAI 的效果自然不是短期内可以达到,但是也不见得到了技术层的创业公司无路可走的地步。
清华系创业团队生数科技提出的技术路线,和 Sora 在架构路线上完全一致,均是提出了将Transformer 与扩散模型融合的思路,在具体的实验路径上也一致。并且,生数科技的 U-ViT 比 OpenAI 的 DiT 早了两个月。
甚至,彼时的 CVPR2023 选择收录了U-ViT,而将 DiT 拒稿。
目前,生数科技的多模态大模型全链路均自主训练、自主研发,是全球首个将Transformer架构引入扩散模型的骨干网络。在文生图、文生视频、文生3D、图生3D等多项任务中已经初见成效。
近来,也完成了由启明创投领投,达泰资本、鸿福厚德、智谱AI、老股东BV百度风投和卓源亚洲跟投的数亿元融资,是目前国内多模态大模型赛道的最高融资额。
生数科技 CEO 唐家渝表示,面对国内多模态大模型的竞争,生数科技会承担引领国内底层技术创新的角色。
即使在 Sora 的笼罩下,国内的多模态大模型也不无机会。
2023年3月,团队开源了全球首个基于Diffusion Transformer架构(U-ViT)的多模态扩散大模型 UniDiffuser,在参数量和训练数据规模上,与Stable Diffusion直接对齐。在架构上,UniDiffuser 比最近才采用 DiT 架构的 Stable Diffsion 3 领先了一年。
除了单向的文生图以外,Unidiffuser支持更通用的图文任务,能够实现图生文、图文联合生成、图文改写等多种功能。
在统一化架构的思路下,生数科技持续 Scale up。在图文模型的训练中,参数量从最早开源版的1B不断扩展至3B、7B、10B及以上。同时在此基础上,通过拓展空间维度和时间维度,逐步实现 3D 生成与视频生成。同时面向应用层推出了视觉创意设计平台PixWeaver与3D 资产创建工具 VoxCraft。
PixWeaver是一款自动化的视觉创作工具,支持AI生图、AI生视频功能,中英文输入、秒级生成,融合多元风格,具备出色的语义理解和丰富的画面表现。(体验地址:https://pw.shengshu-ai.com/,目前AI视频功能由于新版本迭代暂关闭试用)
在图像生成方面,支持高质量的文生图,在画面联想丰富度、美观性等方面优于业内同类模型。




并推出全球首个4D动画生成,基于视频和描述词,输出逐帧的运动3D动画,自动绑定骨骼动作,支持360°全景视角。
此外,该模型还可以通过文本对话或手动调参的方式灵活编辑3D场景,包括添加物体、删除物体等,可实时查看变化。
<iframe class="video_iframe rich_pages" data-vidtype="2" data-mpvid="wxv_3366271567378448388" data-cover="http://mmbiz.qpic.cn/sz_mmbiz_jpg/cNFA8C0uVPtGTWaHnXAHMBwwEPbhTyWpicr0jcGtvTTqFNEQRtL0y1xcXbGPGtRYjKtzIYaxmerJvsL4fze9xvQ/0%3Fwx_fmt%3Djpeg" allowfullscreen="" frameborder="0" data-ratio="1.7391304347826086" data-w="640" style="border-radius: 4px;" src="https://mp.weixin.qq.com/mp/readtemplate?t=pages/video_player_tmpl&action=mpvideo&auto=0&vid=wxv_3366271567378448388"></iframe>
精度高:贴图分辨率可达到2048*2048,几何结构的规整度高,色彩与材质质感真实度高; 速度快:在单卡设备上,单个3D模型生成最快可在数分钟内生成; 可用性强:支持Mesh的同步生成,支持高模、低模的定制,可直接对接工业管线; 丰富度高:覆盖资产类型多,通用性强,支持文本或图像引导。
更多内容,点击下方关注:

未经「AI科技评论」授权,严禁以任何方式在网页、论坛、社区进行转载!
公众号转载请先在「AI科技评论」后台留言取得授权,转载时需标注来源并插入本公众号名片。
未经「AI科技评论」授权,严禁以任何方式在网页、论坛、社区进行转载!
公众号转载请先在「AI科技评论」后台留言取得授权,转载时需标注来源并插入本公众号名片。