生活网 1月3日 消息:Midjourney公司在周二宣布,他们计划在未来几个月推出“文本转视频”模型。
据CEO David Holz在“Office Hour” Discord会议中表示,公司将于1月开始培训视频模型。这一举措代表了该平台的自然发展,基于成熟的图像模型,激发了生成视频行业的竞争动态。
Midjourney的Discord会议记录包括对V6Niji的计划调整,这是Midjourney的漫画/动画生成模型,并且对即将发布的MidJourney V6进行了一致性修复。公司还表示其待办事项清单中包括“开始培训新的视频模型”,这可能在“几个月内”准备就绪。
图源备注:图片由AI生成,图片授权服务商Midjourney
截至目前,Holz或MidJourney团队尚未分享有关模型的进一步信息。
MidJourney以强调质量和用户体验而著称,即使这意味着落后于竞争对手。在其他平台如Stable Diffusion等的功能成为事实标准数月后,公司才推出了inpainting和outpainting等增强功能。而其最近尝试的文本生成则在其他模型如Dall-E3、SDXL以及一些不那么流行的生成器(如Ideogram或IF)已经成为共同功能之后才推出。
这次进入视频领域也是在竞争对手发布相关产品之后。Stability AI最近宣布Stable Video Diffusion;meta刚刚展示了其EMU视频生成器,而像Pika和Runway ML等现有模型正在留下他们的痕迹,使MidJourney的进入成为竞争激烈的领域。此外,像Leonardo AI等其他图像生成器已经实现了视频生成功能,进一步加剧了竞争。
Midjourney的最新v6更新,宣称提高了提示跟随和更真实的图像,是公司为保持相关性和竞争力而做出的最新努力。如果其模型显示出一定的凝聚力,它们在这个新兴领域甚至在模型仍然不够完美的情况下也可能获得坚实的地位。
这些发展的影响远远超出了企业争霸的范畴。随着MidJourney和其他公司不断创新和完善其产品,创意和媒体行业正站在变革的边缘。通过AI生成、操控和与视频内容互动的能力为我们打开了许多可能性,从使娱乐者和广告商更轻松地进行创作,到潜在地重塑我们对现实的感知。