苹果最新的原型人工智能工具可以使用文本描述为图像制作动画
Apple的研究人员推出了Keyframer,这是一款原型生成式AI动画工具,用户可以通过描述如何制作动画来为2D图像添加运动。
苹果公司在2月8日发表的一篇研究论文中表示,大型语言模型(LLM)在动画领域“尚未得到充分开发”,尽管它们在写作和图像生成等其他创意媒介中展现出了潜力。由法学硕士支持的Keyframer工具被认为是如何应用该技术的一个例子。
利用OpenAI的GPT4作为其基本模型,Keyframer可以采用可扩展矢量图形(SVG)文件(一种可以在不影响质量的情况下调整大小的插图格式)并生成CSS代码,以根据文本提示对图像进行动画处理。您只需上传图像,在提示框中输入“让星星闪烁”之类的内容,然后点击生成即可。研究论文中提供的示例展示了土星插图如何在背景颜色之间转换,或显示星星在前景中淡入淡出。
用户可以在一个批次中生成多个动画设计,并在单独的窗口中调整颜色代码和动画持续时间等属性。无需任何编码经验,因为Keyframer会自动将这些更改转换为CSS,但代码本身也是完全可编辑的。这种基于描述的方法比其他形式的人工智能生成动画简单得多,后者通常需要多个不同的应用程序和一些编码经验。
一位参与苹果研究的专业动作设计师表示:“我有些担心这些工具会取代工作,因为潜力如此之大。但我认为了解它们并将它们用作动画师-这只是我们工具箱中的另一个工具。这只会提高我们的技能。这确实是令人兴奋的事情。”
尽管如此,它还有很长的路要走。Keyframer尚未公开,Apple研究论文中的用户研究仅包括13人,他们在试验该工具时只能使用两个简单的、预先选择的SVG图像。
苹果在论文中还小心翼翼地提到了它的局限性,指出Keyframer专注于基于Web的动画,例如加载序列、数据可视化和动画过渡。相比之下,您在电影和视频游戏中看到的动画类型过于复杂,无法仅使用描述来制作-至少目前是这样。
Keyframer是苹果近几个月宣布的几项生成式人工智能创新之一。去年12月,该公司推出了HumanGaussianSplats(HUGS),它可以从视频剪辑中创建动画化的人类头像。上周,苹果还发布了MGIE,这是一种新的人工智能模型,可以使用基于文本的描述来编辑图像。