首页 > 技术知识 > 正文

OpenAI宣布推出Point-E,这是一种机器学习系统,可以从文本提示快速创建3D图像-openai打造个性化ai

总部位于旧金山的OpenAI的一组研究人员宣布开发一种机器学习系统,该系统可以从文本创建3D图像,比其他系统快得多。该小组在arXiv预印本服务器上发表了一篇论文,描述了他们的新系统,称为Point-E。

在过去的一年里,一些团体宣布了可以根据文本提示生成3D建模图像的产品或系统,例如,“红色地板上的蓝色椅子”或“一个戴着绿帽子骑紫色自行车的小男孩”。这样的系统通常由两部分组成。第一个阅读文本并试图理解它。第二个,在互联网搜索上训练,渲染所需的图像。

由于任务的复杂性,这些系统可能需要很长时间才能返回模型,从几小时到几天不等。在这项新的努力中,研究人员建立了一个类似的系统,可以在几分钟内返回结果,尽管他们欣然承认结果“在样品质量方面没有达到最先进的水平”。

为了更快地创建图像,研究人员采用了一种与其他人略有不同的方法。他们的系统甚至没有创建传统意义上的图像。相反,它生成点云,当一起查看时,点云类似于所需的图像。该团队之所以采用这种方法,是因为生成点云比生成实际图像要容易得多。为了创建结果,系统通过他们开发的另一个AI系统路由它找到的图像,该系统将其接收到的内容转换为网格,从而生成预期对象的3D点云模型。

系统的第一部分是使用两个模块制作的——第一个模块将文本转换为图像创意,第二部分查找用于生成通用图像的图像。在操作中,系统的运行方式与其他同类系统非常相似 – 用户输入描述性文本提示,系统返回图像模型。他们指出,虽然视觉质量无法与其他系统相提并论,但它可能更适合其他应用,例如通过3D打印机制造现实世界的物体。

猜你喜欢