AI新模型可将文本转换为生动的图像

如今人工智能越来越强大，比如可以实现生成音乐、改变图片艺术风格等等。最近，人工智能非营利组织OpenAI发布了一个名为DALL-E的神经网络，可以将文本转换成与内容相关的图像。
比如生成下面这些穿着芭蕾舞裙挥舞着光剑的熊猫宝宝：
【AI新模型可将文本转换为生动的图像】

文章插图
OpenAI在一篇博文中表示，该系统是具有里程碑意义的GPT-3语言模型的120亿参数版本。
DALL-E模型具有多种功能，包括创建动物和物体的拟物化版本，以合理的方式展示相关的概念，渲染文本，以及对现有图像进行转换。
比如在该模型中选定“与猫有关的文本关键词”，同时选择给定的其中一种猫类型，最终系统会自动生成一系列与猫主题有关的图像，并且风格呈现多样化。
训练该模型的数据集主要基于互联网大量文本-图像。这使得它能够通过探索提示的结构来创造出全新的图片。比如生成一些令人印象深刻的地标、位置、杂交动物和不同年代设计的图像。但是OpenAI承认并不是所有的结果都是成功的。
不过，OpenAI承认并不是所有生成的结果都是成功的。该公司表示，DALL-E系统有时无法绘制出某些特定的项目，混淆了对象与其特定属性之间的关系。
通常，提示DALL-E写的字符串越长，成功率越低。测试中发现，重复部分文本内容，准确率有所提高。
当回答有关地理方面的问题时，比如旗帜、菜肴和当地野生动物，DALL-E也经常反映出肤浅的刻板印象。考虑到人们越来越关注人工智能算法偏见的问题，这个缺点尤为明显。
OpenAI表示，它计划分析DALL-E等模特的社会影响，但该公司认为，该系统表明“通过语言操纵视觉概念现在已经触手可及。”
感兴趣的小伙伴可以在OpenAI网站上查看更多DALL-E模型生成的图像。
责编AJX
.dfma {position: relative;width: 1000px;margin: 0 auto;}.dfma a::after {position: absolute;left: 0;bottom: 0;width: 30px;line-height: 1.4;text-align: center;background-color: rgba(0, 0, 0, .5);color: #fff;font-size: 12px;content: "广告";}.dfma img {display: block;}

文章插图

AI新模型可将文本转换为生动的图像

推荐阅读

wifi流量是无限的吗

话筒高频线有什么作用和用途呢

王者荣耀注销账号会退款吗王者荣耀注销账号可以退款吗

wps的查找功能在哪里 wps的查找功能在哪里设置

北京商业贷款利率是多少

发动机护板会降低噪音吗发动机护板会增加噪音吗

冷油条怎么加工后好吃冷油条怎么加工后好吃一点

脸部毛孔粗大发红怎么办？

糖画粘铝板怎么办

高中休学需要什么条件

胚胎停止发育要刮宫吗

梁平柚的特点

蟹爪兰什么时候开花蟹爪兰什么时候开花一年开几次花

回收站小猫是谁做的

大岭山仲裁委员会上班时间

单位不签劳动合同的责任都有哪些

青岛滨海学院有研究生吗

跑步的时候小腿痛是什么原因

国家医师资格考试报名入口+时间+流程国家医师资格考试报名条件

严良是什么电视剧