AI新模型可将文本转换为生动的图像
如今人工智能越来越强大,比如可以实现生成音乐、改变图片艺术风格等等 。最近,人工智能非营利组织OpenAI发布了一个名为DALL-E的神经网络,可以将文本转换成与内容相关的图像 。
比如生成下面这些穿着芭蕾舞裙挥舞着光剑的熊猫宝宝:
【AI新模型可将文本转换为生动的图像】
文章插图
OpenAI在一篇博文中表示,该系统是具有里程碑意义的GPT-3语言模型的120亿参数版本 。
DALL-E模型具有多种功能,包括创建动物和物体的拟物化版本,以合理的方式展示相关的概念,渲染文本,以及对现有图像进行转换 。
比如在该模型中选定“与猫有关的文本关键词”,同时选择给定的其中一种猫类型,最终系统会自动生成一系列与猫主题有关的图像,并且风格呈现多样化 。
训练该模型的数据集主要基于互联网大量文本-图像 。这使得它能够通过探索提示的结构来创造出全新的图片 。比如生成一些令人印象深刻的地标、位置、杂交动物和不同年代设计的图像 。但是OpenAI承认并不是所有的结果都是成功的 。
不过,OpenAI承认并不是所有生成的结果都是成功的 。该公司表示,DALL-E系统有时无法绘制出某些特定的项目,混淆了对象与其特定属性之间的关系 。
通常,提示DALL-E写的字符串越长,成功率越低 。测试中发现,重复部分文本内容,准确率有所提高 。
当回答有关地理方面的问题时,比如旗帜、菜肴和当地野生动物,DALL-E也经常反映出肤浅的刻板印象 。考虑到人们越来越关注人工智能算法偏见的问题,这个缺点尤为明显 。
OpenAI表示,它计划分析DALL-E等模特的社会影响,但该公司认为,该系统表明“通过语言操纵视觉概念现在已经触手可及 。”
感兴趣的小伙伴可以在OpenAI网站上查看更多DALL-E模型生成的图像 。
责编AJX
.dfma {position: relative;width: 1000px;margin: 0 auto;}.dfma a::after {position: absolute;left: 0;bottom: 0;width: 30px;line-height: 1.4;text-align: center;background-color: rgba(0, 0, 0, .5);color: #fff;font-size: 12px;content: "广告";}.dfma img {display: block;}
文章插图
推荐阅读
- 新炼狱蝰蛇入手体验评测 炼狱蝰蛇v2x极速版怎么样值得买吗
- 富士康用半导体书写新篇章
- 31省区市新增本土确诊92例 陕西30例 河南56例
- 新鲜松露怎么吃最好,松露产地在哪里
- 新疆女人为什么不喜欢汉族男人 为什么维吾尔族女孩不嫁汉族男孩
- 新疆女人比汉族女人厉害吗 新疆汉族姑娘的性格如何?
- 汉族人可以娶新疆人吗 维吾尔人可以嫁给汉人吗? ?
- 新疆女人是不是都很漂亮 新疆姑娘为什么这么漂亮?
- 政策推动家庭安防产品向智能方向转变,智能门锁成为新风口
- 山竹最新高产种植技术