字节跳动旗下 AI 帮手豆包近来晋级文生图才能,支撑一键生成指定文本。用户能够在生图提示词中参加文本要求。
豆包大模型团队相关负责人表明,豆包文生图模型经过打通 LLM 和 DIT 构架,具有更好的原生中文数据学习才能,并在此基础上强化了汉字生成才能,大幅提高了生成作用。
引荐:
豆包 App 试用:几近万能的 AI 助理
图上加点字
简略来讲,这个新才能能够让你在 AI 生成的图片上参加指定文字。现在该功用已经在豆包 App 敞开测验,豆包网页及电脑版也将在近期上线该才能。
注:以下测验运用 iOS 版豆包 App。

咱们测验让豆包生成市中心商务区大楼相片,大楼上方有“动点科技”四个大字。一次性给出的四张图片根本都契合预期。

第2次测验让它生成手持显现“动点科技”四个字的手机图片,成果中有一张的手指多了一只,且手部份额失调;另一张的右手有两个拇指……

第三次测验咱们不按惯例套路来,要求文字:
帮我生成一张图,校园操场运动会,人满为患,主席台大屏幕上有“动点出海”四个大字,图片份额 16:9
晃眼一看,操场部分(包括人)挺像一张相片,但大屏幕上除了要求的大字外,还呈现了 AI 幻想的不明字体,且其间一张图布景墙上多出一个“点”字。

别的,这四张图并没有按份额要求生成。
总结
以往用 AI 生成图片只能作为事例参阅或许以玩一玩的心态试试,现在 AI 生图能够在其间参加指定文字,这着实是一项值得必定的功用提高。不过豆包的新技能仍是欠些火候,咱们在测验中遇到了“不认识的汉字”以及部分违背知识的图片要素。
上面测验的图片方式,比较适宜笔者的工作内容——比方有时需要给文章配图,用 AI 生成公司名称相关的展现图,再适宜不过。
顺带一提,假如你对 AI 图片功用感兴趣,豆包此前上线了图片理解才能,可辨认图片中包括的元素和根本特征。用户还可经过该功用问询某景点所在的方位或某个人物出自哪部影视作品。在试一试之前能够
看看咱们的体会文章
。