杭州市拱墅区住房与建设局网站,推广策划方案怎么做,百度指数功能有哪些,重庆企业网站推广服务当下已进入如火如荼的全民AI时代#xff0c;最近体验了下midjourney#xff0c;使用它的以图生图功能生成出来一套三国人物画像#xff0c;和大家分享下使用心得。
使用midjourney的准备工作
下载工具 使用midjourney生产图片依赖的工具和流程#xff0c;大致如下#x… 当下已进入如火如荼的全民AI时代最近体验了下midjourney使用它的以图生图功能生成出来一套三国人物画像和大家分享下使用心得。
使用midjourney的准备工作
下载工具 使用midjourney生产图片依赖的工具和流程大致如下 [1] 下载Discord App[2] 添加Midjourney Bot[3] 发送交互指令[4] 生成图片 midjourney.com是midjourney的官网可以跟随网站引导提示完成使用体验。较为推荐和常见的使用姿势是在discord.com下载discord app后添加midjourney bot来进行指令交互完成图片生成。 交互流程 对于图片的生成主要是通过输入给midjourney一些prompt和参数来完成的。
prompt 可以分为文本和图片两种类型可以同时存在施加干预参数 常用参数如--ar指定图片比例、--vmidjourney版本等 参考midjourney参数 以图生图
指令 以图生图的指令结构非常简单如下
/imagine [url] [prompt] [param]url上传到midjourney的图片url prompt影响midjourney的提示 parammidjouryney支持的参数配置 出图流程 [1] 上传图片在本地选择一张图片上传到midjourney支持jpg、png等通用格式而bmp等格式需要转换后方可上传[2] 复制图片地址复制图片地址以备发送交互指令后使用[3] 发送交互指令
/imagine https://s.mj.run/wws8EMAvHdE
she is a woman,in ancient China,2 foot tall doll in pixar::2
--ar 3:4 --v 5 --q 2 --s 750
--no braid,barbarians,earrings,glasses,wrinkle,baldness[4] 生成图片根据出图体感做v1~v4、u1~u4、prompt调整直到生成最满意的图
初体验
文字生图/以图生图的差别 在纯文字prompt的场景下生成出来的图是一个几乎全未知的结果需要进行大量的prompt调整才可能达到要求在我进行纯文字prompt测试的case中几乎没有一张能够满足我的出图要求这既有个人指令熟练度、覆盖度的原因也有文字prompt相对局限性的问题当下涌现了很多prompt网站很多近乎成品的图和对应prompt被分享出来但是拿着一致的prompt不一定拿到一致的图存在很大的随机性、不稳定。 但是以图生图的好处是可以通过一个已经存在的图像让AI来识别基于“模板”来进行二创在我进行以图生图prompt的测试case中拿到满意出图效果。如果你的出发点是通过已有图片做较为稳定性的出图比如给自己的照片做卡通形象以图生图是很好的一种实现形式。
模型数据影响 对于出图描述体感上更符合欧美人群而且亚裔人的描述并不是很符合现实猜测和训练数据有一定关系如果prompt不进行细节描述描述很难符合预期。
最佳实践 总结一句话就是喜欢的原型图 喜欢的风格 二创满意的图 第一步 在prompt分享网站找到自己喜欢的midjourney生成好的图片如https://lexica.art/ 大部分是支持关键字检索的可以检索自己期望的风格、物品等描述。第二步 查看它的prompt进行参考过于简短的prompt没有太大参考价值主要参考哪些风格系描述如cartoon卡通、painting绘画等这里我想要给我找到的原型图卡通一点的形象我抽取了prompt为2 foot tall doll in pixar (皮克斯的 2 英尺高娃娃)作为我的出图效果设定。第三步 对图片细节进行详尽描绘具体可以参考如下人物特征描述。如果你对于细节要求不高对出图效果比较佛系可以简单描述核心特征即可。比如我在二创三国人物时候会给简单prompt提示如
//性别
a man,
//中国古代
in ancient China,
//皮克斯风格,这里配置了权重::2增强midjourney的感知
2 foot tall doll in pixar::2
//我需要3:4比例的图片
--ar 3:4如果需要更为详尽的人物特征刻画可以参考下面这组prompt。值得一提的是并不是事无巨细越全越好而是要挑选重点进行描述以图生图的好处之一是已经有一个成型的图片模板AI会识别它的特征而我们二创只需要基于它进行“改版”做适当微调就可以。
错误陷阱 在使用过程中也遇到很多badcase这里分享下
颜色敏感 在一个测试case中发现midjourney对颜色词汇非常敏感但是也容易产生混乱比如
//带红色的帽子
wearing a red hat,
//穿绿色的衣服
wearing a green clothes,有时候会只识别到一种颜色而且会把整个画面变得过于“色彩化”。
配合权重设置 权重设置可以参考上面的参数列表使用它相当于是prompt的手动调优让AI“重视”你的选择和倾向。比如我在使用皮克斯这个风格的时候AI有时会”忽略“我的prompt因此我会设置它的权重增强这个prompt的存在感。
//设置权重增强存在感
2 foot tall doll in pixar::2画“手”很难 AI对手的描述并不是很好很多时候可能是“4指怪”、“6指怪”握住东西拉开一张弓等等都是比较难的动作需要反复调优prompt或者“碰运气”。
女性角色更容易 从我自身测试case来看女性角色的以图生图刻画更贴近并且更容易接受一些出图效果更符合预期男性角色可能由于图画中夹杂了更多的人物外物品如刀、枪、弓等原型图刻画张力更复杂有关系偶尔会出现匪夷所思的效果。
效果展示 下面是一些没有做太多微调的粗制版供大家参考。
原型图皮克斯风格
资料整理
网站描述https://discord.com/社群工具相当于一个IM端可以在群内拉入midjourney bot进行交互https://midjourney.commidjourney官网https://atoolbox.netprompt网站https://ai.dawnmark.cnprompt网站https://lexica.art可以根据关键字来查看midjourney已生成的作品相当于通过已生成图来反查对应的prompt如果喜欢类似风格和样式可以参考prompt被己所用https://www.mubucm.com/doc/_2As4DSE4mB站一个还不错的prompt分享https://jpg2.cn/免费的批量图片转换网站midjourney只接收jpg/png等格式如果有bmp等格式可以尝试使用它来做转换三国志14人物头像链接: https://pan.baidu.com/s/1X5kBnAqRXUG2uj7Kms4BDA 提取码: 2qex