用ChatGPT优化AI绘画提示词的探索

8 篇文章 7 订阅
订阅专栏


注:本文中的AI绘画模型为Stable Diffusion 2.0,平台工具采用白海科技涌现AIGC引擎.

用ChatGPT优化AI绘画提示词的探索

这是一篇关于如何使用ChatGPT优化文生图提示词的简短经验说明。

自ChatGPT发布以来,大家已经探索了ChatGPT的各种各样的使用方法,如写代码、写小说、对话问答、撰写营销文案等。

下面我们将从多角度探索,如何利用ChatGPT,优化AI绘画的提示词。

1. 关于提示词(Prompt)

提示词(Prompt)是我们与AI模型交流的语言,用以告诉AI模型我们想要生成什么样的图像。合适的提示词能够生成更符合我们想要的图像。

提示词的一般公式为:绘画对象+对象描述词+风格修饰词

● 绘画对象(Subject/Main idea):我们想要画的内容或物体,如小女孩、都市街道、草原、圣诞老人等

● 对象描述词(Description):与绘画对象相关的附加描述信息,例如形容词(可爱的、喧嚣的)、背景描述(在沙滩上、高楼林立)、动作描述(如跳舞、游泳)等。

● 风格修饰词(Modifier):画质词(如4k, 8k)、艺术风格 (如photorealistic, pen drawing)、艺术大师风格(如by DaVinci, by Van Gogh)等。

在实际撰写文生图提示词时,核心的难点在于对象描述词。

我们很容易想到一个想要绘画的对象,而画面的创意和画面细节的丰富度,则在于对象描述词。

对于风格修饰词,虽然看起来有点复杂,但已有许多可供参靠的风格选项供我们选择(如, https://baihai-idp.yuque.com/mwvla8/yhrs1s/pxgnrnhur3dghztb?singleDoc# 《成为提示词(Prompt)大师》)。

因此,后续对于ChatGPT优化AI绘画提示词的探索,也主要聚焦在丰富提示词的对象描述词方面。

2. 利用ChatGPT优化提示词

探索1: 利用ChatGPT,提供丰富的描述词思路

原始提示词:

草原,夜晚,星空,8k / 夜晚的草原,星空,8k

生成的结果过于朴实,缺乏个性和丰富的细节。

让我们利用ChatGPT帮忙丰富相关描述细节。

在ChatGPT的启发下,丰富描述细节优化提示词:

夜晚的草原,星星闪耀,鸟儿,狼,月光下动物的影子,8k

生成结果如下,画面丰富了很多。

让我们再尝试一个例子,以都市夜景为主题。

原始提示词:

都市夜景,街灯,建筑,现代,8K

利用ChatGPT帮忙丰富相关描述细节。

借鉴ChatGPT对于都市夜景的描述性启发,优化后的提示词及结果:

都市夜景,霓虹灯,路灯,烟花,行人穿梭,车辆来来往往,音乐喷泉,现代,8k

都市夜晚,灯火通明,高楼大厦,霓虹灯,烟花,行人穿梭,车辆来来往往,现代,8k

探索2:挑战ChatGPT直接生成提示词

进阶版,让我们体验一下ChatGPT直接生成提示词吧。还是以都市夜景为例。

ChatGPT一如既往的啰嗦。

实际经验中,连续性的长句子描述不是最佳的prompt形式,让我们对其进行“主题+描述词+修饰词”的关键词精简。

让我们利用ChatGPT给出是上述prompt来试一试吧:

总结看来,利用ChatGPT直接生成拿来即用的提示词,目前还存在一定的挑战。ChatGPT目前最大的价值和帮助在于,帮助我在撰写提示词时丰富想象力、打开创造力!

博客
Next-Level Agents:释放动态上下文(Dynamic Context)的巨大潜力
06-05 650
文中强调,AI Agents 不应仅局限于使用固定提示词指令来定义,还应包含自己的动态上下文配置。通过简明的上下文类型划分,为每个 AI Agent 量身打造不同的上下文配置,将极大拓展其应用潜能。本文所述的动态上下文配置(Dynamic Context)仅是 AI Agents 系统架构的冰山一角,欢迎各位读者就此主题深入交流探讨。
博客
LLMs 能否胜任「数据标注」?机遇与挑战并存
05-31 505
本文作者从业界最新研究入手,全面评估了 LLMs 在数据标注领域的应用前景。文章指出,在某些场景下使用 LLMs 确实可以加快标注流程、降低成本,但也需要注意 LLMs 存在一些局限性,如对提示词的高度敏感性、不能支持多种人类语言符号,以及难以模拟人类的内在推理逻辑等。因此,我们不能期望 LLMs 完全取代人工标注,特别是在涉及需要主观判断或敏感内容的领域。
博客
AI Agent:人类工作范式的颠覆者还是人机协作新范式?
05-29 1003
生成式 AI 只是人工智能发展的开端,未来可能会出现更先进的 AI 智能体系统(AI Agent),我们应当重视 Andrew Ng(译者注:Andrew Ng 是斯坦福大学计算机科学系和电气工程系的客座教授,曾任斯坦福人工智能实验室主任。作者相信人工智能的未来必将呈现出更智能、更自主的 AI Agent 形态。但是 AI Agent 强调的是综合智能,包括但不限于决策制定、环境交互和跨领域的知识应用,这样的智能系统能够适应更复杂的任务需求,并在与人的交流合作中展现出更强的灵活性和实用性。
博客
自主 AI Agent 的构建|Function Calling 技术实例探索
05-23 1052
本期我们精心为各位读者伙伴呈现一篇详实的搭建技术教程,全面介绍了如何利用函数调用技术构建 Autonomous AI Agents 。作者从函数调用(Function Calling)的工作原理和应用场景出发,通过构建一个旅游服务助手的实例,层层递进地讲解了整个系统的设计思路、技术细节和代码实现。
博客
Advanced RAG 07:在RAG系统中进行表格数据处理的新思路
05-15 450
使用多模态 LLM (如 GPT-4V[14] 、LLaVA[15] 或 FUYU-8b[16])从图像数据中生成文本摘要,然后将这些文本摘要嵌入向量化,利用这些嵌入向量,可以对图像摘要进行高效检索(retrieve),在检索到的每个图像摘要中,都保留有一个对应的原始图像的引用(reference to the raw image),这属于上文的 (i) 类方法,最后将未经处理的图像数据和文本块传递给多模态 LLM 以便生成答案。首先,使用(a)至(d)中的任何一种方法,将文档中的所有表格解析为图像形式。
博客
LLMs应被视为一种文字计算器?
05-11 708
有时候我们会遇到一些看似不相关的或矛盾的想法,但通过我们的观察、感知、经验、学习和与他人的交流,我们可以发现这些想法之间可能存在某种联系,或这些想法可能是合理的。我们应该保持开放的思维,不仅仅局限于表面上的直觉,而是观察、感知、经验、学习和与他人的交流,来发现更深层次的意义和联系。17 世纪初,一位名叫埃德蒙·冈特的数学家和天文学家面临了一个前所未有的天文挑战——要计算行星的复杂运动轨迹并预测日食,天文学家不仅需要依靠直觉,还需要掌握复杂的对数运算和三角方程。然而,大语言模型生成的是人类语言。
博客
解构复合人工智能系统(Compound AI Systems):关键术语、理论、思路、实践经验
05-10 738
本文作者深耕人工智能领域多年,洞见独到。文中系统性地介绍了四种常见的 Compound AI Systems 部署模式:RAG 系统、Conversational AI 系统、Multi-Agent 系统和 CoPilot 系统。作者阐明了这些部署模式的工作原理、模块间的交互方式,并深入探讨了“Agentic”理念、模块化设计的优势等核心概念,为读者构建 Compound AI Systems 提供了宝贵的理论经验。相信通过学习本文,读者们能够对如何构建 Compound AI Systems 有更深入的认
博客
Advanced RAG 06:生成结果的相关性低? 快用 Query Rewriting 优化技术
05-07 919
HyDE 方法看起来是无监督的,这种方法没有通过标注过的数据来训练任何模型,包括 generative model(译者注:其主要任务是从数据中学习数据的分布,然后可以用来生成类似于训练数据的新数据样本,通常用于生成图片、文本、音频等类型的数据。) 这种方法中,新的 query 用 q+ 表示,是最初的 query(q)和 pseudo-documents(d’)的简单连接,用 [SEP] 分隔:q+ = concat(q, [SEP], d’)。)” 由于特定时间范围的限制,直接解决这一问题极具挑战性。
博客
Advanced RAG 05:探讨基于文本内在语义信息的数据分块方法
04-30 950
但是,如果在这些小数据块(small chunks)中找不到完整的信息,递归检索器(recursive retriever)会将相关的大数据块(larger chunks)传递到生成阶段(generation stage)进一步处理,就像我们在书中某个小节或段落查找资料时,如果需要更多信息,就会翻到相关的章节或整本书一样。通过 Semantic chunking(译者注:一种根据文本中的语义信息将文本分成有意义的片段或块的过程) ,希望每个数据块所包含的信息在语义上相对独立,以便更好地进行分析和处理。
博客
提示词优化的自动化探索:Automated Prompt Engineering
04-25 1188
在这些情况下,由于提示词工程(prompt engineering)仍然主要是通过不断的试验和调整来进行改进,而非一次性完成的,如何将自己的想法用于改进 Prompt ,并仍保留 Prompt 的通用性(如前文引述内容所说),并不总是一目了然的。我妈可能不太擅长把她对 ChatGPT 输出内容的不满转化为对提示词的进一步改进,但我意识到,无论我们的提示词工程技术如何,我们真正擅长的是表达我们所看到的问题(即抱怨)的能力。(根据我让它写过的成千上万篇文章,我目前的看法是肯定的)而且,
博客
Advanced RAG 04:重排序(Re-ranking)技术探讨
04-20 901
本文介绍了两种主要的 Re-ranking 方法,并演示了如何将其融入到 RAG 系统中,提高系统性能。分别是:(1) 使用 Re-ranking 模型直接对检索到的文档和 query 之间的相关性进行评分和排序。作者介绍了一些可用的开源和商业 Re-ranking 模型;(2) 利用大语言模型(LLM)对文档和 query 进行深入理解,通过对相关性程度进行排序来实现 Re-ranking 。文中介绍了 RankGPT 这种基于 LLM 的 Re-ranking 方法。
博客
Advanced RAG 03:运用 RAGAs 与 LlamaIndex 评估 RAG 应用
04-17 617
作者 | Florian June编译 | 岳扬🚢🚢🚢欢迎小伙伴们加入AI技术软件及技术交流群,追踪前沿热点,共探技术难题~如果你已经为某个真实业务系统开发了检索增强生成(RAG)应用程序,可能会想了解该 RAG 应用的效果如何。换句话说,您可能想评估该 RAG App 的性能。另外,如果发现现有的 RAG 应用效果不佳,可能还需要验证使用的 RAG 性能优化方法是否有效。换句话说,需要进行评估,确定这些性能优化方法是否起了作用。在本文,我们首先介绍了由 RAGAs(Retrieval Augment
博客
LLM 推理优化探微 (4) :模型性能瓶颈分类及优化策略
04-11 1066
在人工智能浪潮袭卷全球的大背景下,进一步提升人工智能模型性能,满足更多应用需求已经刻不容缓。如何优化模型延迟和吞吐量,成为了业界亟待解决的重要问题。我们今天为大家带来的这篇文章,其观点为:不同的性能瓶颈需要采取不同的优化策略,识别并解决主要的性能瓶颈是提升模型性能的关键。文章指出,主要有 4 种影响模型性能的瓶颈:计算能力受限、内存带宽受限、通信受限和开销受限。作者分别介绍了针对这 4 种情况可采取的优化措施。另外,文章还全面分析了算术强度和硬件配置等因素对吞吐量的影响。作者提出可通过增加算术强度、
博客
Advanced RAG 02:揭开 PDF 文档解析的神秘面纱
04-07 974
这篇文章系统地分析了 PDF 文档解析中的各种挑战,并给出了一系列解决思路和改进算法,为进一步提高非结构化数据解析的质量贡献了有价值的见解,同时也指出了未来 PDF 文档解析的发展方向。例如,如果用户想了解图 9 中第 2.1 节的大意,只需准确提取出第 2.1 节的标题,并将其与相关内容一起作为上下文发送给 LLM,最终所得到的回复内容的准确性就会大大提高。在这种情况下,建议选择最适合项目需求的方法,根据不同类型的 PDF 文件,采取特定的处理方法。否则,将其视为右列的一部分。该页面如图 3 所示。
博客
Advanced RAG 01:讨论未经优化的 RAG 系统存在的问题与挑战
04-03 716
自 2023 年以来,RAG 已成为基于 LLM 的人工智能系统中应用最为广泛的架构之一。由于诸多产品的关键功能严重依赖RAG,优化其性能、提高检索效率和准确性迫在眉睫,成为当前 RAG 相关研究的核心问题。我们今天为大家带来的这篇文章指出,Naive RAG 在编制索引、检索和内容生成这三个核心步骤中都存在诸多问题:a) 编制索引时,信息提取不完整、分块策略简单、索引结构未优化、嵌入模型表示能力较弱;b) 检索时,检索到的信息与用户向系统提出的请求相关性不高、召回率低、对不准确的用户请求无法处理、算法
博客
LoRA 及其衍生技术总览:An Overview of the LoRA Family
03-30 991
对于大语言模型的微调训练来说,传统的全参数微调方法需要处理数百万甚至数十亿级别的参数,计算量和显存占用都非常大。而 LoRA 这种技术方案,通过引入少量的可训练矩阵来调整预训练模型的行为,极大降低了训练所需的计算资源,是近年来大语言模型微调的一个重大突破。我们今天为大家带来的文章,介绍了众多具有代表性的 LoRA 改进方法:LoRA+ 通过为两个矩阵引入不同的学习率提高训练效率;VeRA 和 LoRA-FA 通过训练更少的参数降低计算量;LoRA-drop 和 AdaLoRA 通过动态选择需要训练的层提
博客
发掘非结构化数据价值:AI 在文档理解领域的现状与未来
03-28 427
在当今这个由数据主导的时代,我们被海量多样的信息所环绕,但大部分数据都以非结构化的形式存在,诸如文档、电子邮件、合同等,这使得从中提取有价值的信息成为一大挑战。幸运的是,AI 领域正在悄然孕育一场革命性变革,它将帮助我们攻克长期以来困扰非结构化数据处理的种种困难。
博客
Mistral AI vs. Meta:两大 Top 开源模型的对比
03-20 635
随着大模型的不断升级和参数量的持续扩大,越来越多人开始重视大模型存在的硬件资源要求高、碳排放量较大等问题。如何在保持模型性能的同时,降低计算成本和资源消耗,成为了业界一个迫切需要解决的问题。我们今天为大家带来的这篇文章,作者认为 Mistral AI 提出的一系列创新技术方案为解决这一问题提供了新思路。
博客
生成式 AI 术语指南:带有配图说明,没有数学公式
03-15 793
生成式人工智能技术的发展日新月异,这一领域涉及到了越来越多的专业术语和概念。对于刚接触这一领域的新手来说,理解这些术语算是一个门槛。我们有必要整理和解释这些术语,帮助更多人快速入门,投身 AI 事业。文章首先将这些生成式 AI 术语分为11大类,包括Types of Models、Common LLM Terms、LLM Lifecycle Stages等。然后对每一类术语进行了详细的解释和举例说明。这篇文章系统全面地总结了当前生成式人工智能领域的主流术语和概念,涵盖了理论、架构、评估、优化等多个方
博客
LLM 推理优化探微 (3) :如何有效控制 KV 缓存的内存占用,优化推理速度?
03-09 1270
本文主要内容如下:(1) KV缓存随序列长度线性增长,容易超过模型本身的规模,严重制约最大序列长度; (2) 减小KV缓存对GPU内存的占用,是优化推理速度和吞吐量的关键; (3) MQA、GQA等新型注意力机制、FastGen等缓存压缩策略,以及PagedAttention等内存管理机制,都是能够有效缓解 KV 缓存内存占用压力的技术手段。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
写文章

热门文章

  • 理解DALL·E 2, Stable Diffusion和 Midjourney工作原理 14467
  • 轻松理解20种最常用的AI算法 11260
  • 用ChatGPT优化AI绘画提示词的探索 9083
  • 理解DALL·E 2, Stable Diffusion和 Midjourney工作原理 7384
  • 10个优秀的AI艺术生成器 6543

分类专栏

  • 技术干货 82篇
  • AIGC 8篇
  • MLOPs 1篇
  • IDP 2篇

最新评论

  • AI Agent:人类工作范式的颠覆者还是人机协作新范式?

    Baihai IDP: 🚢🚢🚢欢迎小伙伴们加入[AI技术软件及技术交流群](https://www.yuque.com/baihai_idp/kencft?#),追踪前沿热点,共探技术难题~

  • Advanced RAG 06:生成结果的相关性低? 快用 Query Rewriting 优化技术

    普通网友: 干货满满,细节很到位!【我也写了一些相关领域的文章,希望能够得到博主的指导,共同进步!】

  • LLM 模型融合实践指南:低成本构建高性能语言模型

    ha_lydms: 作者对于人际关系的分析非常到位,让我受益良多。

  • 大语言模型评估全解:评估流程、评估方法及常见问题

    ReganYue: 客气啦~表情包

  • 大语言模型评估全解:评估流程、评估方法及常见问题

    weixin_58091360: 谢谢

大家在看

  • Nginx(openresty) 查看连接数和并发送
  • 使用简单MLP和CNN实现姓氏分类
  • Python基础学习笔记Day2
  • 数据结构笔记 3 串 数组 广义表
  • Kimichat使用案例010:快速识别出图片中的表格保存到Excel 25

最新文章

  • Next-Level Agents:释放动态上下文(Dynamic Context)的巨大潜力
  • LLMs 能否胜任「数据标注」?机遇与挑战并存
  • AI Agent:人类工作范式的颠覆者还是人机协作新范式?
2024年32篇
2023年57篇
2022年32篇

目录

目录

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43元 前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值

PHP网站源码塔城关键词排名包年推广蚌埠如何制作网站公司玉林模板网站建设多少钱宜宾网站优化按天收费报价上饶网站开发价格黄冈优秀网站设计推荐丽江品牌网站设计多少钱宁波seo网站优化报价渭南企业网站制作报价庆阳网站优化按天计费哪家好阜新网站制作设计哪家好九江网站搜索优化推荐济源seo甘南网站关键词优化价格吴忠至尊标王报价南充网站推广方案哪家好淮安网页制作推荐萍乡关键词按天收费价格濮阳SEO按效果付费公司揭阳关键词按天扣费价格阳江网站优化黔南网络营销推荐黑河阿里店铺运营咸阳网站优化按天扣费哪家好孝感网站定制公司乌海百搜标王多少钱资阳至尊标王推荐遵义企业网站设计武威外贸网站设计哪家好丹竹头营销型网站建设歼20紧急升空逼退外机英媒称团队夜以继日筹划王妃复出草木蔓发 春山在望成都发生巨响 当地回应60岁老人炒菠菜未焯水致肾病恶化男子涉嫌走私被判11年却一天牢没坐劳斯莱斯右转逼停直行车网传落水者说“没让你救”系谣言广东通报13岁男孩性侵女童不予立案贵州小伙回应在美国卖三蹦子火了淀粉肠小王子日销售额涨超10倍有个姐真把千机伞做出来了近3万元金手镯仅含足金十克呼北高速交通事故已致14人死亡杨洋拄拐现身医院国产伟哥去年销售近13亿男子给前妻转账 现任妻子起诉要回新基金只募集到26元还是员工自购男孩疑遭霸凌 家长讨说法被踢出群充个话费竟沦为间接洗钱工具新的一天从800个哈欠开始单亲妈妈陷入热恋 14岁儿子报警#春分立蛋大挑战#中国投资客涌入日本东京买房两大学生合买彩票中奖一人不认账新加坡主帅:唯一目标击败中国队月嫂回应掌掴婴儿是在赶虫子19岁小伙救下5人后溺亡 多方发声清明节放假3天调休1天张家界的山上“长”满了韩国人?开封王婆为何火了主播靠辱骂母亲走红被批捕封号代拍被何赛飞拿着魔杖追着打阿根廷将发行1万与2万面值的纸币库克现身上海为江西彩礼“减负”的“试婚人”因自嘲式简历走红的教授更新简介殡仪馆花卉高于市场价3倍还重复用网友称在豆瓣酱里吃出老鼠头315晚会后胖东来又人满为患了网友建议重庆地铁不准乘客携带菜筐特朗普谈“凯特王妃P图照”罗斯否认插足凯特王妃婚姻青海通报栏杆断裂小学生跌落住进ICU恒大被罚41.75亿到底怎么缴湖南一县政协主席疑涉刑案被控制茶百道就改标签日期致歉王树国3次鞠躬告别西交大师生张立群任西安交通大学校长杨倩无缘巴黎奥运

PHP网站源码 XML地图 TXT地图 虚拟主机 SEO 网站制作 网站优化