我们为什么需要“提示词工程” Prompt Engineering？

Auth:铂昂士 Date:2025/05/9 Cat:AI Word:共1349字 Views:675

暂无评论

文章目录

为什么需要“提示词工程”？

可迁移：好提示可以模板化，跨团队复用，节省试错成本。
可评测：输出质量、准确率、Latency、Token 使用量都可量化。
可迭代：结合自动化测试 / RAG / 函数调用，能够形成 Prompt → Model → 评估 → 改进的闭环。
对比优势明显：在企业/科研场景，同样的大语言模型，优化提示能把正确率从 60 % 提到 85 %+，直接影响业务效果与成本

关于大语言模型的一些误解

误解	现实
模型很强 → 直接问就行	LLM 仍然是“条件生成器”，靠输入的条件（提示词）决定输出；如果条件含糊、缺失，模型只能猜，从而出现跑题、格式错乱、幻觉。
只要数据大就一定准确	LLM 不是数据库。它用统计相关性来“补全”文本，默认追求流畅而非正确；精确定义任务与约束，才能让它优先满足“正确 / 可执行 / 可复用”。
一次提问就要拿到最终答案	复杂任务往往需要“分解-思考-验证-再迭代”。提示词工程提供了拆分任务、逐步推理、检核结果等模式。

本质：Prompt Engineering = 设计一份 输入说明书，让模型在 有限 token 和非确定性 的框架里，更稳定、更符合预期地工作。

好提示词的 6 个核心特征（“C-P-R-F-E-D”）

缩写	说明	要点
C = Clear	目标清晰、无歧义	“给我一个 JSON，字段 a/b/c” ⬆︎；“帮我分析一下” ⬇︎
P = Provide context	提供必要背景	行业、受众、约束、例子、输入数据…
R = Role	指定合适角色/视角	医生/Lawyer/DBA/产品经理…
F = Format	规定输出格式	Markdown 段落、表格、代码块、固定字段
E = Examples	关键示例 Few-shot	正向 / 反向例子各 1–2 条，可大幅降低误差
D = Decomposition	拆分子任务 & 过程提示	“先列步骤，再展开第 2 步”，或“思考后给最终答案”

示范：普通提示 vs. 优化后提示

普通提示	存在问题	优化后提示（符合 C-P-R-F-E-D）
“帮我写一份商业计划书。”	目标宽泛、格式不定	角色：资深创业顾问场景：面向天使投资人，项目=二次元音乐社区输出格式：①项目概述（≤150字）②市场痛点③竞争分析④盈利模型⑤3年财务预测（表格）约束：全中文，避免行话、每段标题加编号
“解释数据库分层。”	术语含糊，多种答案	背景：公司准备搭建数仓，团队新人多角色：10年经验的数据架构师任务：用类比+示例阐述 ODS→DWB→DWS→ADS 各层含义和依赖格式：Markdown 列表，每层用 2 行示例 SQL
“给我写一段 Python 代码调用 OpenAI 接口。”	版本、异常处理未知	示例输入：API_KEY=“sk-…”，模型=“gpt-4o”要求：Python 3.10，使用 httpx，封装成函数 ask_gpt(prompt:str)->str，包含超时与重试装饰器；给出运行示例

提示词常见技巧

Step-by-Step / Chain-of-Thought

“请分步推理，并在最后一行用【最终答案】给出结论。”

拒绝幻觉

“若不确定，请回答无法确定并简述原因；不要编造数据。”

迭代式提示

第一轮：产出草稿

第二轮：评审 + 让模型自我校对

第三轮：锁定格式与细节

工具化输出

用代码块包裹 JSON/SQL/CSV，后续可直接解析执行。

上下文压缩（长对话）

让模型先总结历史，再继续；降低 token 消耗、减少忘记前文。

本文首发于：我们为什么需要“提示词工程” Prompt Engineering？-Boang's Blog

除非注明，Boang's Blog文章均为原创，本文地址 https://www.boangs.com/ai/876/，转载请以链接形式注明出处。

作者：铂昂士简介：我只是个普通人，很普通，但是我有自己的梦，并追逐着。

《我们为什么需要“提示词工程” Prompt Engineering？》留言数：0

发表留言取消回复

文章目录