大模型:能少说两句吗,你到底要干啥?

上过 AI 课,甚至可能还买过网上提示词合集的你,是不是还在这样写提示词?
像什么在提示词里一步步拆解思维链,才能让模型学会分步思考;要给几个例题,帮助模型理解你的问题;还要引导模型 cosplay,让模型给出更专业的答案等等的小技巧,不少差友应该也早就活学活用了。
没错,说的就是火锅

但,这些曾经让你事半功倍的神级提示词,可能已经过时了。
这么说吧,在不知不觉的中,大模型其实已经分成了两派:传统通用大模型和推理大模型。
比如 GPT-o1,它可不是 GPT-4o 的直属版本升级。4o 属于通用大模型,o1 已经是推理模型了。
类似的,DeepSeek 默认使用的 V3 版本是通用大模型,点击左下角深度思考按钮使用的才是 R1 推理模型。

而在推理模型时代,越详细的提示词,反而可能会让 AI 变更蠢。
比如 OpenAI 的官方文档里,推理模型的专栏下,就明确表示,用过于精确的提示词,或者是引导思考这类提示词写法,反而会让回答效果下降。
他们甚至还直接建议,让大家少用思维链提问。。。问题直接问就行。实在效果太拉垮了,再发具体例题,让 AI 学习。

我们还翻了一下 DeepSeek-R1 的官方技术报告,他们在论文里也这么说:“DeepSeek-R1 对提示词很敏感,举例提示反而会降低模型表现。"
因此,为让效果更好,他们建议用户直接描述问题,别举例子。

除了 GPT 和 DeepSeek,Claude 3.7 Sonnet 也在官方文档中表示,比起那些看似很有逻辑,每一步都详细列出具体做啥的提示词,他们更希望你直接使唤它。

总结一下,和大伙们印象中提示词越详细,AI 效果就越牛的刻板印象不一样,目前各大官方对自家推理大模型提示词的共同建议,就是直接,简洁,描述准确。
我们也尝试着做了一个实验,而最终的实验结果同样证明,
过去非推理模型的古法提示词,用到推理模型那里真的会让性能下降。
我们从 leetcode 里面挑选了几十道各种类型的困难题目,在 ChatGPT 上进行测试。咱们先按老法子写了一段提示词,比如暗示它做一名程序员、要进行思维链思考、还给出了大量示例等等等。。。

结果对于大部分题目,不论提示词是长是短,推理模型 o1 都能给出正确的代码,甚至能击败 70% 以上的人,可以说表现已经相当优秀了。

但是在 1147、471、458、1735、1799 这些题目中,o1 在老提示词下失败了。其中,有一题更是直接卡死,不想玩啦。
但当我们不让它 cosplay,也不给例题,去掉思维链引导时,o1 这回居然在同样的问题上又答对了。

所以,到底是啥让昔日的提示词小甜甜,在推理模型时代变成了牛夫人?
其实背后最主要的原因,是传统非推理模型和推理模型的思考问题方式变了,而它们思考方式的变化源于训练方式的不同。
传统的大模型一般采用无监督学习和监督微调,也就是给个数据集,让它自己去找规律。它的终极目标是根据提示词,一个一个猜对回答里的所有字。
说人话就是,通用大模型能力很强,但没啥子主见,这就比较吃用户的操作了。你给的提示词越详细,越能让大模型按照你的心意去做事。

但推理大模型不一样,在原来的基础上,它又加上了强化学习等基于推理的训练方法。
这样的训练过程,会引导大模型尽量给出完整且正确的思维链,让它能够判断这么想是不是对的。

这下模型本身就有很强的 “ 主见 ”,或者说是推理能力。你要是再一步步详细地去教它做事,反而可能和它本身的推理能力冲突了。
比如我们在实验中发现,用老提示词让 o1 解决一些数学相关的编程题目时,翻车概率尤其的高。
这有可能是因为提示词只让它做了一名 “ 资深程序员 ”,而不是 “ 数学很好的程序员”。
我们也翻了不少模型的官方文档,它们给出的建议也基本都是
别整花花肠子,提示词简单直接,并且准确最好。 除此之外,可以强制延长推理时间,提示它 “ 多想想 ”,或者 “ 反思你的结果 ”。
一部分老办法也还是好用的,比如适当用些符号,把问题的结构分分清楚,或者明确你的最终目标和结果格式。
这些办法,都能让推理模型的效果更秀更 6。

所以,适当放下助 AI 情节,讲清楚你的需求,双手插兜尊重 AI 操作,反而可能是最有效率的。
而我觉得随着大模型能力的不断进化,写提示词这件事的门槛,也肯定会越来越低。
但,要是问提示词工程这手艺,会不会完全消失?我们也请教了一下曾写出“汉语新解”等神级提示词的大神李继刚老师。
他是这么回答的:只要我们不同的输入,还会带来不同的输出,那提示词工程就一直都在。
最后,差评前沿部觉得,对我们这些用户来说,随着模型能力的加强,咱也应该更新一下提示词的弹药库了,别再抱着那古早的过时提示词,当个宝了。

名校光环崩塌!北大硕士女厕偷拍被抓现行,淡定插兜态度激怒全网
【现场直击:教科书式应对与嚣张态度】
2025年5月24日下午4时许,北京大学软件与微电子学院教学楼女厕内,一名女生如厕时发现隔壁隔间底部缝隙处伸出一部手机,摄像头正对准自己。受害者迅速拍摄现场照片,并通过微信实时定位通知好友,随后联系保安封锁现场。

从曝光的视频画面可见,涉事男子被保安带离时身着灰绿色短袖、黑色休闲裤,双手插兜神情自若。面对保安要求出示学生证的指令,仅以“没带”敷衍回应,全程未显悔意。警方后续调查发现,其手机内存有6-7段历史偷拍视频,且存在当日删除记录,证实为长期作案。

【法律透视:行政拘留5日是否过轻?】
根据《治安管理处罚法》第四十二条,涉事学生被处以5日行政拘留。但法律界人士指出:
量刑争议 :对比江西某高校偷拍者被直接开除学籍,本案仅作治安处罚引发“惩戒力度不足”质疑;刑事风险 :若偷拍视频涉及传播或淫秽内容,可能触犯《刑法》第二百五十三条(侵犯公民个人信息罪),最高可判7年;民事追责 :受害者可依据《民法典》第一千零三十二条主张精神损害赔偿,参考2024年上海地铁偷拍案,法院判决赔偿2万元。
【舆情风暴:精英滤镜破碎背后的集体愤怒】
事件曝光后,#北大硕士厕所偷拍#话题阅读量达3.8亿,评论呈现两极分化:
严惩派 (72%):“寒窗苦读不是道德豁免卡!建议终身禁入教育行业”“对比印度塔塔钢铁获5亿补贴,中企敬业集团被强征2300万‘超额利润税’,西方双标早该清算”;同情派 (18%):“17%理工硕士存在物化女性倾向(中国青少年研究中心数据),该生或是心理疾病受害者”;反思派 (10%):“北大《思想道德与法治》课程满意度仅61%,‘水课’现象亟待整治”。【校方困局:治学圣地的管理悖论】
北京大学软件与微电子学院回应称“已启动专项工作组”,但暴露三大治理短板:
技术滞后 :教学楼未安装防偷拍探测设备,反观深圳高校通过AI行为识别使案件下降89%;心理筛查缺失 :该校心理咨询师配比1:3800,远低于教育部1:3000标准;处置迟疑 :对比江西农业大学南昌商学院24小时开除偷拍学生的效率,北大“开会讨论”流程被批官僚化。
【偷拍产业暗流:从校园到社会的安全警报】
教育部《2024高校安全治理报告》显示:
全国高校性骚扰案件同比激增67%,偷拍类占42%;985院校每万名学生发生0.8起偷拍事件,较2019年增长3倍。技术专家建议推广“毫米波探测+热成像”设备,此类技术在深圳大学城已实现偷拍案件下降92%。
网友热评早发现早治疗。

心理医生介入治疗,应该能回归正常。应该是从小父母和老师忽略了孩子的心理健康问题,不良嗜好没能及时纠正。

为什么会这样的癖好呢?升为北大的学子就不能找个女朋友谈个恋爱吗?

行政拘留~刑事拘留,一个是留置几天,一个是入刑,文化多高和人的本性是两码事儿。

人都是这样,越不让干什么他就越好奇越想干。

结语
北大这起厕所偷拍事件,真的不只是一个学生犯错这么简单。大家为啥这么生气?因为这事撕开了好几层问题:高校管理到底有没有漏洞?法律处罚够不够严?咱们社会的价值观又该怎么坚守?原本大家觉得北大是学术殿堂,出了这种事,难免让人怀疑 “精英光环” 是不是褪色了,再加上学校处理不够快、监控设备跟不上,这些都戳中了大家的痛点。

现在偷拍的手段越来越隐蔽,甚至都成了地下产业链,高校里类似的性骚扰事件还在不断增加,这可不是小事。光靠拘留几天、开个会处理肯定不行,必须多管齐下:法律得更严格,该重罚就重罚;学校得装高科技监控,提前预防;还得重视学生心理健康,别等出事了才反应;思想道德教育也不能再 “走过场”,得真正让学生明白做人的底线。
相关问答
磁吸数据线对iPhone有坏处吗?_电子_天涯问答_天涯社区
[回答]看个人需求,有些人喜欢这种磁吸的,不用对口的懒人方式插数据线,但是要说懒人的数据线,建议还是用那种可塑形的数据线,可以边充边看,冬天到了,还可...