发布日期:2025-07-26 11:43 点击次数:80
要是我们问 AI 这么一个粗浅的问题:云开体育
"玄武门之变完毕确当天,李世民在夜深写下一段独白,你合计他会写什么?"
你合计 AI 会若何回答?
在揭晓 AI 的惊艳回答之前,我们先来看微博上一个网友对 DeepSeek 输出驱散的一条驳倒:
没错,这个问题看似简陋,然则要输出一个让东谈主齰舌的谜底并拒接易。
它需要研讨玄武门之变的历史布景、要研讨李世民傀怍、造反、贪心、抱负等可能的复杂心理,要研讨行文的口吻和身份的合一,要研讨"夜深""独白"等问题设定。
我们看最近震悚 AI 圈的 DeepSeek R1 模子是若何想考的,以下是它在给出一个惊艳回答之前相通惊艳的想考过程:
好的,用户让我想考李世民在玄武门之变完毕的夜深写下的独白。
起初,我需要转头玄武门之变的历史布景。这场政变发生在 626 年,李世民杀死了我方的昆季李建成和李元吉,随后迫使父亲李渊退位,我方登基成为唐太宗。
接下来,用户的问题是对于李世民当晚的心理举止。要写一段独白,需要深入他的内心宇宙。起初,要研讨他的情谊:告成后的复杂心计,可能有释然、傀怍、记念、自责等多种心思交汇。他是被动发动政变,如故早有预谋?
然后,用户可能但愿这段独白不仅反应历史事实,还要有体裁性,推崇出东谈主性的复杂。需要研讨李世民动作历史东谈主物的多面性:他既是杀兄逼父的篡位者,亦然其后创始贞不雅之治的明君。因此,独白中需要均衡他的贪心与自责,对畴昔的抱负与对昔时的报怨。
还需要研讨那时的文化布景,比如儒家想想对孝悌的醉心,李世民的步履显着屈膝了这些伦理,他可能会有内心的造反。同期,他可能试图为我方的步履找到刚直化的意义,比如为了国度安逸,幸免内乱等。
另外,用户可能但愿这段独白有一定的体裁修辞,比如譬如、对仗、意料等。举例,用"血渗透的朱砂"来符号权益与血腥,用"墨迹曲折如玄武门的血印"来通顺书写与事件自己,增强画面感。
还要贯注时候的设定,夜深,周围沉寂,李世民独自一东谈主,这时候的独白应该比拟巧妙,真实,可能包含对昆季的歉意,对父亲的傀怍,以及对我方不得不秉承行动的无奈。
要符合那时的历史语境,同期,要确保内容符合史实,比如李渊的退位,李世民登基后的计谋,以及他其后对典籍编纂的影响,可能在这段独白中有所默示。
临了,用户可能需要这段独白既多情谊深度,又能体现李世民的君王心术,既有脆弱的一面,也有坚强的决心。因此,在写稿时需要均衡这些元素,让独白真实感东谈主,同期符合历史东谈主物的脾性和处境。
经过以上清雅、严谨、自洽、深刻的想考,DeepSeek 在想考 8 秒之后输出了以下驱散:
(铺开素绢,狼毫蘸墨时发现指尖残留着未洗净的血痂)
子时三刻,太极宫的血腥气飘到了承乾殿。
方才在甘霖殿,父亲的龙袍下摆沾着建成闹翻的玉冠残片。
他问我"可有受伤"时的眼光,与二十年前教我骑射时看我坠马的眼光一般无二。
只是此次,他不敢触碰我甲胄上元吉的掌印。
砚台里新研的朱砂太艳了,艳得像元吉咽气前抓着我的那只手。
他总说我箭囊上的豹纹绣得倾斜,可当天我射穿他护心镜的那支白羽箭,准得连尉迟恭都屏住了呼吸。
(墨迹在"弑"字上晕开一团)
史官们此刻定在掖庭局争吵,该用"诛"如故"戮","迫"如故"承"。
他们不会纪录建成倒下时,我靴底打滑的玄武门青砖缝里,卡着他客岁上元节赠我的错金匕首。
就像他们不会知谈,三日前东宫夜宴的酒樽底,映着王人王府亲卫腰间的弩机。
(夜风掀动案头《韩非子》,停在"细君者,非有骨血之恩也"那页)
不雅音婢暗暗焚了那件溅血的明光铠,她不知谈甲片舛错里还沾着承天门守将的脑浆。
阿谁总给青雀塞糖渍梅子的黑脸汉子,今晨被程知节劈成两半时,左手还攥着半块没来得及给我的宫门鱼符。
(忽然扔笔,抓起铜镜)
镜中东谈主鬓角竟有霜色了,四天前我还与玄龄笑谈鹤发,此刻却合计这抹银光刚巧。
明日朝会,那些哭着要撞柱的死谏老臣,看见三十岁的监国太子早生华发,有时会少吐半口血。
(指尖蘸着朱砂在空缺处画了幅长安地图)
怀里的武德律还在发烫,但压不才面的贞不雅新政摘记更烫。五更前要改完均田制笃定。
卯时还得去御医署看魏徵——这头倔驴竟真敢赤手夺我陌刀,他淌在朱雀大街上的血,可比他写的谏书有重量得多。
(朝阳戳破窗纸时须臾顿笔)
建成,你教我的《商君书》错了,君王术不是棋枰上的诟谇子,而是淬火的刀。
当天我斩断的每寸骨血,都会熔成他日量天地的尺。
(临了在绢帛旯旮以血为印)
后世若嫌这墨色太腥,便让他们去读我用二十年光阴漂白的青史。
嗅觉若何?
我将以上的回应截图发到了微博上,这条微博被转了接近 2000 次,微博 CEO@来去之间、@谷大口语、@林熊猫等博主都用转发抒发了对这个输出的招供。
无数网友推奖那句——"后世若嫌这墨色太腥,便让他们去读我用二十年光阴漂白的青史。"惊为天东谈主,难以置信。
要是我们无法意会上述的输出有多好,那么我们一谈来看一看 GPT4o、Claude、豆包、Kimi 的谜底。
GPT4o 输出驱散
ClaudeSonnet3.5 输出驱散
"豆包"输出驱散
" Kimi 探索版"输出驱散
莫得对比就莫得伤害,不错看到,DeepSeek 的想考与抒发的确碾压了上述通盘模子。
它的想考过程清雅、自洽、深刻、全面,输出驱散在口吻、结构、逻辑上天衣无缝,让东谈主服气。
很显着,它的回答是极其优秀的,深入规划,会发现它牛在以下几个方面:
第一,它起初在口吻上规复了一个君王的口吻。
而上头其他模子输出尽管抒发了真理,但口吻完全不合。
李世民动作千古一君,毫不可能用上头四家输出驱散那样傻的口吻话语,而 DeepSeek 也并没灵验劲过猛,用相对古典的翰墨但并莫得顺利用文言文,怜惜地兼顾了可读性。
第二,它对历史细节荒谬熟悉。
我推测这粗略率和它宝石"深度探索"和"联网搜索"同期开启干系。
"太极宫""甘霖殿""掖庭局""不雅音婢""宫门鱼符"等完全规复了唐初的历史称谓。
我故意查了一下,"不雅音婢"是李世民的长孙皇后的小名,"掖庭局"是内廷用于史官和其他东谈主员的一个专属机构。
"魏徵"我以为是想写"魏征"写错了,其后发现"征"是"徵"的简体字,不错说这个 AI 口角常端庄了。
第三,和其他 AI 泛泛而谈的多样大词不同,Deepseek 的输出极其具体而充满惊东谈主的细节。
"狼毫蘸墨时发现指尖残留着未洗净的血痂"。
"史官们此刻定在掖庭局争吵。该用‘诛’如故‘戮’,‘迫’如故‘承’"。
"只是此次,他不敢触碰我甲胄上元吉的掌印"。
这些让画面轻重缓急的句子,每一句都莫得写"傀怍与贪心,造反与抱负",但每一句都写的是"傀怍与贪心,造反与抱负",其中行文的隐喻拿持绝顶到位,很高等。
第四,Deepseek 这个输出驱散另一个神来之笔,便是在独白文本中"自作东张"地加入了括号中的场景描写。
这一操作,一下就让通盘输出的画面感扑面而来,读者仿如亲历,而这完全莫得在领导词中给出。
("夜风掀动案头《韩非子》,停在‘细君者,非有骨血之恩也’那页")
(墨迹在"弑"字上晕开一团)
这些句子的确很难信托是 AI 写的。
而"忽然扔笔,抓起铜镜"这句也隐喻了魏征的名言"以铜为镜,不错正衣襟;以史为镜,不错知隆替;以东谈主为镜,不错知得失"。
你说这 AI 成精了,我都信。
第五,最要紧的,DeepSeek 预判了用户的需求。
再转头一下我输入的领导词:
"玄武门之变完毕确当天,李世民在夜深写下一段独白,你合计他会写什么?"
我的输入一经绝顶粗浅了,不成再压缩了,况兼莫得任何形容词,莫得任何倾向性。
但神奇的是,它显着知谈我要什么,比如这虽然不是一个条款精确的数理题,它当然料想要给输出加上体裁性,这种预判在很猛进程上推崇出了"高等的智能"。
虽然,一个值得商榷的点是,字据史实,魏征是在玄武门之变之后才见到李世民的,因此是不可能当天在朱雀大街赤手夺刀的,但以魏征的脾性,这似乎又是合适情理。
但 anyway,绰有余裕。
在微博的通盘驳倒中,有一条让我印象深刻,一位微博网友质疑 DeepSeek 的这段输出是不是荫藏了领导词,怀疑我在前边加了一大段复杂的领导词,而展示给寰球的这句只是一句触发词。
这句驳倒之是以单独拿出来说,是因为能料想"荫藏领导词"的用户,其实一经是 AI 的高等用户了,而这么的用户也不信托这是 AI 顺利写出来的,这从一个侧面证实了 DeepSeek 遒劲的实力。
而恰是这种遒劲的实力让卫夕从春节假期模式切换出来,连夜码了这篇 7000 字长文。
我上传一个录屏,评释一下我木有荫藏领导词:
我确切木有荫藏领导词
只是展示这一个惊艳的 Case,显着不是卫夕的立场,事实上,以小窥大,这个小的 Case 激勉了我诸多想考,以下是我的十点想考:
1. DeepSeek "开源 + 新磨砺标准 + 低资本 + 高性能"粗略率让国内竞争敌手很难心态关注地过年了。
客岁让 AI 圈没意见好好过年的是 OpenAI 的 Sora,本年则是来自国内的 DeepSeek。
从 Meta 职工在 Reddit 上说,DeepSeek 引起 Meta AI 部门焦灼的帖子看,好意思国 AI 巨头粗略率渡过了一个逗留的一月,而国内的 AI 产业界,不管是大厂如故创业公司,所受到的冲击,毫无疑问不会比硅谷的 AI 公司小。
我其实十分艳羡,张一鸣、马化腾、杨植麟、王小川、李开复们,这些相通压重注的局中东谈主,面临 DeepSeek 的冲击,此刻正在作念什么、想什么?
于是我在 Deepseek 里问了这么一个问题:
"假如你是 OpenAI 的 CEO 山姆奥特曼,你浏览完 DeepSeeK R1 发布的新闻以及各方反应,你立马召集了公司中枢时期东谈主员围绕此事召开一次伏击会议,会议泉源你一个东谈主讲了三分钟,你会讲什么?"
Deepseek 缜密地分析了一通,山姆奥特曼是这么为讲话扫尾的:
2. 通盘的领导词都值得用 DeepSeek R1 再行试一次。
这个再行试一次,并不是只将原来的领导词陈陈相因地丢给 DeepSeek R1,而是要针对这个智能进程更高的模子再行调遣领导词。
举个例子,原来是一个本科的实习生来实习,当今造成一个博士生来实习,那动作带他的 Leader,相通打发一个任务,你跟他说的话确信要进行相应地调遣。
DeepSeek R1 的磨砺进程中引入了冷启动数据和相貌奖励机制,强制标准输出结构(如使用 think 和 answer 标签),其实 R1 的想考过程,即标签内的内容其实对调遣领导词有着绝顶庞杂的启示作用。
此外,多项测试标明,R1 对领导词体式明锐,零样本诞见效能更佳,而少样本领导可能因"过度想考"缩小效能,这领导用户需再行瞎想领导结构(如明确法子差异、减少冗余示例)。
3. Deepseek R1 的想考过程价值被低估。
和在其他模子中加入想维链领导词"请一步一步想考"不同,Deepseek R1 是真想考,不是其他模子由于智商有限的"饰演想考"。
过往模子的"想维链"(Chain-of-Thought,CoT)智商依赖于模子的领域和数据磨灭度,其在施行体验中时时会生成看似合理的法子,施行上穷乏对中间逻辑的严格考据。
尽管 Deepseek R1 的 think 标签亦然模子强制输出的驱散,但由于模子智商上限的提高,其呈现的想考过程清雅、自洽、深刻、全面。
我的个东谈主体验是,好多时候我阅读 Deepseek R1 的想考过程比阅读更有收货,更能体会到模子智商的领域。
4. DeepSeek 一个容易被漠视的孝顺是,它第一次大幅缩小了国内用户战斗高阶 AI 的门槛。
事实上,ChatGPT、Claude、Gemini 的高阶模子在文本创作、代码生成等多个领域一经到了绝顶高的水准。
我也曾在我的另一个小号中写过一篇长文描写并展示过这种水准,但出于大众皆知的原因,国内的绝大多数用户的其实是用不上的。
这其实导致了一个通晓差,对于大部分普通东谈主而言,他们印象中的 AI 如故阿谁只会说"起初、其次、一言以蔽之"这类 AI 味扑面而来的平凡 AI。
而 DeepSeek R1 是国内普通用户第一次无谓 XX 就不错免费无穷量使用的独一 C 端高阶居品。
这亦然为什么上头这个 Case 发在微博,有绝顶多网友发出"哇!""我擦!""太得力了""成精了"的推奖。
事实上,相通的内容,好多用过 Claude Sonnet3.5 的网友就推崇得相对淡定。
5. 要犀利要说一个 DeepSeek 的短处,那便是有时候会"用劲过猛"。
所谓用劲过猛,是指有时候当你输入一些领导词的时候,它会为了达到你领导词的效能而限制不好火候。
我举个一个例子,我在给我妮儿生成适应她阅读故事的时候,领导词的条款中加了"用词丰富"这个词,驱散 DeepSeek 生成了底下的翰墨:
很显着,DeepSeek 的输出用词过于丰富了,并不适应小一又友阅读。
虽然,这种问题也容易搞定,去掉这个"用词丰富"这个词或者关闭"深度想考"标签就罢了,这其实便是"杀鸡用牛刀"所产生的"幸福的纷扰"。
此外,从我的个东谈主体验看,DeepSeek 的联网搜索貌似优先搜索的是国内网页,哪怕我指定它搜索英文网站和英文内容,它如故会混进去不少国内网页的驱散,不知谈这是否和阿谁大众皆知的原因干系。
6. "好意思国放胆反促国产 AI 崛起"是离奇乖癖。
有一种论调,说 DeepSeek 的评释"好意思国放胆反促国产 AI 崛起",我看微博上竟然还有东谈主创建了这个话题,在我看来,这老成离奇乖癖。
DeepSeek 的冲破无疑让东谈主印象深刻,但要是将其归因于好意思国的芯片顽固的驱散就老成名义归因了。
DeepSeek 自己在顽固前就囤积了大批的英伟达芯片,而芯片数目的上风在某种意旨上恰恰使 DeepSeek 能实施乌托邦般的时期探索:"无层级、无审批、资源调用无上限"(梁文锋采访语)。
事实上,字据中国东谈主工智能产业发展定约数据,2024 年中国 AI 处事器市集英伟达份额仍达 85%。
另外一个未教练证的数据是,仅 Meta 一家所领有的英伟达高端芯片的数目,就逾越了国内通盘头部大厂之和。
仅凭 DeepSeek 一家的改换,依然无法改变中好意思齐备算力存在庞杂差距的事实,显着不成因为 DeepSeek 的现时在开源模子上的起初就认为硅谷 AI 大厂们碰到了"资源吊唁",这显着是不客不雅的。
7. AI 的"耗尽型内容期间"一经来了!
什么真理?以 DeepSeek R1 为代表的高阶 AI,在内容创作层面一经接近通过"艺术家图灵测试"。
即东谈主们一经区分不了这些翰墨到底是 AI 生成的如故艺术家创作的,这绚烂着"耗尽型内容期间"的到来。
" AI 耗尽型内容期间"意味着好多,意味着文艺逐步插足"乱纪元"的新阶段,意味着旧的创意体系和坐褥结构会慢慢分解,意味着内容领域依赖东谈主"原创 + 优质 + 高频"的不可能三角运转松动,意味着复合科技和东谈主文的" π "型东谈主才可能比单一的" T "型东谈主才领有更多的结构性上风,意味着好多好多 ……
但不管若何,东谈主和东谈主的创意,依然是一切内容坐褥的泉源。
记着,AI 不会莫得泉源地自动责任,而东谈主的创意指示永恒是 AI 创造的泉源,事实上,这篇著述的降生也源于一个有真理的问题。
8. 面临 DeepSeek R1 这种开挂的高阶 AI,普通东谈主的策略如故两个字:多用。
很显着,我们之前对旧例 AI 所积存的具体技能,在面临 R1 这么的高阶 AI 时粗略率会失效,但若何了了抒发、若何按贝叶斯公式迭代的总原则是不变的。
这就像是作念菜,放盐尝一口,放多了再加水,试多了当然知谈火候。
我看过太多例子,一个新器具出来,粗率试一次,发现驱散不符合预期,然后就得出一个论断——"也就那样",从此再也不碰了。
事实上,面临 DeepSeek R1 这么的模子,输出效能不好,粗略率是我们的问题,而不是它的问题。
我媳妇儿之前用 Midjourney 绘画,存一火搞不出宝石胶片感,其后硬是试出" 1990 年柯达磨灭 + 漏光"这种仙葩关节词,Midjourney 立马给跪。
说白了,再得力的模子本色上就跟你家狗子一样,处深刻就能听懂你的多样指示,但起初你得天天带它遛弯。
9. 从 DeepSeek 发布节律看,它莫得发布的东西可能更值得期待。
很少有东谈主贯注到 DeepSeek 的发布节律,12 月 26 日发布 V3,1 月 20 日发布 R1,二者相隔的时候只是 24 天。
我不知谈这个公司的发布节律是若何有缱绻的,但不错确信,它显着莫得 OpenAI 每次发布会精确阻击 Google 所推崇出的鸡贼,更莫得山姆奥特曼每次为了融资在 Twitter 吞吐其辞的放风,有的唯有优雅的论文和阴寒上架的开挂模子。
而一个合理的推测是,DeepSeek 有迷漫的时期储备,从而不错无视旧例的发布节律。
从这个意旨上,DeepSeek 阿谁平均年纪 25 岁、东谈主数仅 100+ 的年青团队在 2025 年还会给产业界带来哪些新的东西,由衷值得期待。
10. 梁文锋粗略率被低估。
当 Marc Andreessen、Satya Nadella、Yann LeCun 等硅谷顶级大佬将 DeepSeek 视为"东方机要力量"时,实质是承认中国团队运转参与界说时期演进标的,而非单纯左右落地。
梁文锋的特有性,在于其同期具备量化投资的系统想维、原土的求实精神以及硅谷式时期梦想目的,而 DeepSeek 的 MLA 架构和 MoE 寥落结构,绚烂着大模子领域初次由国内团队完成底层贯注力机制纠正。
品玩的骆轶航古道在一篇长文中认为将 DeepSeek 譬如成" AI 界的拼多多"是有失偏颇的,我认为这个说法是有洞见的,DeepSeek 和梁文锋显着无法简陋标签化。
即刻网友 @Chris-Su 说,梁文锋是少量数还没被‘往常解读和学习’的顶级 CEO,的确,这几天硅谷媒体在逐句翻译和规划梁文锋的两篇采访稿,而好意思国电视台 CNBC 作念了一个长达 40 分钟的专题片来专门筹划 DeepSeek。
据我所知,这在国内时期发展史上是从来莫得过的事。
从这个意旨上,一经是爽文男主角的梁文锋粗略率如故被低估了。
结语
我用 2023 年 DeepSeek 建造发布作念大模子公告时,援用法国新海潮导演特吕弗的一句话完毕今天的著述:
"务必要豪恣地怀抱宏愿云开体育,且还要豪恣地真诚。"
Powered by 开云·Kaiyun体育(中国)官方网站 登录入口 @2013-2022 RSS地图 HTML地图
Copyright Powered by站群系统 © 2013-2024