123,123

重磅好文！8個(gè)章節(jié)帶你全方位了解DeepSeek

這兩天，DeepSeek-R1 火的飛起，在中日美三個(gè) Appstore 榜上登頂。

還直接干崩英偉達(dá)，盤前先死 13 個(gè)點(diǎn)，連帶著臺(tái)積電一起。

重磅好文！8個(gè)章節(jié)帶你全方位了解DeepSeek

幾乎一夜之間，所有人都在關(guān)注 DeepSeek，甚至我在老家，完全沒用過 AI 的七大姑八大姨，都在問我，DeepSeek 是什么，怎么用。

還有一些人體驗(yàn)了一下后，拿著 8.11 和 8.9 誰大誰小的截圖跟我說，這玩意也不行啊。

感覺市面上，關(guān)于 DeepSeek 的信息還是很亂。

所以，今天我想用 8 個(gè)問題和答案，來讓大家詳細(xì)的了解，DeepSeek-R1 這個(gè)模型，是什么，以及，提示詞應(yīng)該怎么寫，到底怎么用。

話不多說，開始。

一、DeepSeek 是什么？

DeepSeek，是一家在 2023 年 7 月 17 日成立的公司深度求索所開發(fā)的大模型名稱。

重磅好文！8個(gè)章節(jié)帶你全方位了解DeepSeek

2024 年 1 月 5 日，他們正式發(fā)布 DeepSeek LLM，這是深度求索第一個(gè)發(fā)布的 AI 大模型。

2024 年 5 月 7 日，他們發(fā)布 DeepSeek-V2，正式打響中國大模型價(jià)格戰(zhàn)，當(dāng)時(shí)新發(fā)布的 DeepSeek-V2 的 API 價(jià)格只有 GPT-4o 的 2.7%，隨后一周時(shí)間，國產(chǎn)廠商全部跟進(jìn)，字節(jié)、阿里、百度、騰訊全部降價(jià)。

2024 年 12 月 26 日，DeepSeek-V3 正式發(fā)布且直接開源，而且訓(xùn)練成本僅為 557.6 萬美元，剔除掉 Meta、OpenAI 等大廠的前期探索成本，大概是別人的三分之一，并且整體模型評(píng)測(cè)能力媲美閉源模型，震驚海外，自此，東方的神秘力量徹底坐實(shí)。

2025 年 1 月 20 日，全新的推理模型 DeepSeek-R1 發(fā)布，同樣發(fā)布并開源，效果媲美 OpenAI o1，同時(shí) API 價(jià)格僅為 OpenAI o1 的 3.7%，再一次震驚海外，讓 Meta 連夜成立四個(gè)研究小組，讓全球算力暴跌，英偉達(dá)的神話都岌岌可危。

就是這么一家公司，而深度求索的背后，是著名量化私募幻方基金，而基金的盈利模式非常簡(jiǎn)單，跟管理規(guī)模綁定，固定收取管理規(guī)模的管理費(fèi)和收益部分的提成資金，無論基金漲跌都能賺錢，真正的旱澇保收的行業(yè)。

所以，幻方不缺錢，當(dāng)年賺了錢，在英偉達(dá)還沒向中國禁售的時(shí)候，幻方直接能掏錢搭一個(gè)萬卡 A100 集群。

這也讓深度求索，讓 DeepSeek，不以盈利為導(dǎo)向，目標(biāo)，就是 AI 的星辰大海。

二、DeepSeek-R1 是什么？

DeepSeek-R1，就是最近爆火的主角了。

也是直接讓各路美國 AI 大佬破防的始作俑者。

給奧特曼都在 X 上開始陰陽了。

重磅好文！8個(gè)章節(jié)帶你全方位了解DeepSeek

很多人拿 DeepSeek-R1 和 GPT4o 比，其實(shí)是不對(duì)的。

首先，GPT4o 是個(gè)多模態(tài)通用模型，可以理解圖片、語音、視頻，也可以輸出語音。多模態(tài)往后做，更像 Gemini 2，是一個(gè)多模態(tài)大一統(tǒng)模型，可以理解一切模態(tài)，也可以輸出一切模態(tài)。

而 DeepSeek-R1 是一個(gè)深度推理模型，對(duì)標(biāo) OpenAI 的應(yīng)該是 OpenAI o1，而不是 GPT4o，關(guān)于 OpenAI o1 曾經(jīng)我首發(fā)寫過一篇文章，可以去看，就不過多贅述了：OpenAI 全新發(fā)布 o1 模型 - 我們正式邁入了下一個(gè)時(shí)代。

現(xiàn)在回頭看，當(dāng)時(shí)這個(gè)副標(biāo)題，還是很有前瞻性的。

我也讓 DeepSeek 列個(gè)了 4o 和 o1 的對(duì)比表格，大家應(yīng)該也能一目了然。

重磅好文！8個(gè)章節(jié)帶你全方位了解DeepSeek

而 R1，可以直接類比 o1，兩者在跑分上，幾乎相同。

重磅好文！8個(gè)章節(jié)帶你全方位了解DeepSeek

并且已經(jīng)開源。

HuggingFace 鏈接： https://huggingface.co/deepseek-ai

論文鏈接： https://github.com/deepseek-ai/DeepSeek-R1/blob/main/DeepSeek_R1.pdf

三、DeepSeek-R1 在哪用？

DeepSeek-R1 除了面向開發(fā)者的開源模型和 API，也有面向普通用戶的 C 端版本。

網(wǎng)頁版： https://chat.deepseek.com/

重磅好文！8個(gè)章節(jié)帶你全方位了解DeepSeek

當(dāng)你勾上深度思考功能，此時(shí)就是使用 R1 模型，當(dāng)你不勾的時(shí)候，使用的是類 GPT4o 的 v3 模型。

當(dāng)然他們也有 APP 版本，你直接在應(yīng)用商店搜索 DeepSeek 就好。

重磅好文！8個(gè)章節(jié)帶你全方位了解DeepSeek

跟網(wǎng)頁端交互基本一致。目前免費(fèi)，就是用戶增速過快，所以偶爾會(huì)有崩潰斷網(wǎng)連不上問題，你可以在這個(gè)地方，來看 DeepSeek 的服務(wù)器狀態(tài)。

網(wǎng)址：https://status.deepseek.com/

重磅好文！8個(gè)章節(jié)帶你全方位了解DeepSeek

四、應(yīng)該怎么跟 R1 對(duì)話？

首先，我想明確一點(diǎn)的是，DeepSeek-R1 是推理模型，不是通用模型。

在幾個(gè)月前 OpenAI o1 剛剛發(fā)布時(shí)，我用通用模型的方式跟 o1 對(duì)話，寫了一堆的結(jié)構(gòu)化提示詞，得到了極差的效果，那時(shí)候我一度覺得這玩意是個(gè)垃圾。

而后面，我才發(fā)現(xiàn)，其實(shí)是我自己的思維慣性，這玩意跟 4o 不一樣，這不是一個(gè)很傻的聊天模型。

這是一個(gè)能力很牛逼但不知道你想要什么的真實(shí)員工。

今年 1 月也有一篇海外的文章很火，叫《o1 isn’t a chat model (and that’s the point)》。

跟我是完全一樣的看法。

所以，有一個(gè)點(diǎn)一定要注意，明確你的目標(biāo)，而不是給模型任務(wù)。

例如我們以前在寫 prompt 的時(shí)候，總是會(huì)寫你是一個(gè) XXX，現(xiàn)在我的任務(wù)是 XXX，你要按照 1、2、3 步來給我執(zhí)行 balabala。

但是現(xiàn)在，請(qǐng)拋棄那些寫法。

重磅好文！8個(gè)章節(jié)帶你全方位了解DeepSeek

把你的一切，交給 AI，讓它去進(jìn)行自我推理，效果會(huì)更好。AI 會(huì)自動(dòng)填上那些你沒說出口的話，會(huì)給你想出可能更好的解決方案。

有一個(gè)不得不承認(rèn)的事實(shí)是，我是一個(gè)很普通的普通人，而像我一樣的很多普通人們，現(xiàn)在大概率是不如 AI 博學(xué)和聰明的。

所以，不如說出你的目標(biāo)，把他當(dāng)作一個(gè)很牛逼的員工，讓他，放手去做。
比如這個(gè) case。

重磅好文！8個(gè)章節(jié)帶你全方位了解DeepSeek

只需要表達(dá)你是誰+你的目標(biāo)就 OK。

特別是你是誰這個(gè)背景信息，非常非常的有用。

重磅好文！8個(gè)章節(jié)帶你全方位了解DeepSeek

所以請(qǐng)拋棄掉一起過往所學(xué)習(xí)的結(jié)構(gòu)化框架，如果真的需要有一個(gè)萬能 Prompt 模板，那就是：

你是誰 + 背景信息 + 你的目標(biāo)

背景信息給的越多越能讓 R1 理解你的需求幫助你更好的完成任務(wù)。

時(shí)刻把他當(dāng)成：

這是一個(gè)能力很牛逼但不知道你想要什么的員工。

最牛逼的提示詞技巧，就是沒有技巧。

大道至簡(jiǎn)，重劍無鋒。

所以，千言萬語匯聚成一句話就是：用人話清晰的表達(dá)出你的需求，這就夠了。

五、R1 輸出的內(nèi)容看不懂？

很多人在用“說人話”這三個(gè)字，來表達(dá)推理模型和通用模型不一樣，這其實(shí)有點(diǎn)奇怪。

不過從實(shí)用角度來說，這確實(shí)是一個(gè)能讓普通人看懂 AI 輸出專業(yè)內(nèi)容的小技巧。

不過這并不是一個(gè)推理模型才有的技巧，因?yàn)橐恢本痛嬖�，本質(zhì)上就是對(duì)方不知道你是誰，不知道你的理解能力和你的學(xué)識(shí)能力是什么水平。

所以我也想分享一個(gè)我自己這兩年跟 AI 對(duì)話時(shí)用的最多的一個(gè)小技巧，也是我自己最常用的“人話”prompt：

我是一個(gè)小學(xué)生。

當(dāng)你在跟 AI 對(duì)話時(shí)，把這句話往前一擺，自降身位，你就會(huì)發(fā)現(xiàn)，一切都通了，一切都能看的懂了。

比如我想讓 R1 給我解釋一下什么叫大模型中的 RL 用法。

如果不用這句話的話，就會(huì)得到這樣的解釋。

重磅好文！8個(gè)章節(jié)帶你全方位了解DeepSeek

我相信你看到一定腦殼疼。你就是不懂才需要讓它給你解釋，結(jié)果解釋了個(gè)這。

但是，如果把那個(gè)神句加上呢？

重磅好文！8個(gè)章節(jié)帶你全方位了解DeepSeek

反正我是一下子能看了，舒服了多了，可能我就真的是個(gè)小學(xué)生的水平。。。

當(dāng)然如果你想稍微進(jìn)階一點(diǎn)，就可以說，我是一個(gè)初中生，或者，我是一個(gè)高中生，一點(diǎn)一點(diǎn)的可控升級(jí)。

我用了兩年，非常好用，推薦給大家。

六、R1 的寫作很強(qiáng)嗎？

R1 除了能非常好的做常規(guī)推理模型都能做的數(shù)學(xué)題、代碼等等，這次有一個(gè)非常非常特別的點(diǎn)是：

中文寫作能力強(qiáng)到爆炸。

過往，大家都說，在寫作能力上幾乎所有的大模型都是眾生平等的一坨屎，唯有 Claude 超出了一坨之外，獨(dú)立于三界之上。

而這一次，DeepSeek-R1 在中文寫作和文筆上，已經(jīng)是獨(dú)一檔的領(lǐng)先了。

而且對(duì)于文風(fēng)的模擬，效果極佳。

比如我非常非常喜歡知乎上一個(gè)大 V 叫大師兄朱炫的文筆。

重磅好文！8個(gè)章節(jié)帶你全方位了解DeepSeek

我甚至都不需要跟 DeepSeek-R1 說朱炫的文筆是什么樣的，直接就說一句話：

以知乎大 V 朱炫的文風(fēng)，來銳評(píng)一下愛情的求而不得，告訴大家，總會(huì)有人在等你。

來給大家看看成文：

重磅好文！8個(gè)章節(jié)帶你全方位了解DeepSeek

雖然達(dá)不到朱炫那百分百的功力，達(dá)不到他那種多智而近妖的文筆，但是已經(jīng)非常非常強(qiáng)了。

畢竟，只需要一句話而已。

再寫一首，李煜風(fēng)格的詩詞。

“以李煜的詩詞風(fēng)格，來寫一首我回老家沒有朋友玩的感覺”

重磅好文！8個(gè)章節(jié)帶你全方位了解DeepSeek

《虞美人·歸鄉(xiāng)感懷》
故園舊巷行人少，空有榆錢老。
秋千院落鎖蒼苔，偶見鄰家黃犬過階來。
重游往日嬉春處，蛛網(wǎng)斜陽駐。
笑談聲遠(yuǎn)柳風(fēng)涼，唯剩一庭明月照空廊。

對(duì)仗、押韻全都到位了。

真的，非常的強(qiáng)。

七、R1 可以聯(lián)網(wǎng)嗎？

眾人皆知推理模型好，但是推理模型，幾乎都不聯(lián)網(wǎng)。

典型如 OpenAI o1。

重磅好文！8個(gè)章節(jié)帶你全方位了解DeepSeek

這給我?guī)砹朔浅５亩嗟睦_，要知道，OpenAI o1 的知識(shí)庫還是 24 年，很多東西都不知道，更別提一些所謂的實(shí)事了，你想用它來梳理分析一些最近的數(shù)據(jù)，比如美元指數(shù)、比如最近的財(cái)報(bào)等等，它完全不知道，甚至還傳不了 PDF，就非常的 der 比。

而 DeepSeek，是為數(shù)不多的，推理+聯(lián)網(wǎng)的。

重磅好文！8個(gè)章節(jié)帶你全方位了解DeepSeek

我們來試試這句話：我想用魯迅的文風(fēng)寫一篇 2000 字的公眾號(hào)文章，分析一下 2025 春節(jié)檔哪幾部電影能爆，不要結(jié)構(gòu)化。

DeepSeek 去網(wǎng)上搜了 50 個(gè)網(wǎng)頁，然后思考了半天。

重磅好文！8個(gè)章節(jié)帶你全方位了解DeepSeek

用魯迅的文風(fēng)，成了一篇文。

重磅好文！8個(gè)章節(jié)帶你全方位了解DeepSeek

效果非常好。

雖然整體測(cè)下來，在聯(lián)網(wǎng)資料的 RAG 層面還有一些問題和不盡如意，但是已經(jīng)非常強(qiáng)了，至少，能聽懂我的話，知道我想要的是魯迅風(fēng)格。

再給一些時(shí)間。

八、算力神話崩盤了嗎？

最后，我想說一下算力的問題。

昨天，A 股算力和美股算力都崩了，大家?guī)缀醵及言驓w結(jié)到 DeepSeek 很便宜，所以未來不需要那么多算力，算力神話崩塌了。

但是我覺得這個(gè)思路不太對(duì)。

在第一次工業(yè)革命的時(shí)候，有一個(gè)經(jīng)濟(jì)學(xué)里面非常著名的悖論，是由威廉·斯坦利·杰文斯提出來的，叫做 Jevons 悖論。

當(dāng)時(shí)，英國的工業(yè)革命正在加速發(fā)展，蒸汽機(jī)的效率也在不斷提高。人們普遍認(rèn)為，蒸汽機(jī)會(huì)越來越節(jié)能，也越來越會(huì)減少煤炭消耗。
但實(shí)際情況卻打了所有人的臉。

因?yàn)椋咝У恼羝麢C(jī)降低了使用煤炭的成本，結(jié)果導(dǎo)致蒸汽機(jī)被更廣泛應(yīng)用，煤炭消耗總量反而大幅增加。

原因大概是這樣的：

假設(shè)新技術(shù)讓汽車的燃油效率提高了 50%（比如每加侖能跑 30 公里變成 45 公里）。照理來說，這應(yīng)該減少燃油總消耗，但現(xiàn)實(shí)可能是：

由于油耗更低，開車的成本下降，人們更愿意開車，開車?yán)锍淘黾印?/span>

購車門檻降低，更多人買車。

物流成本下降，商家擴(kuò)大運(yùn)輸量。

最終，油耗效率提高后，燃油消耗的總量可能不降反升。

跟現(xiàn)在算力邏輯是一摸一樣，如果你要把 DeepSeek 對(duì)與算力的影響帶入的話，那其實(shí)就會(huì)導(dǎo)致：

因?yàn)榇竽Ｐ托枰挠?xùn)練和推理算力成本下降，反而會(huì)推動(dòng) AI 應(yīng)用和生態(tài)的繁榮，端側(cè)、個(gè)人級(jí)別大模型逐漸成熟，算力的總需求反而越來越大。

至于股市算力崩盤，我想說的是，漲多了就是原罪。

而且美元指數(shù)都崩成什么樣了，直接破了 60 日均線，納斯達(dá)克和英偉達(dá)不崩才奇怪好吧。

重磅好文！8個(gè)章節(jié)帶你全方位了解DeepSeek

只能說，DeepSeek 有短期驅(qū)動(dòng)效應(yīng)，但是核心還是內(nèi)身問題，DeepSeek 踩中了這個(gè)節(jié)點(diǎn)，天時(shí)地利人和。

此刻的 DeepSeek，就是眾望所歸的，天命人。

寫在最后

昨天，馮驥的微博說，DeepSeek 是國運(yùn)。

我想說，是，也不是。

國運(yùn)不是單一的點(diǎn)，而是一群點(diǎn)而連成的面。

流浪地球、新能源車、黑神話悟空、六代機(jī)、TikTok、DeepSeek 等等等等。

這些點(diǎn)連起來的面，才是真正的國運(yùn)。

泱泱中華五千年。

無論多少風(fēng)雨。

未來也必定。

國運(yùn)昌隆。

作者的微信公眾號(hào)：數(shù)字生命卡茲克

點(diǎn)贊