8 個問題和答案帶你全方位了解DeepSeek

資訊頻道 - 觀點·話題 來源:數(shù)字生命卡茲克 作者:dayue 2025-02-11

重磅好文!8個章節(jié)帶你全方位了解DeepSeek

這兩天,DeepSeek-R1 火的飛起,在中日美三個 Appstore 榜上登頂。

還直接干崩英偉達,盤前先死 13 個點,連帶著臺積電一起。

重磅好文!8個章節(jié)帶你全方位了解DeepSeek

重磅好文!8個章節(jié)帶你全方位了解DeepSeek

幾乎一夜之間,所有人都在關(guān)注 DeepSeek,甚至我在老家,完全沒用過 AI 的七大姑八大姨,都在問我,DeepSeek 是什么,怎么用。

還有一些人體驗了一下后,拿著 8.11 和 8.9 誰大誰小的截圖跟我說,這玩意也不行啊。

感覺市面上,關(guān)于 DeepSeek 的信息還是很亂。

所以,今天我想用 8 個問題和答案,來讓大家詳細的了解,DeepSeek-R1 這個模型,是什么,以及,提示詞應(yīng)該怎么寫,到底怎么用。

話不多說,開始。

一、DeepSeek 是什么?


DeepSeek,是一家在 2023 年 7 月 17 日成立的公司深度求索所開發(fā)的大模型名稱。

重磅好文!8個章節(jié)帶你全方位了解DeepSeek

2024 年 1 月 5 日,他們正式發(fā)布 DeepSeek LLM,這是深度求索第一個發(fā)布的 AI 大模型。

2024 年 5 月 7 日,他們發(fā)布 DeepSeek-V2,正式打響中國大模型價格戰(zhàn),當時新發(fā)布的 DeepSeek-V2 的 API 價格只有 GPT-4o 的 2.7%,隨后一周時間,國產(chǎn)廠商全部跟進,字節(jié)、阿里、百度、騰訊全部降價。

2024 年 12 月 26 日,DeepSeek-V3 正式發(fā)布且直接開源,而且訓練成本僅為 557.6 萬美元,剔除掉 Meta、OpenAI 等大廠的前期探索成本,大概是別人的三分之一,并且整體模型評測能力媲美閉源模型,震驚海外,自此,東方的神秘力量徹底坐實。

2025 年 1 月 20 日,全新的推理模型 DeepSeek-R1 發(fā)布,同樣發(fā)布并開源,效果媲美 OpenAI o1,同時 API 價格僅為 OpenAI o1 的 3.7%,再一次震驚海外,讓 Meta 連夜成立四個研究小組,讓全球算力暴跌,英偉達的神話都岌岌可危。

就是這么一家公司,而深度求索的背后,是著名量化私募幻方基金,而基金的盈利模式非常簡單,跟管理規(guī)模綁定,固定收取管理規(guī)模的管理費和收益部分的提成資金,無論基金漲跌都能賺錢,真正的旱澇保收的行業(yè)。

所以,幻方不缺錢,當年賺了錢,在英偉達還沒向中國禁售的時候,幻方直接能掏錢搭一個萬卡 A100 集群。

這也讓深度求索,讓 DeepSeek,不以盈利為導向,目標,就是 AI 的星辰大海。

二、DeepSeek-R1 是什么?


DeepSeek-R1,就是最近爆火的主角了。

也是直接讓各路美國 AI 大佬破防的始作俑者。

給奧特曼都在 X 上開始陰陽了。

重磅好文!8個章節(jié)帶你全方位了解DeepSeek

很多人拿 DeepSeek-R1 和 GPT4o 比,其實是不對的。

首先,GPT4o 是個多模態(tài)通用模型,可以理解圖片、語音、視頻,也可以輸出語音。多模態(tài)往后做,更像 Gemini 2,是一個多模態(tài)大一統(tǒng)模型,可以理解一切模態(tài),也可以輸出一切模態(tài)。

而 DeepSeek-R1 是一個深度推理模型,對標 OpenAI 的應(yīng)該是 OpenAI o1,而不是 GPT4o,關(guān)于 OpenAI o1 曾經(jīng)我首發(fā)寫過一篇文章,可以去看,就不過多贅述了:OpenAI 全新發(fā)布 o1 模型 - 我們正式邁入了下一個時代。

現(xiàn)在回頭看,當時這個副標題,還是很有前瞻性的。

我也讓 DeepSeek 列個了 4o 和 o1 的對比表格,大家應(yīng)該也能一目了然。

重磅好文!8個章節(jié)帶你全方位了解DeepSeek

而 R1,可以直接類比 o1,兩者在跑分上,幾乎相同。

重磅好文!8個章節(jié)帶你全方位了解DeepSeek

并且已經(jīng)開源。

HuggingFace 鏈接: https://huggingface.co/deepseek-ai

論文鏈接: https://github.com/deepseek-ai/DeepSeek-R1/blob/main/DeepSeek_R1.pdf

三、DeepSeek-R1 在哪用?


DeepSeek-R1 除了面向開發(fā)者的開源模型和 API,也有面向普通用戶的 C 端版本。

網(wǎng)頁版: https://chat.deepseek.com/

重磅好文!8個章節(jié)帶你全方位了解DeepSeek

當你勾上深度思考功能,此時就是使用 R1 模型,當你不勾的時候,使用的是類 GPT4o 的 v3 模型。

當然他們也有 APP 版本,你直接在應(yīng)用商店搜索 DeepSeek 就好。

重磅好文!8個章節(jié)帶你全方位了解DeepSeek

跟網(wǎng)頁端交互基本一致。目前免費,就是用戶增速過快,所以偶爾會有崩潰斷網(wǎng)連不上問題,你可以在這個地方,來看 DeepSeek 的服務(wù)器狀態(tài)。

網(wǎng)址:https://status.deepseek.com/

重磅好文!8個章節(jié)帶你全方位了解DeepSeek

四、應(yīng)該怎么跟 R1 對話?


首先,我想明確一點的是,DeepSeek-R1 是推理模型,不是通用模型。

在幾個月前 OpenAI o1 剛剛發(fā)布時,我用通用模型的方式跟 o1 對話,寫了一堆的結(jié)構(gòu)化提示詞,得到了極差的效果,那時候我一度覺得這玩意是個垃圾。

而后面,我才發(fā)現(xiàn),其實是我自己的思維慣性,這玩意跟 4o 不一樣,這不是一個很傻的聊天模型。

這是一個能力很牛逼但不知道你想要什么的真實員工。

今年 1 月也有一篇海外的文章很火,叫《o1 isn’t a chat model (and that’s the point)》。

跟我是完全一樣的看法。

所以,有一個點一定要注意,明確你的目標,而不是給模型任務(wù)。

例如我們以前在寫 prompt 的時候,總是會寫你是一個 XXX,現(xiàn)在我的任務(wù)是 XXX,你要按照 1、2、3 步來給我執(zhí)行 balabala。

但是現(xiàn)在,請拋棄那些寫法。

重磅好文!8個章節(jié)帶你全方位了解DeepSeek

把你的一切,交給 AI,讓它去進行自我推理,效果會更好。AI 會自動填上那些你沒說出口的話,會給你想出可能更好的解決方案。

有一個不得不承認的事實是,我是一個很普通的普通人,而像我一樣的很多普通人們,現(xiàn)在大概率是不如 AI 博學和聰明的。

所以,不如說出你的目標,把他當作一個很牛逼的員工,讓他,放手去做。
比如這個 case。

重磅好文!8個章節(jié)帶你全方位了解DeepSeek

只需要表達你是誰+你的目標就 OK。

特別是你是誰這個背景信息,非常非常的有用。

重磅好文!8個章節(jié)帶你全方位了解DeepSeek

所以請拋棄掉一起過往所學習的結(jié)構(gòu)化框架,如果真的需要有一個萬能 Prompt 模板,那就是:

你是誰 + 背景信息 + 你的目標

背景信息給的越多越能讓 R1 理解你的需求幫助你更好的完成任務(wù)。

時刻把他當成:

這是一個能力很牛逼但不知道你想要什么的員工。

最牛逼的提示詞技巧,就是沒有技巧。

大道至簡,重劍無鋒。

所以,千言萬語匯聚成一句話就是:用人話清晰的表達出你的需求,這就夠了。

五、R1 輸出的內(nèi)容看不懂?


很多人在用“說人話”這三個字,來表達推理模型和通用模型不一樣,這其實有點奇怪。

不過從實用角度來說,這確實是一個能讓普通人看懂 AI 輸出專業(yè)內(nèi)容的小技巧。

不過這并不是一個推理模型才有的技巧,因為一直就存在,本質(zhì)上就是對方不知道你是誰,不知道你的理解能力和你的學識能力是什么水平。

所以我也想分享一個我自己這兩年跟 AI 對話時用的最多的一個小技巧,也是我自己最常用的“人話”prompt:

我是一個小學生。

當你在跟 AI 對話時,把這句話往前一擺,自降身位,你就會發(fā)現(xiàn),一切都通了,一切都能看的懂了。

比如我想讓 R1 給我解釋一下什么叫大模型中的 RL 用法。

如果不用這句話的話,就會得到這樣的解釋。

重磅好文!8個章節(jié)帶你全方位了解DeepSeek

我相信你看到一定腦殼疼。你就是不懂才需要讓它給你解釋,結(jié)果解釋了個這。

但是,如果把那個神句加上呢?

重磅好文!8個章節(jié)帶你全方位了解DeepSeek

反正我是一下子能看了,舒服了多了,可能我就真的是個小學生的水平。。。

當然如果你想稍微進階一點,就可以說,我是一個初中生,或者,我是一個高中生,一點一點的可控升級。

我用了兩年,非常好用,推薦給大家。

六、R1 的寫作很強嗎?


R1 除了能非常好的做常規(guī)推理模型都能做的數(shù)學題、代碼等等,這次有一個非常非常特別的點是:

中文寫作能力強到爆炸。

過往,大家都說,在寫作能力上幾乎所有的大模型都是眾生平等的一坨屎,唯有 Claude 超出了一坨之外,獨立于三界之上。

而這一次,DeepSeek-R1 在中文寫作和文筆上,已經(jīng)是獨一檔的領(lǐng)先了。

而且對于文風的模擬,效果極佳。

比如我非常非常喜歡知乎上一個大 V 叫大師兄朱炫的文筆。

重磅好文!8個章節(jié)帶你全方位了解DeepSeek

我甚至都不需要跟 DeepSeek-R1 說朱炫的文筆是什么樣的,直接就說一句話:

以知乎大 V 朱炫的文風,來銳評一下愛情的求而不得,告訴大家,總會有人在等你。

來給大家看看成文:

重磅好文!8個章節(jié)帶你全方位了解DeepSeek

雖然達不到朱炫那百分百的功力,達不到他那種多智而近妖的文筆,但是已經(jīng)非常非常強了。

畢竟,只需要一句話而已。

再寫一首,李煜風格的詩詞。

“以李煜的詩詞風格,來寫一首我回老家沒有朋友玩的感覺”

重磅好文!8個章節(jié)帶你全方位了解DeepSeek

《虞美人·歸鄉(xiāng)感懷》

故園舊巷行人少,空有榆錢老。

秋千院落鎖蒼苔,偶見鄰家黃犬過階來。

重游往日嬉春處,蛛網(wǎng)斜陽駐。

笑談聲遠柳風涼,唯剩一庭明月照空廊。

對仗、押韻全都到位了。

真的,非常的強。

七、R1 可以聯(lián)網(wǎng)嗎?


眾人皆知推理模型好,但是推理模型,幾乎都不聯(lián)網(wǎng)。

典型如 OpenAI o1。

重磅好文!8個章節(jié)帶你全方位了解DeepSeek

這給我?guī)砹朔浅5亩嗟睦_,要知道,OpenAI o1 的知識庫還是 24 年,很多東西都不知道,更別提一些所謂的實事了,你想用它來梳理分析一些最近的數(shù)據(jù),比如美元指數(shù)、比如最近的財報等等,它完全不知道,甚至還傳不了 PDF,就非常的 der 比。

而 DeepSeek,是為數(shù)不多的,推理+聯(lián)網(wǎng)的。

重磅好文!8個章節(jié)帶你全方位了解DeepSeek

我們來試試這句話:我想用魯迅的文風寫一篇 2000 字的公眾號文章,分析一下 2025 春節(jié)檔哪幾部電影能爆,不要結(jié)構(gòu)化。

DeepSeek 去網(wǎng)上搜了 50 個網(wǎng)頁,然后思考了半天。

重磅好文!8個章節(jié)帶你全方位了解DeepSeek

用魯迅的文風,成了一篇文。

重磅好文!8個章節(jié)帶你全方位了解DeepSeek

效果非常好。

雖然整體測下來,在聯(lián)網(wǎng)資料的 RAG 層面還有一些問題和不盡如意,但是已經(jīng)非常強了,至少,能聽懂我的話,知道我想要的是魯迅風格。

再給一些時間。

八、算力神話崩盤了嗎?


最后,我想說一下算力的問題。

昨天,A 股算力和美股算力都崩了,大家?guī)缀醵及言驓w結(jié)到 DeepSeek 很便宜,所以未來不需要那么多算力,算力神話崩塌了。

但是我覺得這個思路不太對。

在第一次工業(yè)革命的時候,有一個經(jīng)濟學里面非常著名的悖論,是由威廉·斯坦利·杰文斯提出來的,叫做 Jevons 悖論。

當時,英國的工業(yè)革命正在加速發(fā)展,蒸汽機的效率也在不斷提高。人們普遍認為,蒸汽機會越來越節(jié)能,也越來越會減少煤炭消耗。
但實際情況卻打了所有人的臉。

因為,更高效的蒸汽機降低了使用煤炭的成本,結(jié)果導致蒸汽機被更廣泛應(yīng)用,煤炭消耗總量反而大幅增加。

原因大概是這樣的:

假設(shè)新技術(shù)讓汽車的燃油效率提高了 50%(比如每加侖能跑 30 公里變成 45 公里)。照理來說,這應(yīng)該減少燃油總消耗,但現(xiàn)實可能是:

由于油耗更低,開車的成本下降,人們更愿意開車,開車里程增加。

購車門檻降低,更多人買車。

物流成本下降,商家擴大運輸量。

最終,油耗效率提高后,燃油消耗的總量可能不降反升。

跟現(xiàn)在算力邏輯是一摸一樣,如果你要把 DeepSeek 對與算力的影響帶入的話,那其實就會導致:

因為大模型需要的訓練和推理算力成本下降,反而會推動 AI 應(yīng)用和生態(tài)的繁榮,端側(cè)、個人級別大模型逐漸成熟,算力的總需求反而越來越大。

至于股市算力崩盤,我想說的是,漲多了就是原罪。

而且美元指數(shù)都崩成什么樣了,直接破了 60 日均線,納斯達克和英偉達不崩才奇怪好吧。

重磅好文!8個章節(jié)帶你全方位了解DeepSeek

只能說,DeepSeek 有短期驅(qū)動效應(yīng),但是核心還是內(nèi)身問題,DeepSeek 踩中了這個節(jié)點,天時地利人和。

此刻的 DeepSeek,就是眾望所歸的,天命人。

寫在最后


昨天,馮驥的微博說,DeepSeek 是國運。

我想說,是,也不是。

國運不是單一的點,而是一群點而連成的面。

流浪地球、新能源車、黑神話悟空、六代機、TikTok、DeepSeek 等等等等。

這些點連起來的面,才是真正的國運。

泱泱中華五千年。

無論多少風雨。

未來也必定。

國運昌隆。


作者的微信公眾號:數(shù)字生命卡茲克

聲明:站內(nèi)網(wǎng)友所發(fā)表的所有內(nèi)容及言論僅代表其本人,并不反映任何網(wǎng)站意見及觀點。

全部評論

暫無相關(guān)推薦