農林漁牧網

您現在的位置是:首頁 > 林業

火爆全網的 ChatGPT,還幹不掉 Google 搜尋

2022-12-29由 愛範兒 發表于 林業

花的各部分有什麼功能

短短几日,OpenAI 的聊天機器人 ChatGPT 席捲了網際網路,使用者數輕而易舉突破百萬。

答疑解惑、編寫程式碼、撰寫論文、創作詩歌和鋼琴曲,當人類絞盡腦汁設下「九九八十一難」,ChatGPT 基本問什麼答什麼,就算不會也能編得像模像樣。

到目前為止,在推向大眾的文字生成 AI 裡,ChatGPT 是最好的那一個,更何況還免費使用。

當 ChatGPT 春風得意馬蹄疾,也有人看到它光環下的失意,程式設計師和文字工作者的飯碗可能不保,連 Google 等傳統搜尋引擎也可能被它革了命。

有了搜尋引擎,我們依然需要花大量時間翻網頁找答案,如果 AI 能直接把答案遞到你眼前,還能保證正確率,那豈不是更好?

但問題就在於「如果」。

ChatGPT:我無法與 Google 相比

12 月 1 日,開發人員 Josh Kelly 曬出同一個程式碼問題在 Google 和 ChatGPT 的不同結果,ChatGPT 的答案看起來質量更高,讓他感嘆「Google is done」(Google 完蛋了)。

初出茅廬的 ChatGPT,真的把刀架在 Google 搜尋的脖子上了嗎?

先看看兩者在定義上的區別。

搜尋引擎的核心是海量資訊集合,而非資訊創造。你在搜尋框輸入關鍵字,搜尋引擎根據演算法,抓取、索引、排序與你的查詢匹配的結果,然後你看到了大量的連結,再從中尋找自己需要的資訊。

火爆全網的 ChatGPT,還幹不掉 Google 搜尋

而 ChatGPT 屬於 AIGC(人工智慧生產內容),是一種新的內容創作方式。它已經被資料集訓練完畢,透過一對一的對話和類似人類的口吻,給出單一、即時的答案,還能結合上下文,實現多輪對話,幫你解決更為複雜的、連續性的問題。

你可以一步步引導規則,讓它設計遊戲等產品,或者給它一段程式,讓它檢查 bug,還可以給它演示案例,讓它舉一反三。互動越複雜,ChatGPT 的能力也會越豐富,只當一個回合的搜尋引擎用,倒有些「屈才」。

火爆全網的 ChatGPT,還幹不掉 Google 搜尋

比傳統的聊天機器人更聰明,比人類的問答網站更快捷,ChatGPT 讓查詢資訊的過程更加直觀和簡單。

一個是生成式搜尋,一個是大規模搜尋,目前的 ChatGPT 還遠遠取代不了 Google。

在 ChatGPT 的基礎設定裡,資訊的時效性已經落後了。ChatGPT 基於網際網路的數十億個文字示例訓練,學習生涯停留在了 2021 年,它也沒有聯網,不實時呼叫外部網路資源,無法像 Google 地圖般根據位置為你推薦餐館,不能幫你開啟 Twitter、Facebook。

相比之下,Google 既有龐大的索引網站資料庫,也提供影象、地圖等功能和工具,讓你快速訪問其他網站更是它的「基本素養」。事實上,Google 最受歡迎的搜尋就是「Facebook」「亞馬遜」等關鍵詞。

火爆全網的 ChatGPT,還幹不掉 Google 搜尋

不過,ChatGPT 被吐槽最多的還是它的準確性,列對了雞兔同籠方程卻解錯,硬說豆瓣的創始人不是阿北,腦洞大開胡編亂造西遊記結局,一本正經地胡說八道就罷了,偏偏語氣十分自信,也不提供資料來源。你使用搜索引擎時,至少可以憑藉多個信源交叉驗證。

12 月 4 日,馬斯克透露 ChatGPT 可以訪問 Twitter 資料庫,這意味著 ChatGPT 必然學習了許多缺少事實核查的資料。正因為垃圾答案氾濫,程式設計師問答網站 Stack Overflow 從 12 月 5 日開始,暫時禁止使用者分享 ChatGPT 生成的內容。

火爆全網的 ChatGPT,還幹不掉 Google 搜尋

另外,ChatGPT 的回答混入了不少片湯話,被調侃為「水文神器」。OpenAI 解釋,這主要是因為訓練資料偏差(訓練者更喜歡看起來更全面的、更長的答案)和過度最佳化。

種種不足擺在檯面上,ChatGPT 暫時不會威脅到搜尋引擎。

火爆全網的 ChatGPT,還幹不掉 Google 搜尋

▲《2001 太空漫遊》的 AI 殺人事件。

雖然 ChatGPT 比其他 AI 更像人了,本質上還是「隨機鸚鵡」,離不開大模型、大資料、大算力,它的知識來自訓練資料中的統計規律,並不理解自己所說的話。12 月 5 日,《時代》雜誌「專訪」了 ChatGPT,在被問到「大型語言模型有哪些限制」時,ChatGPT 回答道:

大型語言模型的一個限制是,我們無法理解我們生成的單詞的上下文或含義。我們只能根據給定的訓練資料,根據某些單詞或單詞序列一起出現的機率來生成文字。

這意味著我們無法為我們的回答提供解釋或推理,並且我們可能不會總是生成完全連貫或在對話上下文中有意義的回答。

但 ChatGPT 迴避了一個問題:什麼是理解?「理解」是屬於人類的概念,它能否用在 ChatGPT?如果能用,它的理解是否約等於「生成有意義的回答」這個結果,論跡不論心?

火爆全網的 ChatGPT,還幹不掉 Google 搜尋

至少在未來一段時間內,我們或許更需要擔心,當越來越多的網路內容由類似的模型生成,搜尋引擎給出的結果,質量是會提高還是降低。

我還問了問 ChatGPT 本尊,它的態度十分謙虛,不覺得應該拿它和 Google 比較:

我是一個大型語言模型,無法與 Google 或任何其他搜尋引擎進行比較。我的目的是透過回答使用者的提問來幫助使用者獲得資訊,而不是提供搜尋功能。與搜尋引擎相比,我的優勢在於能夠回答複雜的問題,並且可以提供更加個性化和詳細的資訊。相比之下,我的劣勢在於無法提供搜尋功能,也無法提供最新的資訊。

AI 可能是搜尋引擎的未來

雖然 ChatGPT 仍在起步,沒有在搜尋上比 Google 做得更好,但它可能改變我們線上搜尋資訊的方式,讓搜尋技術更上一層樓。

眼下就有一個簡單的例子,現在已經有大量將 ChatGPT 嵌入 Google 的外掛出現,其中有些外掛將 ChatGPT 的結果顯示在網頁右側,一次搜尋兼顧兩種體驗。

再參照 ChatGPT 和影象生成模型 Stable Diffusion 的聯動(可能是因為 AI 更懂 AI,ChatGPT 的描述更容易被 Stable Diffusion 提取,最終的圖片質量更高),ChatGPT 或許也可以用於解釋、指導關鍵詞,幫助我們更好地用搜索引擎查詢資訊。

火爆全網的 ChatGPT,還幹不掉 Google 搜尋

此外,ChatGPT 的時效性、準確性不足,也並非是無解的。

一方面,知乎答主、自然語言處理專家@張俊林指出,近乎實時地將新知識融入大規模語言模型,非常有挑戰性,一種解決辦法是,把它存到傳統搜尋引擎的索引裡,ChatGPT 如果回答不了時效性的問題,可以轉向搜尋引擎抽取對應的答案。

另一方面,彭博社報道,OpenAI 正在開發一個名為 WebGPT 的 AI 系統,WebGPT 將能夠更準確地回答問題,甚至還能說明引用的來源。

火爆全網的 ChatGPT,還幹不掉 Google 搜尋

以上這些還是 AI 和搜尋引擎的結合體。如果我們更大膽地設想一番,不考慮技術限制,拋去搜索引擎,存在一個無所不知的 AI,以易於理解的問答形式,提供與問題相關且準確的資訊,這是未來搜尋的理想模樣嗎?

不少 AI 專家認為願景本身就有問題。德國魏瑪包豪斯大學研究員 Benno Stein 指出,它可能隱藏現實世界的複雜性:

問題不在於現有技術的侷限性。即使擁有完美的技術,我們也無法得到完美的答案。我們不知道什麼是好的答案,因為世界很複雜,但當我們看到這些直接的答案時,我們會停止思考。

那麼如何讓答案顯得更「複雜」?有人覺得,簡單地提供一份檔案清單,會比直接給出答案更有用;有人則建議,可以解釋答案並給出不同觀點的利弊,讓人既知其然也知其所以然。

火爆全網的 ChatGPT,還幹不掉 Google 搜尋

▲ 圖片來自:Getty Images

但是大多數時候,本不存在真正的完美的答案,準確、詳細這些衡量標準,也更針對事實類、知識類問題,而非那些天馬行空的開放式命題。

以答案的準確或者詳細與否框定 AI,反而有些「著相」。不妨讓我們回到上文提到的定位問題,ChatGPT 是生成式搜尋,Google 是大規模搜尋,前者是 chat,後者是 search,它們在本質上就是不同的。

ChatGPT 火了一段時間了,我們對它有了一個大概的共識:它的錯誤答案不少,特別在知識類和事實類問題上,但如果把它放在創作的一個環節,可以用來激發靈感、提高生產力。

火爆全網的 ChatGPT,還幹不掉 Google 搜尋

它不是搜尋引擎,也不像聊天機器人,更像一個隨時供你諮詢的「超級大腦」。換句話說,ChatGPT 不一定會顛覆 Google,但它從根本上改變了我們和知識的相處形式,你可以和它談星星談月亮,從詩詞歌賦說到人生哲學。

ChatGPT 對創造力、開闊思維的激發,可能比事實類資訊的準確性更加重要,它完全可以和搜尋引擎、人類勞動互相補充,不必你死我活,各自完成通向未知的一塊拼圖,這也是我們對「搜尋」的根本需要。

搜尋引擎不僅僅是個問答機器

自 ChatGPT 橫空出世,不乏 Google 搜尋將被取代的聲音。

其實 Google 並沒有掉隊,它在 DeepMind 的大型語言模型 Chinchilla 上訓練 AI 聊天機器人 Sparrow,也開發了對話神經語言模型 LaMDA。

去年 5 月,Google 研究人員發了一篇題為「重新思考搜尋」的論文,描述了一種新型搜尋引擎,大型語言模型藉助演算法提供簡潔的專業答案,使用者無需在大量網頁列表中搜索資訊,聽起來就是 ChatGPT 的模樣。

火爆全網的 ChatGPT,還幹不掉 Google 搜尋

為什麼 Google 沒有像 OpenAI 一樣,直接向大眾推出類似 ChatGPT 的產品,或者將它整合在自己的搜尋之中?Alphabet 工程師@hncel 認為,問題主要在於成本和延遲:

像 GPT 這樣的大型語言模型是 Google 主要研究的領域之一,Google 有大量預算與人員來處理這些模型,但在最大的 Google 產品(例如搜尋、Gmail)中實際使用這些語言模型的經濟性還不完全存在。

釋出有趣的測試版是一回事,但將它深入整合到一個每天服務數十億個請求的系統中,考慮到服務的成本、增加的延遲,則是另一回事。將成本降低至少 10 倍,才能將這樣的模型整合到搜尋等產品中。

與此同時,大型語言模型也會影響 Google 搜尋當前的商業模式——Google 母公司 Alphabet 2021 年收入 2576 億美元,約有 81% 來自廣告,其中大部分是 Google 的按點選付費廣告。

像 ChatGPT 這樣的 AI 大大減少了頁面數量,阻礙了人們瀏覽和點選更多廣告,那麼廣告收入也會隨之下降。

火爆全網的 ChatGPT,還幹不掉 Google 搜尋

話說回來,ChatGPT 的爆火,也讓我們或多或少地意識到,搜尋引擎「索引、檢索和排序」的固有模式已經統治了 20 多年,Google 每年都會對搜尋引擎進行數千次更改,其中大多數都很微小,並沒有發生根本性的變化。

1998 年,一對斯坦福大學的研究生髮表了一篇關於新型搜尋引擎的論文:

在這篇論文中,我們介紹了 Google,這是一種大規模搜尋引擎的原型,它大量使用了超文字中的結構。Google 有效地抓取和索引網路,併產生比現有系統更令人滿意的搜尋結果。

過去的創新變成了現在的傳統,Google 等傳統搜尋引擎面臨的對手不止是未來的 AI。

比如,已經有人將 TikTok 稱作「新的 Google」,國外網友使用 TikTok 搜尋,有點像我們在小紅書查詢攻略,在美食、片單等領域確實好用。這背後隱藏著一個趨勢:在 TikTok 和抖音「稱霸」的世界裡,網際網路比以前更直觀、更視覺化、更具互動性,搜尋也不例外。

火爆全網的 ChatGPT,還幹不掉 Google 搜尋

但 TikTok 不至於真的動搖 Google。如果查詢更多資訊、訪問更多網站,你依然要回到 Google。

既然變化已經發生,Google 也需要透過更自然、更直觀的方式,帶來更好的搜尋體驗。

近幾年來,因為人工智慧、機器學習和計算機視覺等方面的進步,Google 一直向這個方向轉變,包括引入相機和麥克風搜尋、圖片和文字的多重搜尋、地圖中的沉浸式檢視等等。

簡單來說,Google 搜尋的輸入和輸出,都變得更加「多感官」,也變得更加主動,更能猜中使用者的心思。

火爆全網的 ChatGPT,還幹不掉 Google 搜尋

▲ 機器學習模型 MUM 讓 Google 搜尋引擎更「聰明」。

Google 許多與搜尋有關的專案仍在探索和測試階段,今年 9 月的年度 Search On 活動上,負責 Google 搜尋產品的副總裁 Liz Reid 舉了一個未來可能的例子:

如果 Google 知道你對木工感興趣,它在回答你搜索的某個問題之外,還會向你展示你不知道的新工具、你從未聽說過的 YouTube 博主,以及你可以去哪裡學習新技能等等。

Liz Reid 相信,Google 搜尋不僅僅是一個反應快速的問答機器,而是一個用於探索、發現、學習你還沒有明確答案的事物的系統。

火爆全網的 ChatGPT,還幹不掉 Google 搜尋

某種程度上,迭代的搜尋引擎也好,進擊的通用 AI 模型也罷,一個是固有框架的微調,一個是另起爐灶的改革,它們都在讓知識更容易被獲取,讓資訊篩選更加智慧,降低你的學習門檻,縮短你的學習過程。

Google 高階副總裁 Prabhakar Raghavan 提出了一個很有意思的觀點,搜尋還是一個遠沒有解決的問題,「如果你把所有的機器都給我,我仍然會被人類的好奇心和認知所束縛」。

搜尋得到更好的答案之前,我們要先知道如何提出問題。未來,組織資料的能力可能不再稀缺,基於個體經驗和情感的提問能力和原創觀點更為珍貴。當你被引到知識的大門前,人之為人的思辨性和創造力,則以前所未有的地位被凸顯出來。