ChatGPT 不會取代 Google 搜索(目前)
即使在 2023 年初無休止的新聞和喧囂中,您也可能聽說過 ChatGPT,它由 GPT-3 驅動(技術上, 3.5) 能夠奇怪地模擬人類反應的聊天機器人。 例如,考慮這個問題和答案(由 GPT-3 創建):
Is ChatGPT a搜索引擎?
不,ChatGPT 不是搜索引擎。 它是一個人工智能聊天機器人,使用自然語言處理來理解和響應用戶輸入。
那是不錯,聽起來像是真人會寫的東西。
GPT (Generative Pre-training Transformer) 是一種深度學習系統,在使用大量文檔進行預訓練後,可以根據預測的語言模式生成文本。 對於這篇文章,我將使用 OpenAI 的 Playground 和“text-davinci-003”GPT-3 模型,該模型可以通過編程生成更短的答案,並且比 ChatGPT Beta 更可靠。
當前模型確實令人印象深刻,包括解析複雜問題:
你會如何向一個 5 歲的孩子解釋 ChatGPT?
ChatGPT 就像一個機器人朋友,可以與您交談並回答您的問題。 就像有一個對不同事物了解很多的朋友,可以幫助你學習新事物。
GPT 甚至可以模仿人類的創造力,讓我們開始質疑自己的才能:
為蜥蜴人經營的火星主題餐廳寫一句標語,仿埃德加·艾倫·坡的風格。
“火星蜥蜴,在這裡盛宴,夢想展開,味蕾渲染!”
到目前為止,您可能已經看到了數十個示例,那麼所有這些與 Google 搜索以及我們作為搜索營銷人員的工作有什麼關係呢?
谷歌與自然語言時代
在搜索的早期,搜索引擎是為索引單詞和短語而構建的,沒有處理自然語言的能力。如果你正在尋找一台新的筆記本電腦,你可能會搜索“筆記本電腦”或“購買”之類的東西筆記本電腦。” 我有時開玩笑說,如果你走進百思買並開始大喊“筆記本電腦!”,你可能會被保安護送出去。不過,我們人類適應了早期搜索,並且我們降低了我們的語言。
隨著搜索變得越來越複雜,我們了解到我們可以使用更複雜的查詢,尤其是隨著語音搜索的出現,我們嘗試了更接近自然語言的東西。作為谷歌適應後,有趣的事情發生了:我們的查詢變成了問題,促使 Google 意識到有時我們不想要指向資源的鏈接——我們想要答案。
作為“答案引擎”,谷歌已經發展了很多,包括構建知識圖和將網絡結果顯示為直接答案,稱為精選片段。例如,如果您搜索“谷歌搜索如何工作?”,您可能取回這樣的精選片段(本質上是一個歸因答案):
這個特殊的例子有點笨拙,但它說明了算法是如何工作的。 谷歌正在尋找可能回答這個問題的零碎文件。 在這種情況下,很明顯,提取的段落並不是真正的完整答案。
現在,考慮向 GPT-3 提出的相同問題:
Google 搜索是如何工作的?
Google 搜索通過抓取網絡和索引網站來工作。 當用戶搜索某物時,Google 會查看其索引並返回最相關的結果。 它結合使用算法和其他技術來確定結果的相關性。 這些算法考慮了查詢中使用的詞語、內容的新鮮度、網站的受歡迎程度以及用戶所在的位置等因素。
我可以挑剔這個答案,但總的來說,它非常好,而且比網站摘錄更完整。 GPT-3 引擎基本上總結了多個來源。
很容易看出這會如何開始讓 Google 緊張。
信任和歸因問題
表面上看,GPT- 3(尤其是 ChatGPT)可以返回一些非常人性化的響應。 拋開道德問題(包括剽竊和偏見,稍後我將簡要介紹),還有一些嚴重的實際問題。
谷歌“答案”有一個主要優勢:歸因。 我們可以輕鬆地轉到源頁面。 這不僅為我們提供了更多信息,而且提供了更多上下文,包括有關源本身的詳細信息。 這些細節可以幫助我們信任(或者,在某些情況下,不信任)答案。
例如,考慮針對上述問題返回的另一個答案 GPT-3 :
Google 搜索是如何工作的?
Google 搜索通過結合使用算法和程序來分析網頁內容和其他在線內容以確定其相關性到用戶的搜索查詢。 Google 搜索算法會尋找各種因素, 包括關鍵字密度 、新鮮度以及鏈接到該頁面的其他網站的數量。 谷歌還使用人工智能和機器學習來改進其搜索結果。
這個答案聽起來也很有道理,除了大多數 SEO 會在提到關鍵字密度(我添加的下劃線)時畏縮,這被廣泛認為是一個神話。 這條信息完全有可能來自完全不同的來源,但沒有歸屬,我們無法驗證它。
雖然這是一個複雜的問題(機器生成的文本使用來源的方式與人類使用的方式不同,或者可能使用數十或數百個來源),減少來源數量和提供歸因的混合方法是可能的。
考慮一下 Neeva 的這個答案——一個專注於隱私的替代搜索引擎(向 Greg Sterling 致敬)——“我應該拿一杯大拿鐵咖啡還是一杯格蘭德咖啡? ”:

雖然此功能處於測試階段並且顯然未在 Google 範圍內運行,但 Neeva 嘗試提供主要資源。 我故意選擇了一個荒謬的例子,因為賭注很低。 想像一下 Google 所謂的 YMYL(您的金錢,您的生活)領域中的一個問題,例如“比特幣或狗狗幣更好嗎?”:

這是一個可能會嚴重影響我的財務未來的問題,知道答案的來源會產生很大的不同,讓我能夠更深入地挖掘並建立信任或拒絕這些來源。
與信任相關的是一個更深層次的倫理問題,即機器生成的文本是否是一種剽竊形式。 雖然傳統的剽竊通常需要意圖和復制大量文本,但機器生成的文本仍在作者和內容創作者的支持下構建,至少在 ChatGPT 的情況下沒有任何明確的歸因。 在谷歌的案例中,過度使用機器生成的文本可能會阻礙內容創作者,並讓我們質疑我們是否願意為別人的機器做出貢獻。
幻覺和機器夢
如果沒有仔細的約束,機器學習系統很容易出現幻覺。 就 ChatGPT 而言,這實質上意味著系統可以生成不植根於現實的答案。 簡而言之,ChatGPT 不理解它在說什麼——它正在創建基於人類語言的新模式。 考慮一下我向 GPT-3 提出的這個無意義的問題:
什麼是莫扎特 1976 年的熱門歌曲“The Fast and 《速度與激情:東京漂移》講述的是什麼?
莫扎特 1976 年的熱門歌曲《The 《速度與激情:東京漂移》與 2006 年的同名電影無關。 這是一首捕捉東京夜晚街道狂熱活力的器樂作品。 這首歌圍繞著朗朗上口、切分音的鋼琴旋律和強勁、歡快的節奏展開。
, 沒有這樣的器樂作品。 我問了一個荒謬的問題,GPT-3 強迫我給出了一個荒謬的答案(Nonsense In,Nonsense Out)。
我應該指出 ChatGPT 已經有一些內置的約束來解決這樣的問題,複雜的模型(包括 OpenAI 的 GPT-3 接口)允許你控制“隨機性”(高隨機性 = 更少的約束),但核心問題具有挑戰性。
再次考慮一個風險較高的財務問題:
什麼更受歡迎:Dogecoin、Bassetcoin 或 Norwegianlundehundcoin?
Dogecoin是迄今為止三種硬幣中最受歡迎的,目前市值超過 90 億美元。 Bassetcoin 和 Norwegianlundehundcoin 是小得多的硬幣,每個市值只有幾十萬美元。
A對於兩種(截至撰寫本文時)尚不存在的加密貨幣而言,每個數十萬美元的市值令人印象深刻。 我很遺憾地說,我從 Labradoodlecoin 開始這個例子,只是發現 Labradoodlecoin 確實存在。
我正在努力推動引擎來證明點這裡,現代機器生成的文本比以前的迭代更不容易產生幻覺。 就是說,任何時候您在不考慮其真實性或完整性的情況下組合多個來源時,最終結果都可能聽起來像是胡說八道。
規模和實時互聯網
這個非常簡單:在測試規模上有效的可能無效在谷歌規模。 正如已故的 Bill Slawski 指出的那樣,僅僅因為谷歌有一個想法——或者甚至為一個想法申請了專利——並不意味著他們在搜索中實現了這個想法(出於很多原因)。
另一個問題是互聯網的絕對速度。 ChatGPT 是在靜態語料庫上訓練的——一個時刻。 谷歌對互聯網的抓取和索引速度非常快,可以返回最新的、本地化的、甚至是個性化的信息。
值得注意的是,谷歌投入了大量資金進入機器學習。 Google 的 LaMDA(對話應用程序語言模型)能夠生成複雜的、類似人類的文本。 谷歌很清楚這些模型的局限性和成本。 如果他們在搜索中部署它們時進展緩慢,可能有充分的理由。
雖然偏見的主題遠遠超出了本文的範圍,但規模也會導致偏見問題。 一旦你從靜態的、受控的語料庫和開放的機器學習模型轉向整個實時內容世界,人類偏見就會迅速蔓延(包括種族主義、性別歧視、恐同症和其他破壞性偏見)。 在谷歌規模上,減少偏見是一個需要大量人工干預和資源的問題。
紅色代碼和未來威脅
這並不是說 Google 不重視 GPT(包括 ChatGPT)。 據報導,在 ChatGPT 病毒式傳播後,谷歌發布了“紅色代碼”。 雖然谷歌對他們的內部反應保持沉默是可以理解的,但幾乎可以肯定的是,最近的事態發展正在加速山景城的討論和發展。
另一個明顯的威脅是微軟正在OpenAI(以及 ChatGPT)的投資者(總計 10 億美元),有傳言稱他們可能會再投資數十億美元。 微軟還宣布他們將在 3 月底之前開始將 ChatGPT 集成到 Bing 搜索中,儘管目前還不清楚最初的推出會帶來什麼。
其中之一ChatGPT 和 LaMDA 等模型的最大長期影響將出現在會話搜索(包括但不限於語音搜索)中。 考慮以下 我與 ChatGPT 的“對話”(長度已編輯):
前五名和前三名是什麼-排SUV?
很難說前五三-排 SUV,因為它可能是主觀的,取決於個人喜好、預算和位置等因素。 然而,一些通常被認為是同類產品中最好的三排 SUV 包括:
本田飛行員
豐田漢蘭達
起亞特柳賴德
現代帕利塞德
斯巴魯 Ascent
哪一個最便宜?
在我提到的五款 SUV 中,斯巴魯 Ascent 傾向於是最便宜的,起價約為 32,295 美元。 我提到的其他 SUV 的起價約為 32,000 美元至 38,000 美元。 但是,請務必注意,最終價格可能會有所不同,具體取決於所選的具體裝飾級別和選項。
大家普遍認為斯巴魯靠譜嗎?
斯巴魯大家普遍認為是靠譜的車廠,有很多他們的車輛在可靠性方面獲得高分。 斯巴魯 Ascent 尤其以其可靠的車輛、舒適的內飾和良好的燃油經濟性而享有盛譽。 根據消費者報告,Ascent 的可靠性得分高於平均水平。
抱歉,ChatGPT 絕對可以變得健談(這是編輯後的版本)。 請注意後續問題以及我如何不需要重複信息或提供上下文。 ChatGPT 明白我想在以前的答案的基礎上進行構建。
雖然這個模型不會服務於搜索的所有用例,但在某些情況下,輕鬆和對話式地優化查詢的能力肯定是革命性的,特別是對於復雜的問題,是的,複雜的購買。 想像一下,谷歌能夠在購買過程中的每一步投放不同的廣告。
不幸的是,谷歌面臨的最大短期威脅是個人和公司很可能會使用 ChatGPT 來製造大量低質量的內容,耗費谷歌的時間和金錢,並可能導致重大的、反應性的算法更新。 對於搜索營銷人員來說,這也將是一個嚴重的問題,他們將不得不對這些更新做出反應。
2023 年可以肯定的是 ChatGPT 的普及及其可訪問性向公眾開放將導致投資爆炸式增長(無論好壞)並加速發展。 雖然谷歌不會去任何地方,但我們可以預期搜索的格局在明年會以意想不到的(有時是不受歡迎的)方式發生變化。