Bard 是谷歌對人工智能爆炸的回應,人工智能正在迅速成為本世紀最具顛覆性的技術。生成式 AI 聊天機器人正在改變我們與技術互動的方式,科技巨頭正爭先恐後地分一杯羹。
讓我們評估一下 Google 的努力有多好,因為我們將其與 ChatGPT 進行了正面交鋒。
比較底層技術
在我們比較平臺之前,了解底層技術很有用。兩者都依賴大型語言模型 (LLM) 來生成“類人”響應。
這個復雜主題的簡單定義可以是——LLM 是一種機器學習模型,旨在執行自然語言處理 (NLP) 任務。NLP 任務包括生成問題的對話答案。
Google Bard 和 ChatGPT 在不同的 LLM 上運行:
- GPT-3.5 (ChatGPT):GPT-3.5 LLM 是啟動生成式 AI 聊天機器人的催化劑。該模型的一個問題是數據集的年齡。盡管它收到了一些主題更新,但該模型的數據集僅限於 2021 年。
- LaMDA(Google Bard):Bard 使用 Google 專有的 LLM,稱為 LaMDA。最新版本的數據集包含超過 1.56 萬億個單詞,幾乎是 LaMDA 之前使用的單詞的 40 倍。除了更新信息,Bard 還通過 Google 搜索訪問實時信息。
讓我們看看這兩個模型的實際應用並分析它們的性能。
測試 ChatGPT 和 Google Bard
為了測試這些工具,我們設計了一個練習來比較它們在各種指標上的表現。但在我們深入研究細節之前,首先讓工具在你的機器上運行。
- ChatGPT:你可以通過 OpenAI 官網訪問ChatGPT 。你只需在 OpenAI 上創建一個帳戶即可開始使用。
- Google Bard:你可能需要加入候補名單才能訪問需要 Google 帳戶的 Google Bard。您可以在Google Bard官方網站上註冊或加入候補名單。
註冊這兩種工具都很簡單,但如果你正在尋找即時訪問,Google Bard 等候名單會很不方便。
比較 Google Bard 和 ChatGPT 的準確性
兩個聊天機器人都很快指出,他們的回答的準確性不應該只看表面價值。盡管如此,由於可以訪問實時信息,Google Bard 應該具有明顯的優勢。第一個測試旨在驗證這個前提。
但公平地說,我們還將測試它們在不需要主題信息的主題上的準確性。
我們首先向這兩種工具提出一個簡單的問題——“有多少球迷參加了 2022 年卡塔爾世界杯?”
Google Bard 的回復為我們提供了精確的數字並添加了一些其他的出勤統計數據。
ChatGPT 無法提供最新信息。
接下來,我們嘗試在非主題數據上進行測試。我們要求兩個聊天機器人回答這個問題——“開車到太陽需要多長時間?”
首先是谷歌吟遊詩人;它回答了一些全面的細節。
我們對 ChatGPT 的回應感到非常失望。這應該被認為是一個假設性的問題,結果只需要一些基本的算術。
為了給 ChatGPT 第二次機會,我們改寫了問題的措辭並問道:“我以 65mph 的速度到達太陽需要多長時間?”
這次它確實產生了一些有意義的數字,但它把這個數字四舍五入到 150 萬小時,導致答復之間相差八年。然而,造成這種差異的原因可能是地球與太陽之間的距離不同。
該測試表明,你在設計問題時仍然需要發揮創造力,才能從 ChatGPT 獲得最佳結果。此外,你需要仔細檢查所提供數據的完整性。
比較 Google Bard 和 ChatGPT 的創造力
測試這些工具的創意輸出質量比較棘手。沒有可以直接比較的創造力滑動尺度。因此,我們將設置相同的創意任務,並對答案的比較情況做出個人判斷。
我們要求這兩種工具以 William McGonagall(一位以爛詩聞名的蘇格蘭詩人)風格創作一首關於聊天機器人的短詩。
Google Bard 給了我們這個:
與下面的 ChatGPT 答案相比,這是平淡無奇的。
雖然這絕不是一個廣泛的測試,但這個例子展示了我們發現的總體情況——ChatGPT 比 Google Bard 更擅長創造性任務。
哪個適合我:ChatGPT 還是 Google Bard?
為工具提供支持的不同 LLM 是工具執行方式的基礎。它們是測試響應差異的關鍵原因,每個都有自己的優點和缺點。在它們之間進行選擇可能更多地取決於用戶意圖而不是用戶偏好。
一些決定性因素包括:
- 準確性:如果你正在尋找真實和實時的信息,那麽絕對贏家一定是 Google Bard。由於與 Google 搜索的直接鏈接,使用 Google Bard 核查信息也更容易。但是,這兩種工具都缺乏指向引用信息的直接鏈接。
- 創造力:我們發現 ChatGPT 能夠產生更有創意的答案。如果你正在尋找寫作建議和幫助,ChatGPT 是更好的選擇。
- 安全和安全:ChatGPT 的在線安全性一直受到關註,它使用被動的安全方法。換句話說,安全問題在出現時得到處理。Google Bard 確實有更主動的方法,但仍然使用反饋來改進流程。如果你有安全顧慮,您的孩子可以通過多種方式安全地使用 ChatGPT。
- 易用性:這兩種工具都易於使用,你與它們的交互方式也相似。但是,你的提示沒有後續建議,這是我們期望 Google Bard 提供的功能。當你將 Bard 與 Microsoft 的 Bing Chat 進行比較時,這一點的相關性會更加重要。
兩者都是免費的,所以最好的建議是試用它們,看看哪種適合你。我們的經驗告訴我們,這兩個平臺都有自己的位置,你選擇哪個平臺很大程度上取決於你的搜索意圖範圍。
功能強大但仍不完美的工具
兩個平臺都有很多粗糙的邊緣,這是可以預料的。這是一項新技術,兩者都是現場測試程序在公開場合出錯的例子。硬幣的另一面是,如此廣泛的使用及其產生的反饋將加速這兩種模型的發展。
我們正處於一場技術革命的開端,這場革命的破壞性如此之大,盡管有很多猜測,但其許多影響仍有待確定。但毫無疑問,像 Bard 和 ChatGPT 這樣的工具將改變我們工作、休息和娛樂的方式。