
谷歌 Bard“史上最大更新”!終於會説會讀圖,支持中文等 40 多種語言

Bard 打贏監管阻攔,成功進軍歐盟市場,並新增讀圖、調整答案語氣和風格等新功能。華爾街見聞搶先使用的感受如下:暫時無法解讀人像圖片,還讀不懂人類的圖片諷刺語氣,中文讀詩 AI 腔太濃不夠驚豔。
7 月 13 日週四,谷歌發佈了旗下與 ChatGPT 正面打擂台的人工智能聊天機器人 Bard 最新進展,並稱之為 “Bard 工具迄今為止最大規模的擴張”。
谷歌 A 週四午盤後漲幅擴大至 4.4%,至一個月最高。生成式 AI 競爭對手微軟也漲超 1%。

Bard打贏監管阻攔進軍歐盟市場,新增讀圖、調整答案語氣和風格等 “硬實力”
官方博文稱 Bard 已可以支持 40 多種語言,包括阿拉伯語、中文、德語、印地語和西班牙語。用户可在巴西和整個歐洲進行訪問,即使用場景拓展到全球更多地區,特別是重要的歐盟市場。

同時,用户可以獲得更多定製化、個性化的 AI 回覆。
例如,Bard 可以將回答用語音讀出來了,這一功能已支持 40 多種語言。谷歌相關負責人稱,“這對想聽聽單詞的正確發音,或者聽一首詩歌或劇本被朗誦出來等格外有用”。
用户還可以調整 AI 回覆的語氣和風格,目前分成五個選項,即簡單、長、短、專業或休閒。該功能僅限英語使用,但將很快拓展到新的語言。
此外,Bard 還推出了四個 “增進用户生產力” 的新功能,包括在網頁左側固定(pin)和重命名此前的對話記錄,方便隨時重新訪問;將 Bard 撰寫的 Python 代碼導出到 Google Colab 和 Replit 等軟件開發工具中;提供可分享的鏈接,方便用户與他人分享部分或全部與 AI 工具的聊天內容,這三種功能均已支持 40 多種語言。

更引人注目的是,Bard新增了讀圖功能,可在用户提問框中上傳圖像,要求 AI 聊天機器人解讀圖像、提供更多畫面信息,以及根據圖像撰寫標題。這一功能目前僅限英語使用,未來將很快拓展到更多新語言中。5 月谷歌的 I/O 年度開發者大會上,曾宣佈把 Google Lens 的功能引入 Bard。

谷歌還在官方博文中給出了一段疑似 AI 撰寫的 “雞湯文字”,稱:“好奇心和想象力是人類創造力背後的驅動力……想象新可能性的能力也是人類與生俱來的人類品質之一。這就是我們創建 Bard 的原因:幫助您探索好奇心,增強想象力,並最終將想法付諸實踐,而不僅僅是回答您的問題。有鑑於此,Bard 現在可以在世界大部分地區使用且能理解最廣泛使用的語言。”
有分析稱,Bard 的最新改進正值谷歌試圖在白熱化的生成式人工智能領域保持領先地位,以在來自微軟支持的 OpenAI、Anthropic 和其他公司的快速、激烈競爭中脱穎而出。
而在一個月前,谷歌還因歐盟《通用數據保護條例》(GDPR)背後的歐洲主要數據監管機構——愛爾蘭數據保護委員會的阻攔而無法如期在歐盟推出 Bard。
當時該監管機構的反對理由是,這家科技巨頭沒有就如何尊重歐盟數據隱私規則提供足夠的信息。谷歌今日在 Bard 拓展到歐盟後稱,將 “大膽而負責任的開發人工智能”,主動與專家、政策制定者和隱私監管機構進行接洽,未來會將 Bard 引入更多的地區和語言,並聆聽公眾反饋。
見聞使用感受:還讀不懂人類諷刺圖片,中文讀詩 AI腔太濃不夠驚豔
上述新功能聽起來天花亂墜,實際使用效果究竟如何?針對普通受眾最關心的 “聽説讀寫” 功能,華爾街見聞也對 Bard 做了如下測試,簡單來説,新功能使用起來似乎暫時算是 “馬馬虎虎”。
首先,華爾街見聞詢問了 Bard 如何解讀週三馬斯克宣佈成立新公司 xAI 後,網友嘲笑 Meta 的小扎將挖牆腳抄襲的圖片,這顯然是諷刺 Meta 的 Threads 抄襲了馬斯克的推特。

Bard 反應了一會兒後,給出的回答很簡單:“不好意思,我當前還不能解讀有關人物的畫面。”並在給出回答的同時刪除了提問對話框中的圖像本身。

接着,華爾街見聞詢問如何解讀昨日另一熱門網圖,即 xAI 掀起的颶風正在摧毀一座標有 ChatGPT 字樣的房子,“自然人智能” 都可以理解這是一副諷刺漫畫,形容 ChatGPT 在 xAI 面前不堪一擊。
Bard 一開始只是簡單描述了畫面中有的物體:房子正在被颶風摧毀,並描述了颶風的特性,以及房子已經搖搖欲墜的畫面感。但結論卻是:“該圖像有力地提醒人們龍捲風的破壞力,它還提醒人們為惡劣天氣事件做好準備的重要性。” 可見並不是一個令人滿意的答覆。

華爾街見聞緊跟着詢問為何畫面上出現了 X.AI 和 ChatGPT 的字樣,Bard 回覆稱,這是因為兩者都是能產生文本的大語言模型 LLM,解釋了一下 LLM 的定義,並認為 “該圖像旨在隱喻 LLM 的破壞力就像龍捲風一樣,可以做善事也能作惡”,還稱 “圖片上的 X.AI 和 ChatGPT 的標誌提醒我們 LLM 是強大的工具,應該負責任地使用,需要確保它們不會被用來造成傷害。”
是熟悉的 AI 聊天雞湯味兒了。

如果詢問給圖片配上標題,Bard 給出了 “LLM 的力量”、“LLM 的危險性” 和 “LLM 的未來” 等驢唇不對馬嘴的內容,很顯然,人類的毒舌諷刺實力,AI 機器人還未能很好地貫徹領會。
華爾街見聞玩心漸起,又上傳了一張北極熊捂臉的圖片讓 Bard 解讀。見聞老讀者們都知道,美股熊市之際這張圖片會屢屢出現在媒體中。
如果只是簡單詢問 “圖片講了什麼”,Bard 給出的答覆也非常中規中矩,但點明熊的動作和麪部表情説明它要麼是悲傷、要麼是恐懼、要麼是專注,可能是感到孤獨或者害怕,總之是感情強烈。

如果具體詢問北極熊與股市的關係,Bard 的回覆便靠譜多了,準確地答出 “是熊市隱喻,作為空頭對股市悲觀情緒的象徵”。還稱圖片也可以被看作是對股市投資風險的提醒。

要求它給出的標題也恰如其分,例如:“股市看跌的時候,連北極熊都捂着臉”;“熊市即將來臨,北極熊已經做好了準備”;“當股市崩盤時,就是冬眠的時候了”,屬實非常優秀。

華爾街見聞也詢問了鴿子圖像與美聯儲之間的關係。Bard 一開始顯然在 “AI 式扯淡”,稱 “它與美聯儲的聯繫是明確的:鴿子代表美聯儲的獨立性、對和平的承諾以及對未來的希望。”

如果具體詢問鴿子與美聯儲貨幣政策有何關係時,Bard 顯然在嘗試理解 “隱喻/比喻”(metaphor)這個概念,但給出的不是 “鴿派聯儲” 這種標準回答,而是稱 “它與美聯儲貨幣政策的聯繫是顯而易見的:鴿子代表了美聯儲即使面對不確定性也保持經濟步入正軌的決心。”

好吧,Bard 讀圖能力看上去還不能令人眼前一亮,畢竟人像解讀功能還沒有上線,對畫面中諷刺和隱喻的理解也不夠到位,那麼 Bard“用語音讀出回覆” 的新功能如何呢?
華爾街見聞輸入了李白《靜夜思》的中文文字,首先要求 Bard 根據這首詩給出相關圖片,但被告知只能給出圖片的文字描述版,“對不起,我沒有生成圖片的功能。我只能生成文本。”

隨後華爾街見聞點擊答案框的右上角 “小喇叭” 標誌要求 Bard 進行朗讀,讀出來的統統都是 AI 味兒,不論如何詢問 “請用深情朗讀”、“換成男聲朗讀” 等具體要求,Bard 都表示 “臣妾做不到”。
若朗讀莎士比亞的英文劇本,倒是比較純正的美式發音,可見中文的進步空間還有不少!
