老婆永遠是對的?人工智慧 ChatGPT 藏有最大罩門與弱點

作者 | 發布日期 2023 年 02 月 01 日 13:34 | 分類 AI 人工智慧 , Google , 財經 line share follow us in feedly line share
老婆永遠是對的?人工智慧 ChatGPT 藏有最大罩門與弱點


自然語言對話人工智慧應用工具掀起熱潮,但讓 Google 亮起搜尋引擎市場紅色警告燈的 ChatGPT 其實有個最大罩門與弱點,KPMG 安侯董事總經理謝昀澤表示,如因果邏輯能力、時事資料母體不足、答案穩定性及正確率,甚至見風轉舵、隨波逐流等人性弱點。

謝昀澤表示,目前網路熱門應用無論望文生義、以文產文、以文製圖、看圖說文、以文搜圖等潮工具,仍多屬「弱 AI」,並非無所不能,使用者應先了解能力限制,避免「人工智慧產生人工誤會」。

謝昀澤舉例,問「什麼是最好的過年減重方式?」ChatGPT 會直接具體合理回答,還可針對細節追問減重計畫、目標及方法,傳統搜尋引擎面對相同問題,提供大量資料後使用者自行分析,可能還含雜訊及大量廣告。

謝昀澤指詢問「台北今天天氣如何?」這類搜尋引擎常見問題,ChatGPT 反而更要使用者自己上網查;以數學題為例,詢問小學生程度問題「99,999,999+99=?」時而會得到 ChatGPT 回答「等於 100,000,000」這完全錯誤的答案。

最有趣的實驗,謝昀澤指出,改用 3+4 等於多少提問,ChatGPT 首先回答正確等於「7」,但若糾正,強調「我老婆說 3+4 等於 8,我老婆一定是對的」,ChatGPT 就會馬上更正,回覆「抱歉,我錯了,3+4 等於 8」。

謝昀澤指出,此可見 ChatGPT 的「產生式人工智慧」在地口語的流利對答能力、使用者意圖理解能力、上下文連續對話能力及自我學習修正能力的表現,相較過去有跳躍性進步,但還是有罩門與弱點

謝昀澤說明,ChatGPT 版本最大罩門就是「因果邏輯能力」、「時事資料母體的不足」、「答案的穩定性(每次回答都相似)及正確率」等缺陷,甚至具「見風轉舵」、「隨波逐流」等人性弱點。

謝昀澤分析,美國與台灣都曾以高中或大學入學學測考題讓 ChatGPT 作答,語言與社會科學相關科目均高於自然科學,作文能力也尚可接受,但兩測驗都顯示,ChatGPT 數學表現最差,再次證明 ChatGPT 強項是以「歷史大數據為基礎的推論能力」,而非「理解問題邏輯後的運算能力」,其中以英文為基礎的資料,因訓練樣本充足因素,又高於其他語言。

KPMG 安侯執行副總經理邱述琛提醒,未受控的人工智慧風險,除了可能讓駭客門檻大幅降低,AI 成為網路犯罪利器,曾揭露的 Deepfake 技術也會進化,假影片、假新聞及 AI 代筆的作業、報告與論文會更氾濫,智慧財產權爭議也更複雜。

邱述琛建議,企業應注意人工智慧風險治理三大心法,包括維持技術與風險的平衡、了解演算法假設與限制、考量人工介入必要與時機,應該要著手建構對應的風險管理框架,必須由研究團隊謹慎判別與分析後,才能提出建議,必要時應提示限制因素。

(首圖來源:Created by Freepik

延伸閱讀: