晶圓代工、IC 設計龍頭都是客戶!碩網資訊銜接 ChatGPT 落地企業應用

作者 | 發布日期 2023 年 03 月 27 日 8:00 | 分類 AI 人工智慧 , 公司治理 , 數位內容 line share follow us in feedly line share
晶圓代工、IC 設計龍頭都是客戶!碩網資訊銜接 ChatGPT 落地企業應用


全球掀起生成式 AI 風潮,科技大廠展開聊天機器人大戰,微軟有 ChatGPT、Google 有 Bard、百度有文心一言,但是要實際落地到企業端的應用,仍有最後一哩路的整合工作需要合作夥伴來完成,威盛集團旗下的碩網資訊(Intumit)正是扮演這個關鍵輔助的角色,為數十家金融業客戶導入 AI 客服對話機器人,更為晶圓代工、IC 設計龍頭運用對話式 AI 技術,協助人資管理世界各國的員工。

ChatGPT 背後兩大技術

由 OpenAI 開發的 ChatGPT 掀起熱潮,碩網資訊總經理邱仁鈿分享,ChatGPT 這類大型語言模型(LLM) 背後有兩大支撐,一個是巨量文字資料,目前全世界有能力可以累積足夠巨量資料的屈指可數,不外乎谷歌、微軟、Meta 等,另一重要的支撐就是算力的提升,運用 GPU(圖形處理器),ChatGPT 就是透過巨量資料和算力結合所衍生出具有非常龐大參數的語言模型。

以生成型 AI 做為出發點,邱仁鈿指出,雖然現在的模型看起來像在對話,但其實是 AI 根據輸入的問題當作指令,創作出可以理解的文章、照片、影像,甚至可以寫成故事、新聞、小說,完全沒有任何限制,而這樣的生成式 AI,隨著模型越來越大,算力越來越快,未來想像空間無窮。

邱仁鈿表示,相較之下,過去傳統的 AI 聊天機器人是從資料庫挑出既有的答案,主要是比對型的 AI 應用,而 ChatGPT 是生成型,所以 ChatGPT 需要寫作時間,導致反應速度沒有比對型快,而從資料量的參數基礎來說,ChatGPT 的參數量已經龐大到超過 BERT 的好幾百倍,因為參數量越大,理解能力越強,但是背後需要付出的代價,便是訓練模型的成本遠比 BERT 要高。

碩網銜接 ChatGPT 落地應用

邱仁鈿指出,碩網自 1999 年成立,專注在對話式 AI 的自然語言處理,初期發展具備以文找文、自動分類等簡單 AI 功能的知識管理系統,累計超過 600 家客戶,遍布台灣、中國、日本,並從 2015 年開始切入 AI 聊天機器人的企業應用,從早期以模糊搜尋的 AI 聊天機器人,逐步演進到具備機器學習、深度學習,一路到近年開始利用大數據模型,為企業客戶打造最先進的對話式 AI 應用。

ChatGPT 的爆紅讓越來越多企業客戶詢問落地應用,邱仁鈿表示,碩網其實早在 2017 年就開始積極進入國際大廠的生態體系,成為科技大廠微軟、谷歌的合作夥伴,扮演先進對話式 AI 具體落地的輔助角色,舉例來說,碩網就為晶圓代工龍頭導入企業內部應用的 AI 聊天機器人,整合人資管理系統,當員工針對特休、育嬰假、旅遊補助等發問, AI 聊天機器人就會從內部規章來挑出答案回應。

邱仁鈿指出,碩網企業應用 AI 聊天機器人,客戶廣泛涵蓋到科技業、製造業、金融業、零售業、公部門,舉例來說,剛開始應用在金融業,主要是提供消費者針對信用卡回饋、機場停車、身分核對、帳戶餘額、刷卡紀錄做回應,並分析消費者特性,進行下一步的互動,像是消費者問到日圓兌換,AI 聊天機器人就可以推薦出國需要的旅平險,為金融業創造更大的價值。

生成式 AI 多元應用

生成式 AI 多元應用從 AI 聊天機器人到生成式 AI,碩網資訊發言人晏毓聰表示,碩網從 2015 年開始幫客戶開發對話式 AI 機器人,起初必須耗費大量人工建立訓練資料,才能讓對話機器人能夠有聰明的大腦可以回應用戶的需求,後來碩網在 2020 年開始運用 Google 釋出的 BERT 預訓練模型,透過移轉式學習逐漸降低人工訓練的時間,並持續提升對話式 AI 的服務品質與正確性。

晏毓聰指出,現在透過生成式 AI,可以依照適當的提示指令(Prompt)生成大量資料,以前可能一個問題有 20 種問法,後來 BERT 只要 10 種,再到 ChatGPT,只要輸入的提示指令下得好,就可以讓 ChatGPT 為訓練人員自動生成各種問法,降低企業導入 AI 聊天機器人的時間與成本。

晏毓聰分享,原本的聊天機器人訓練要半年到一年,現在只要一到三個月,預估未來 ChatGPT 更是只要一個月,而且 ChatGPT 同樣一個答案,可以生成很多不同的描述方式,像是針對 20~30 歲年輕族群的活潑生動語調,或是面對 65 歲以上長者的嚴謹口吻,針對客戶進行屬性區隔,甚至未來可望增加對話溫度,以及更人性化的體驗。

ChatGPT 最大挑戰

ChatGPT 主要是透過大型語言模型(LLM)開發而成,晏毓聰表示,其實早在 2019 年就有很多研究論文探討,過去 AI 是從無到有,累積資料來訓練模型,但是要做到生成式 AI 必須要有大型的資料和財力來訓練模型,並非所有企業都有能力來建置。

晏毓聰指出,數年前 Google 所釋出 BERT 的模型,還能讓一般企業自行運用來做語意學習,進行個別企業所需的模型訓練,而碩網資訊就是從 2020 年開始結合 BERT 的預訓練模型,為企業導 AI 資料做移轉式學習的落地應用,就可以透過相對較小的資料量達到理想的效果。

ChatGPT 現在最大的問題就是錯誤率,晏毓聰表示,如果企業直接把生成的答案回覆給客戶會有相當高的風險,因為 ChatGPT 所生成的文字內容雖然乍看之下邏輯清楚,但是仔細分析其內容正確性往往有待商榷,甚至出現虛構的內容,但是企業不能承擔回答錯誤的風險,所以碩網提供的企業對話式 AI 平台,具備透過人工挑選的機制來做最後把關,留下適合的內容提供給終端客戶,確保答案的內容無誤,並做好引導式的提示工程,協助 ChatGPT 產出有效的回答。

ChatGPT 未來應用

談到生成式 AI 未來應用,邱仁鈿表示,現在不僅可以轉換成活潑答案、嚴肅答案,甚至可以做到分類、標註,透過對話內容尋找潛在的需求,像是從客戶的提問,判斷年齡、性別、婚姻、投資需求等等,匯到 CRM(客戶管理系統)分析,相信未來有 ChatGPT 的輔助,可以將個人化服務做得更細緻,讓終端消費客戶能夠更具溫度的互動體驗。 

邱仁鈿分享,其實生成式 AI 除文字、語音、影像外,還能寫程式語言,目前團隊已經有資深工程師藉此提高工作效率,只要輸入指示就能生成程式語言,但是這需要有經驗的工程師,因為 ChatGPT 存在錯誤率,所以仍需要一定的經驗調整,才能作為實際開發系統之用,相信善用生成型 AI 來輔助程式撰寫,未來可能會成為每為工程師都需要具備的基礎技能之一。

邱仁鈿強調,碩網資訊身在 AI 的浪潮之中,以自然語言 AI 應用為主,未來可能有機會結合影像,像是下半年就將與專門做 AR/VR 的廠商合作,希望讓虛擬助理不再是小圖標,而是虛擬真人影像,並相信未來 ChatGPT 的應用有無限可能。

(首圖來源:科技新報)

延伸閱讀: