AI 如何為公司創造更多價值?專家:2 個缺陷,要先由人類來修補
2021/05/13
採訪‧撰文
盧廷羲
張凱崴
美國人工智慧國家安全委員會(NSCAI)今年 4 月建議,國防部每年應至少分配 3.4% 的預算投入科技領域,並提撥 80 億美元研發 AI。企業方面,微軟(Microsoft)4 月宣布,將以 197 億美元收購語音辨識開發商紐安斯通訊(Nuance Communications);後者是雲端與 AI 軟體的先驅。
從企業到國家,都愈來愈重視人工智慧,知道要想辦法運用 AI 創造更好的生活。不過,目前 AI 發展到底處於什麼階段?我們又該如何應用?
美國加州大學洛杉磯分校(UCLA)電腦科學系助理教授張凱崴形容,目前人工智慧技術已經可以幫助人類完成很多事,像是疫情來襲,電腦可以從大數據中篩選條件,自動搜尋、判讀潛在病例,幫助醫生大幅減少檢查時間,但 AI 也並非萬能,要先認知它的局限。他研究如何讓 AI 更符合人性,獲得 2021 年的史隆研究獎(Sloan Research Fellowships)。
AI 局限1. 資料寬廣度不足時,就會複製人類偏見
張凱崴認為,電腦在學習的時候,是依賴「彙整數據資料」來判斷,並沒有真正思考,如果資料來源太狹隘、不夠多元,資料寬廣度不足,電腦判斷就會出現偏差,「你跟電腦講清楚 input(輸入)、output(輸出),提供足夠的數據資料,它可以對應、學得很好,但還有很多面向 AI 做不到。」
舉例來說,亞馬遜(Amazon)2014 年推出智慧音箱(Amazon Echo),使用者口頭下指令給語音助理 Alexa 就能放音樂、查資訊。然而,有些人口音較罕見,或是用字較特殊,智慧音箱的資料庫沒有「不同口音」「不同用詞」的檔案,就可能失靈,這是當前 AI 的其中一大問題。
張凱崴進一步解釋,AI 另一項挑戰是,它無法清楚分辨「不曾出現」與「不能出現」(無法出現)之間的區別,只是從資料統計出要學的東西,無法像人類一樣進行邏輯思辨。
AI 的運作方式,第一步是輸入資料,第二步是分析,但這過程容易出現偏見。例如電腦在理解「總統」這個字,會去看四周有什麼字詞,來學習總統這個詞,由於許多總統都是男性,電腦就會「覺得」總統是男性。
這也是為什麼,如果讓 AI 學習,在它的認知裡,女性「不可能」當美國總統(因為沒有資料紀錄)。「你可以跟人類說,任何職業、性別都是平等的,但對電腦來講,這很困難,」張凱崴說明,一旦資料的寬廣度受限,電腦就容易產生偏見。
就像在自然語言處理(Natural Language Processing,讓電腦把輸入的語言變成有意義的符號)領域,張凱崴說明,AI需要知道代名詞指的是「哪個名詞」,才能運算下去。但如果資料受限,使用男性的「他」,電腦可能判斷這個代名詞是指總統、總理、執行長;但換成女性的「她」,由於數據不足,電腦就會混亂,出現系統性誤差。
他再舉一例,美國人工智慧研究組織 OpenAI 提出「生成式預先訓練」系統(GPT,Generative Pre-training),推出到 GPT3 版本,屬於書寫類 AI,電腦能夠揣測人們說完上一句話,下一句可能會講的句子,自動完成後半段。
好比有人上一句寫下「我正在和教授聊天」,系統可能推導出「我們在研究室討論學術問題」,因為電腦藉由蒐集來的語料資料中判讀出「教授」和「學術」具高度相關。但研究也顯示,GPT2(前一代版本)系統也從資料中學習到許多偏見,像是如果句子前半談論白人男性,系統傾向產生正面評價;如果句子前半是黑人女性,系統竟會產生負面句子。對企業來說,許多組織接觸 AI,想讓它們取代部分工作,首先需要留意資料的廣度、多元性,才能減少電腦犯錯的機會。
AI 局限2. 即便條件相同,也無法每次都做出正確判斷
「其實,現在的 AI 就像一台原型飛機,還缺乏穩定性。」張凱崴說,現行的 AI 就好比萊特兄弟(Wright brothers)剛發明飛機,看似可以做很多有趣的事,但「可以飛」跟「飛得很好」,有一大段落差。
紐西蘭的簽證系統曾鬧出笑話。人們上傳簽證照片,AI 掃描後,確認是不是本人,但當時系統沒有估算到某些亞洲人眼睛比較小,一名亞裔男子被判定「沒有張開眼睛」,因此照片無效。
張凱崴說,在這個例子中,凸顯出 AI 的穩定性不足,「系統沒有考慮到不同人種的差異,很死板地認為你眼睛沒張開。」所謂的缺乏穩定性,指的是 AI 沒辦法在相同條件下,每次都做出正確決策,這也是使用 AI 時,須留意的第二個挑戰。
他再舉例,許多模型可以準確分析,一則影評對電影的評價是正面或負面。然而研究顯示,有時只要將影評中一些字換成同義詞,例如把電影(movie)換成影片(film),或改寫句子,即使意思並未改變,系統卻把原本判斷為正面的影評標註成負面。這顯示AI系統還未真正了解語言的含義。
在設計這些程式時,人們必須注意到 AI 可能有局限,設定的資料範圍要更完整,考慮這些因素,就能減少偏見、落差,進而加強穩定性。
餵指令給 AI 要多元化,嘗試「換句話說」、刻意混淆
經理人雖然不一定具備 AI 方面的專業知識,但只要掌握觀念,再透過 AI 領域專才協助,也能優化系統。張凱崴指出,最直接的方法是,設計 AI 模型時,要把來源群組不同的資料分門別類測試,在測試階段讓群體多元化,並確保不同特色的使用者,用起來都沒有問題。
舉例來說,一套 A 系統擁有來自各地的使用者,如果設計者是台北人,設計系統的思維容易以台北生活為主,很可能因為當地習慣不同,導致花蓮使用者操作不順。
另一個方法,則是用不同的「語意」,去測試 AI 有沒有徹底學會一個概念。例如,有一套餐廳評鑑的 AI 系統,只要蒐集、整理使用者意見,就能判斷每個顧客對於餐廳的評比是高分或低分。那麼要如何確認這套系統的穩定性?張凱崴建議,可以利用「抽換詞面」的方法。
比如,把詞彙換成同義字,再看 AI 是否能運算出相同結果,「你可能會發現,原本評比結果是食物很美味,但如果美味換成比較困難的詞,AI 就會分不出這則評比是好是壞。」因此在訓練模型時,可以將詞彙隨機抽換成同義詞,增加 AI 的詞彙量。
第三種方式更進階:改變句型、重寫句子。張凱崴指出,同樣一句話,如果換成不同說法,電腦可能判讀錯誤,將「因為發生 A 事件,所以導致 B 事件」,改寫成「B 事件發生了,是因為 A 事件的緣故」,明明兩句話意思一樣,但 AI 很可能因為穩定性不足,搞混兩者的差別。如果要鞏固 AI 的穩定性,可以使用自動改寫的方式,增加資料的多樣性。
張凱崴表示,經過這些測試,讓 AI 接受更多元化的訓練,得到更廣的學習範圍,往後碰到同義詞、相似資訊,才能有效判讀。
張凱崴總結,AI 還在快速發展,或許可以創造更多工作機會、新的職位,但現行階段,它只是輔助角色。AI 並非魔術盒子,使用它就一定有更好結果,人們還是要保持高度耐心,先認識它的缺陷,才能在技術更迭下,發揮出最好的結果。
張凱崴
台灣大學資訊工程系碩士、美國伊利諾大學(UIUC)電腦科學博士。美國加州大學洛杉磯分校(UCLA)電腦科學系助理教授,研究領域包括人工智慧、機器學習、自然語言處理。2021 年獲得史隆研究獎(Sloan Research Fellowship),研究團隊開發的運算方法,使人類語言處理的程序更有效率、更多元,同時兼具公平性。
附圖:優化AI系統的3方法
資料來源:https://www.managertoday.com.tw/articles/view/62902?fbclid=IwAR2jI1bhg1anqct0AZZR_3LKKJqIsvG0wz2whSN8iniROZApHt-_qpD7dis
確認同義詞 在 地方爸爸與他的小幫手們 Facebook 的最佳解答
近期小幫手更新
【國語小幫手】
1. 這學期(109下學期)的生字確認完畢
除了把寒假前我眼花打錯的一些字修正,也完整確認這學期生字與去年的差異。
康軒、南一、翰林三家出版社一到六年級的內容中,除了二年級的課文與生字因為108課綱全面換掉之外,只有康軒五下的差異較大(課文都沒變,但是每一課的生字都更動了一兩個字)。
所有的更正,也同步更新到我寒假做的生字簿上
2. 國語辭典簡編本的內容,已經更新到目前最新2020/12/29的版本
在注音的部分,基本上沒有什麼變化。
比較有趣的是,從有些同義詞解釋的修改,可以"感覺"出比較推薦的用法,例如:
「當作」與「當做」都可以,但是「當作」應該比較推薦
「日食」與「日蝕」都可以,但是「日食」應該比較推薦
「舉薦」與「舉荐」都可以,但是「舉薦」應該比較推薦
【英文發音快搜】
經過了來回溝通,在資料授權使用上還是被劍橋大學出版拒絕了,所以這個服務沒辦法直接公開在粉專讓有需要的人使用
之後只能再繼續找找,有沒有可以授權的發音語音資料
【國中會考吧】
雖然我一直不知道這個服務,到底對於國中生有沒有用處,不過上個月跟知名自然科老師米蘭老師聊天時,他還是建議我可以補充「把答錯的題目蒐集起來,可以再次練習」的功能。
所以我應該還是會安排時間,把老師建議的功能做一下
以上
確認同義詞 在 范琪斐的美國時間 Facebook 的精選貼文
大家午安,我是Oscar。
今天的TODAY看世界,我們要介紹新加坡在七月十日舉辦的國會選舉,究竟有何選舉觀察重點、李氏兄弟鬩牆真的有影響嗎、人民行動黨有哪些選舉工具、外國期刊the diplomat投書講到的「軟性壓制反對黨」又是怎麼一回事。這些我們都會在稿子裡提及。我們今天以新加坡的制度為討論的主軸,很多觀眾想看的兩李相爭,我們稍後有機會再談。
另外,這幾天的日本大水真的很嚴重,加上中國水災和緬甸的山體滑波,都不禁讓人思考這些是純粹的天災,還是有人禍的成分?這些單一的天氣事件可以套到氣候變遷的模型嗎?
雖然跟日本的情況正好相反,希望大家在近期的高溫熱浪中,都能平安。
🔎以下是今天的國際三條線
▪️國際:日本熊本水災增至20死14命危 居民排字SOS求援
https://www.cna.com.tw/news/firstnews/202007050040.aspx
👉劃重點:日本放送協會(NHK)報導,截至今天下午5時止,受大雨重創的日本熊本縣至少已有20人不幸罹難,另有14人無呼吸心跳及14人下落不明。
目前仍有無法掌握災情的地區,警消及自衛隊等人員正進一步確認。
日本產經新聞報導,日本政府已在這波大雨影響的熊本縣及鹿兒島縣,分別開設現地災害對策本部,希望第一時間協助地方政府因應災情。
▪️國際:美國參議院通過就香港問題懲罰中國官員法案
https://cn.nytimes.com/usa/20200703/senate-china-hong-kong-sanctions/zh-hant/
👉劃重點:這項法案週四在未經辯論和正式投票的情況下通過,將對那些實施新國安法的中國官員、鎮壓抗議者的警察部隊,以及為試圖削弱香港獨立性的活動提供資金的銀行處以強制性懲罰。
眾議院已於週三一致通過了這項法案,議長南希·佩洛西(Nancy Pelosi)稱讚它是「結束中國加速對香港人民發動的打壓、恐嚇和殘酷運動的又一重要步驟」。
白宮尚未表態是否會支持這項法案,過去它曾因擔憂破壞川普確保與中國達成貿易協議的努力而迴避對北京施加制裁。但在這項新立法在香港的寒蟬效應變得清晰時,國務卿邁克·龐皮歐(Mike Pompeo)嚴厲譴責了這項立法。龐皮歐是一名對華鷹派。香港警方週三逮捕了超過300名親民主抗議者,包括一名揮舞港獨旗幟的15歲女孩。
▪️國際:香港危機和世界新秩序 BBC分析英國未來中國政策
https://www.bbc.com/zhongwen/trad/world-53283450
👉劃重點:英國也有很多優勢。它還算是一個富裕國家,英國也在國際政治的決策圈——聯合國安理會佔有一個席位。但是英國必須在後疫情時代、後脫歐時代找到方法重新開始有所作為。
北京越來越咄咄逼人的政策,或許能被視為「中國優先」的同義詞,在世界各地有跡象顯示對北京這種政策的煩躁感越來越強。
殖民時期留下的歷史讓英國在香港這出大戲中扮演了一個關鍵的角色。英國現在需要發揮自身的作用,鍛造出一個新的與北京打交道的國際共識:既頂住中國壓力據理力爭,同時尋求與中國的當權者在關係到全世界的重大問題上展開積極的互動。
📢 晚上八點別忘了看范琪斐的 #TODAY看世界。
另外有在用 LINE 的朋友可以訂閱 @LINE TODAY 👇
https://lin.ee/19eXmdD
週一至週日 #LINETODAY 就會推播TODAY看世界,如果錯過了,通常會放在國際欄目。
📢別忘了《#范琪斐ㄉ寰宇漫遊》每週四晚間九點在 #寰宇新聞台 播出,沒跟上的也沒關係,歡迎訂閱我們的 YouTube 頻道 🔔#范琪斐ㄉ寰宇漫遊 🔔https://reurl.cc/ZvKM3 十點準時上傳完整版!
確認同義詞 在 挑選同義詞在PTT/Dcard完整相關資訊 - 動漫二維世界 的必吃
義詞偵測及判別規則;再挑選另一部分近義詞組資料作為測試語料,用以確認以上規則.任君挑选的近义词_任君挑选的反义词_任君挑选的同义词- 相似词查询任君挑选是什么意思, ... ... <看更多>
確認同義詞 在 挑選同義詞在PTT/Dcard完整相關資訊 - 動漫二維世界 的必吃
義詞偵測及判別規則;再挑選另一部分近義詞組資料作為測試語料,用以確認以上規則.任君挑选的近义词_任君挑选的反义词_任君挑选的同义词- 相似词查询任君挑选是什么意思, ... ... <看更多>