這是我看過最好的一篇GPT-3 科普文章。到現在還看不懂GPT-3的,建議好好讀:
本文來自量子位微信公眾號
…………………………………………
火爆全球的GPT-3,到底憑什麼砸大家飯碗?
GPT-3是指第三代生成式預訓練Transformer,它由三藩市AI公司OpenAI開發。該程式歷經數年的發展,最近在AI文本生成領域內掀起了一波的創新浪潮。
從許多方面來看,這些進步與自2012年以來AI影像處理的飛躍相似。
電腦視覺技術促進了、無人駕駛汽車到面部識別、無人機的發展。因此,有理由認為GPT-3及其同類產品的新功能可能會產生類似的深遠影響。
與所有深度學習系統一樣,GPT-3也是資料模式。它在龐大的文本集上進行了訓練,並根據統計規律進行了挖掘。
重要的是,此過程中無需人工干預,程式在沒有任何指導的情況下查找,然後將其用於完成文本提示。
▌海量訓練數據
GPT-3的與眾不同之處在於它的運行規模和完成一系列令人難以置信的任務。
第一版GPT於2018年發佈,包含1.17億個參數。2019年發佈的GPT-2包含15億個參數。
相比之下,GPT-3擁有1750億個參數,比其前身多100倍,比之前最大的同類NLP模型要多10倍。
GPT-3的訓練資料集也十分龐大。整個英語維琪百科(約600萬個詞條)僅占其訓練數據的0.6%。
訓練資料的其他部分來自數位化書籍和各種網頁連結。不僅包括新聞文章、食譜和詩歌之類的內容,還包括程式碼、科幻小說、宗教預言等各種你可以想像到的任何文字。
上傳到互聯網的文本類型都可能成為其訓練資料,其中還包括不良內容。比如偽科學、陰謀論、種族主義等等。這些內容也會投喂給AI。
這種不可置信的深度和複雜性使輸出也具有複雜性,從而讓GPT-3成為一種非常靈活的工具。
在過去的幾周中,OpenAI通過向AI社區的成員提供GPT-3商業API,鼓勵了這些實驗。這導致大量新的用法出現。
下面是人們使用GPT-3創建的一小部分示例:
▌GPT-3能做什麼
1、基於問題的搜尋引擎:就像Google,鍵入問題,GPT-3會將定向到相關的維琪百科URL作為答案。
2、與歷史人物交談的聊天機器人:由於GPT-3接受過許多數位化書籍的訓練,因此它吸收了大量與特定哲學家相關的知識。這意味著你可以啟動GPT-3,使其像哲學家羅素一樣講話。
3、僅需幾個樣本,即可解決語言和語法難題。
4、基於文本描述的代碼生成:用簡單的文字描述你選擇的設計項目或頁面配置,GPT-3會彈出相關代碼。
5、回答醫療問題:來自英國的一名醫學生使用GPT-3回答了醫療保健問題。該程式不僅給出了正確答案,還正確解釋了潛在的生物學機制。
6、基於文本的探險遊戲。
7、文本的風格遷移:以某種格式編寫的輸入文本,GPT-3可以將其更改為另一種格式。
8、編寫吉他曲譜:這意味著GPT-3可以自行生成音樂。
9、寫創意小說。
10、自動完成圖像:這項工作是由GPT-2和OpenAI團隊完成的。它表明可以在圖元而不是單詞上訓練相同的基本GPT體系結構,從而使其可以像在文字上一樣實現視覺資料自動完成任務。
但是,所有這些樣本都需要一些上下文,以便更好地理解它們。而令人印象深刻的是,GPT-3沒有接受過完成任何特定任務的訓練。
常見的語言模型(包括GPT-2)需要完成基礎訓練,然後再微調以執行特定任務。
但是GPT-3不需要微調。在語法難題中,它只需要一些所需輸出類型的樣本(稱為“少量學習”)。
GPT-3是如此龐大,以至於所有這些不同功能都可以在其中實現。用戶只需要輸入正確的提示就可以調教好它。
但是網上傳出的內容存在另一個問題:這些都是精心挑選的樣本,生成結果肯定不止一個。必然有炒作因素。
正如AI研究人員Delip Rao在一篇針對GPT-3的炒作解構文章中指出的那樣,該軟體的許多早期演示來自矽谷企業家,他們渴望宣傳該技術的潛力並忽略其陷阱,因為他們關注AI帶來的新創業公司。
的確,瘋狂的鼓吹情緒變得如此強烈,以至於OpenAI CEO本人都發Twitter說:GPT-3被過度宣傳了。
▌GPT-3也會犯低級錯誤
儘管GPT-3可以編寫代碼,但我們很難判斷其總體用途。它是淩亂的代碼嗎,這樣的代碼會為人類開發人員帶來更多問題嗎?
沒有詳細的測試很難說,但是我們知道GPT-3在其他方面會犯嚴重錯誤。
當用戶和GPT-3創造的“約伯斯”交談時,詢問他現在何處,這個“約伯斯”回答:“我在加州庫比蒂諾的蘋果總部內。”這是一個連貫的答案,但很難說是一個值得信賴的答案。
在回答瑣事問題或基本數學問題時,也可以看到GPT-3犯了類似的錯誤。例如,不能正確回答100萬前的數是多少(回答是99萬)。
但是,我們很難權衡這些錯誤的重要性和普遍性。
如何判斷這個可以幾乎回答所有問題的程式的準確性?如何創建GPT-3的“知識”的系統地圖,然後如何對其進行標記?
儘管GPT-3經常會產生錯誤,但更加艱巨的挑戰是,通常可以通過微調所輸入的文本來解決這些問題。
用GPT-3創造出小說的研究人員Branwen指出,“抽樣可以證明知識的存在,但不能證明知識的缺失”,可以通過微調提示來修復GPT-3輸出中的許多錯誤。
在一個錯誤的示範中,詢問GPT-3:“哪個更重,一個烤麵包機或一支鉛筆?” 它回答說:“鉛筆比烤麵包機重。”
但是Branwen指出,如果你在問這個問題之前給機器投喂某些提示,告訴它水壺比貓重,海洋比塵土重,它會給出正確的回應。
這可能是一個棘手的過程,但是它表明GPT-3可以擁有正確的答案,如果你知道怎麼調教它。
Branwen認為,這種微調最終可能會最終成為一種編碼範例。就像程式設計語言使用專用語法的編碼更加流暢一樣,未來我們可能完全放棄這些程式設計語言,而僅使用自然語言程式設計。從業人員可以通過思考程式的弱點並相應地調整提示,來從程式中得出正確的回應。
GPT-3的錯誤引起了另一個問題:該程式不可信的性質是否會破壞其整體實用性?
現在人們已經嘗試了GPT-3各種用途:從創建客服機器人,到自動內容審核。但是答案內容的錯誤可能回給商業公司帶來嚴重後果。
沒有人原因創建一個偶爾侮辱客戶的客服機器人。如果沒有辦法知道答案是否可靠,我們也不敢拿GPT-3作為教育工具。
▌專業人士評價
一位匿名的在Google資深AI研究人員說,他們認為GPT-3僅能自動完成一些瑣碎任務,較小、更便宜的AI程式也可以做到,而且程式的絕對不可靠性最終會破壞其商用。
這位研究人員指出,如果沒有很多複雜的工程調試,GPT-3還不夠真正使用。
AI研究人員Julian Togelius說:“ GPT-3的表現常常像是一個聰明的學生,沒有讀完書,試圖通過廢話,比如一些眾所周知的事實和一些直率的謊言交織在一起,讓它看起來像是一種流暢的敘述。”
另一個嚴重的問題是GPT-3的輸出存在偏見。英偉達的AI專家Anima Anandkumar教授指出,GPT-3在部分程度上接受了Reddit過濾後的資料的訓練,並且根據此資料構建的模型產生的文本有“令人震驚地偏向性”。
在GPT-2的輸出中,如果要求完成下列句子時,模型會產生各種歧視性言論:“ 黑人(皮條客工作了15年)”、“ 那個女人(以Hariya為名做妓女)”。
參考連結:
https://www.theverge.com/21346343/gpt-3-explainer-openai-examples-errors-agi-potential
企業識別系統範例 在 台灣的未來 Facebook 的精選貼文
格博企業識別系統(CIS)設計範例的流程及價格計算說明 #設計 #企業形象
企業識別系統範例 在 Analog Devices台灣亞德諾半導體股份有限公司 Facebook 的最佳解答
ADI參展IoT World,第二篇IoT合作新聞,看有多不一樣!
ADI與Cambridge Consultants合作具成本效益智慧監控系統
有助減少停車所受挫折
(2016年5月11日台北訊)–Analog Devices, Inc. (ADI)亞德諾半導體公司和Cambridge Consultants今天宣布一款具成本效益的智慧監控系統,有助於減低駕駛人面臨的停車挫折。此創新系統節省了駕駛人的時間,藉由監控停車空間佔用狀況使得在未裝設額外昂貴基礎設施的街邊及室內車庫停車場停車更為容易。此系統實現了一些重要的停車改善:例如,當駕駛開車進入車庫時會被分配到一個停車位,使他們直接能行駛到被分配到的位置點。或者,如果他們計劃在特定商店購物,他們可以提前申請特定的停車空間。如果用戶感測器的資料與車牌識別相結合,還可以提供駕駛人進行自動支付,並協助定位他們停放的車輛。
此一新的智慧系統是由ADI公司獲獎的Blackfin®低功耗成像平台(BLIP)來實現,這是一種低成本、低功耗的嵌入式電腦影像平台,目標鎖定在一系列大量的即時感測應用。使用由Cambridge Consultants設計的高複雜度演算法,ADI的低功耗成像平台可以直觀地偵測哪些車位被佔用或空著。這是超越昂貴替代解決方案的一項重要改善,其中牽涉了挖開馬路和停車場以在每個停車空間下安裝獨立的感測器。
• 瞭解更多關於低功耗成像平台( BLIP): http://www.analog.com/BLIP
ADI公司工業物聯網與感測部門總經理Michael Murray 表示:「低功耗成像平台使ADI公司對新興的物聯網空間如智慧建築與智慧城市等在被動到即時的智慧感測節點做出重要的貢獻。我們非常高興能與Cambridge Consultants公司合作這個專案。該公司在複雜演算法的發展上具備世界級的專業知識,使我們能夠在演算上為應用空間實現低功耗成像平台,創造出獨特的解決方案以緩解駕駛人停車時處處受挫的主要根源。」
停車場的調查經常指出,找一個停車位通常平均得花20分鐘,而駕駛人一生要浪費數千小時在試圖找到一個空位。除了時間耗費的經濟成本外,它還增加了馬路上的污染和壅塞。
Cambridge Consultants商業總監Dipak Raval 表示,「我們獨特的智慧系統使用機器視覺,而無需昂貴的基礎設施來顯示哪個位置空著或有人使用。 由於相機能夠觀看到多個建築物的間隔,這是在廣大的地區內機器視覺如何能夠提供一種具成本效益的方式來監控使用狀況的範例。」
「我們在演算法發展上具備精深的專業知識,使我們能夠確保在各種照明條件下的技術運作,如果當行人站在一個停車位上,或是購物手推車被遺留在一個停車位上,系統可因不同大小的汽車、卡車和摩托車等狀況可以適切處理而不會給出誤導的結果。」
關於Cambridge Consultants
Cambridge Consultants開發突破性產品,創造並授權智慧財產權,致力為全球客戶提供技術關鍵問題的企業諮詢。在過去的50年裡,該公司一直在協助客戶將商機變成企業的成就,無論他們要推出第一個進入市場的產品、進入新市場,或透過引進新技術擴大現有市場。擁有超過550名員工團隊,其中包括工程師、科學家、數學家和設計師,在劍橋(英國)、波士頓(美國)和新加坡皆設有辦公室,Cambridge Consultants提供橫跨不同產業的解決方案,包括醫療技術、工業和消費性產品、數位保健、能源及無線通訊。欲了解更多訊息,請造訪:www.CambridgeConsultants.com
Cambridge Consultants公司隸屬於一間在創新和高科技工程諮詢上提供客戶新方式去開創產品的全球領導廠商Altran的一部分。該集團為客戶或與客戶一同開發未來的產品和服務。從概念到產業化,Altran與客戶在他們專案的價值鏈上每個環節共同合作。在20多個國家擁有近26,000名員工,該集團2015年的營收達19.45億歐元。欲了解更多訊息,請造訪:www.altran.com
關於ADI公司
Analog Devices, Inc.(簡稱ADI)始終致力於設計與製造先進的半導體產品和優秀的解決方案,憑藉傑出的感測、測量和連接技術,搭建連接真實世界和數位世界的智慧化橋樑,從而協助客戶重新認識周圍的世界。詳情請瀏覽ADI官網http://www.analog.com
企業識別系統範例 在 CIS 企業識別系統 - 弘光科技大學 的相關結果
形象標誌. 標誌應用錯誤範例. 基本組合各構成元素具其本體之獨特性,不可更改其造型及構成比例, 以下 ... ... <看更多>
企業識別系統範例 在 【CIS設計範例作品】SPIRIT企業識別設計流程- 格博品牌行銷 ... 的相關結果
設計測試: 商標LOGO是整個CIS品牌設計的開端也是核心,是公司形象、產業及服務的整體表徵(Representation)。因此,我們會經由幾個條件來測試,LOGO設計是否符合需求。 ... <看更多>
企業識別系統範例 在 CIS企業識別系統對品牌行銷的重要性 - 奇創形象策略 的相關結果
CIS(Corporate Identity System)企業形象識別系統,是將企業文化、經營理念、企業行為,經系統化整理後透過行為感受及視覺刺激,傳達給企業內部與企業外部的關係人,使其對 ... ... <看更多>