關於 alphago演算法，我們在網路上蒐集到這些相關的討論、資訊與評價

Q: alphago演算法台灣物聯網實驗室 IOT Labs 在Facebook 的評價

Google AI 設計晶片速度大勝人類！不到 6 小時完成平面圖作者 林 妤柔 | 發布日期 2021 年 06 月 11 日 12:26 | Google 聲稱，新 AI 設計晶片的速度比人類還快，能在不到 6 小時內設計出人類至少要花數個月才能完成的晶片設計，論文刊登在《自然》期刊。AI 已用於開發 Google 最新一代 TPU 加速器，這項突破將對半導體產業有著重大影響。換言之，Google 正在使用 AI 設計晶片，這些晶片能用來創造更複雜的人工智慧系統。Google 的新 AI 能繪製晶片的「平面圖」，這涉及繪製 CPU、GPU 和內存等組件在晶片的相對位置，這些位置將影響晶片的功耗和處理速度，且在功耗、性能、晶片面積等關鍵參數指標，都優於人類設計的平面圖。一般來說，人類晶片設計師通常以整齊的線條排列組件，並花數個月的時間改進這些平面圖設計，但 Google 的 AI 則使用更分散的方法設計晶片，並藉由深度強化學習系統 6 小時內完成。2016 年，南韓棋王李世乭代表人類出戰 AlphaGo，以一勝四敗成績輸給 AlphaGo，震驚全世界；這狀況 AI 的演算法訓練為移動棋子，增加棋局獲勝的機會。研發晶片部分，AI 訓練找出組件的最佳組合，盡可能提高運算效率，AI 系統會植入 10,000 張晶片平面圖，以便學習哪些有效、哪些無效。《自然》期刊認為，Google 的研究可說是重要突破，有助於加快供應鏈速度，但這項技術必須廣泛分享共用，以確保 Google 生態系統全球化，此外產業也要確保節省時間的技術不會趕走擁有核心技術的人才。資料來源：https://technews.tw/2021/06/11/google-uses-a-i-to-design-chips-faster-than-humans/?fbclid=IwAR3rE_KhmcAaLuL-LGA4XfV9osYScugR7uxMRHvC8LXN4lyRUF0_Rs0cXrQ

Q: alphago演算法純靠北工程師 在Facebook 的評價

#純靠北工程師4uy----------有一種工程師叫做夢想工程師看著書架上的機器學習入門就會幻想自己可以寫出 AlphaGo看著書架上的演算法入門就會幻想自己可以寫出 Google「夢想工程師」這五個字當中你已經完成了夢想兩個字但在你把書本拿起來翻閱之前你距離工程師還很遙遠---立即報名 AWS 香港年度線上活動👉 https://amzn.to/338MXTZ-------------💖 純靠北官方 Discord 歡迎在這找到你的同溫層！👉 https://discord.gg/tPhnrs2----------💖 全平台留言、文章詳細內容👉 https://init.engineer/cards/show/6298

「alphago演算法」的推薦目錄：

關於alphago演算法在 Inside 硬塞的網路趨勢觀察 Facebook 的最佳解答
關於alphago演算法在台灣物聯網實驗室 IOT Labs Facebook 的精選貼文
關於alphago演算法在純靠北工程師 Facebook 的最讚貼文

關於alphago演算法在范琪斐 Youtube 的精選貼文
關於alphago演算法在 PanSci 泛科學 Youtube 的最讚貼文

關於alphago演算法在 [新聞] AlphaGo新演算法仍有一大弱點- 看板GO 的評價
關於alphago演算法在【AI入門】AlphaGo致勝原理分解--蒙地卡羅樹搜尋 - YouTube 的評價
關於alphago演算法在也就是AlphaGo，怎麼辦到的？電腦下棋要贏過人 ... - Facebook 的評價

alphago演算法在 Inside 硬塞的網路趨勢觀察 Facebook 的最佳解答

By Inside 硬塞的網路趨勢觀察

2021-08-15 19:56:43 有 289 人按讚

同樣是戰略遊戲，能打贏星海殘酷電腦等級的 AI，過渡到魔獸時就不是那麼回事了，據說 AI 只產了幾隻農民後，就開始瘋狂採礦但不產兵了；不只如此，這隻 AI 在玩 Dota 2 時一樣腦死，跌破大家眼鏡。

距離 AlphaGo 打敗人類棋手李世乭已經六年了，可惜的是，現在的演算法依舊有無法達到自行推論與完全複製，因此 DeepMind 準備再次出手，扭轉這一切。

Tags: alphago演算法

Inside 硬塞的網路趨勢觀察

About author

主站： http://www.inside.com.tw 網路產業求才看板： http://jobs.inside.com.tw

社群媒體、行動網路、區塊鏈、AI、網路行銷、有趣技術、網路創業相關議題，請上 http://www.inside.com.tw/

alphago演算法在台灣物聯網實驗室 IOT Labs Facebook 的精選貼文

By 台灣物聯網實驗室 IOT Labs

2021-06-13 14:49:45 有 0 人按讚

Google AI 設計晶片速度大勝人類！不到 6 小時完成平面圖

作者林妤柔 | 發布日期 2021 年 06 月 11 日 12:26 |

Google 聲稱，新 AI 設計晶片的速度比人類還快，能在不到 6 小時內設計出人類至少要花數個月才能完成的晶片設計，論文刊登在《自然》期刊。

AI 已用於開發 Google 最新一代 TPU 加速器，這項突破將對半導體產業有著重大影響。換言之，Google 正在使用 AI 設計晶片，這些晶片能用來創造更複雜的人工智慧系統。

Google 的新 AI 能繪製晶片的「平面圖」，這涉及繪製 CPU、GPU 和內存等組件在晶片的相對位置，這些位置將影響晶片的功耗和處理速度，且在功耗、性能、晶片面積等關鍵參數指標，都優於人類設計的平面圖。

一般來說，人類晶片設計師通常以整齊的線條排列組件，並花數個月的時間改進這些平面圖設計，但 Google 的 AI 則使用更分散的方法設計晶片，並藉由深度強化學習系統 6 小時內完成。

2016 年，南韓棋王李世乭代表人類出戰 AlphaGo，以一勝四敗成績輸給 AlphaGo，震驚全世界；這狀況 AI 的演算法訓練為移動棋子，增加棋局獲勝的機會。研發晶片部分，AI 訓練找出組件的最佳組合，盡可能提高運算效率，AI 系統會植入 10,000 張晶片平面圖，以便學習哪些有效、哪些無效。

《自然》期刊認為，Google 的研究可說是重要突破，有助於加快供應鏈速度，但這項技術必須廣泛分享共用，以確保 Google 生態系統全球化，此外產業也要確保節省時間的技術不會趕走擁有核心技術的人才。

資料來源：https://technews.tw/2021/06/11/google-uses-a-i-to-design-chips-faster-than-humans/?fbclid=IwAR3rE_KhmcAaLuL-LGA4XfV9osYScugR7uxMRHvC8LXN4lyRUF0_Rs0cXrQ

Tags: alphago演算法

台灣物聯網實驗室 IOT Labs

About author

本專頁將不定時網羅搜集國內外與物聯網相關新聞及技術，並無條件與 IOT 從業人員或對物聯網有興趣的大眾分享，若有任何不足或建議之處，歡迎隨時留言，一起研究研究。^.^

alphago演算法在純靠北工程師 Facebook 的最讚貼文

By 純靠北工程師

2021-05-07 19:48:03 有 347 人按讚

#純靠北工程師4uy
----------
有一種工程師叫做夢想工程師
看著書架上的機器學習入門
就會幻想自己可以寫出 AlphaGo
看著書架上的演算法入門
就會幻想自己可以寫出 Google
「夢想工程師」這五個字當中
你已經完成了夢想兩個字
但在你把書本拿起來翻閱之前
你距離工程師還很遙遠
---
立即報名 AWS 香港年度線上活動
👉 https://amzn.to/338MXTZ
---

----------
💖 純靠北官方 Discord 歡迎在這找到你的同溫層！
👉 https://discord.gg/tPhnrs2

----------
💖 全平台留言、文章詳細內容
👉 https://init.engineer/cards/show/6298

Tags: alphago演算法純靠北工程師4uy

純靠北工程師

About author

「我們很懷念最開始的那個靠北工程師」，這個版將會以舊文重發的方式，重現最初的那個靠北工程師 ——Powered by 靠北工程師版主

alphago演算法在范琪斐 Youtube 的精選貼文

By 范琪斐

2019-12-08 22:00:01 有 864 人看過有 17 人喜歡

唯一戰勝 Google 旗下 Deep Mind 公司開發的人工智慧 AlphaGo 的南韓棋王李世乭，宣布將要退休，因為他認為人類永遠沒辦法擊敗人工智慧。

不過演算法不是只會越來越強大，為什麼 AlphaGo 會錯判輸給李世乭呢？

因為AlphaGo 有個叫『隨機森林』的算法，可以預測對手可能會下哪一步，但李世乭這一步下在 AlphaGo 認為對方不可能會去下的那一步，李世乭當時下完這步棋，Alphago 還認為自己的贏面超過八成，繼續往後下了十手之後，Alphago 自己有一個勝率的表，突然開始下降，發現自己處於弱勢了，開始慌張了，於是 Alphago 就開始亂下險棋，出現了連業餘選手都不會犯的錯，想賭李世乭會出錯，最後就輸了。

但 AlphaGo 也從敗給李世乭找到自身弱點，再次強化學習能力。像 AlphaGo 的孿生兄弟 AlphaGo Zero，就是完全不靠任何人類經驗訓練的神經網路，它就是不斷跟自己對戰學習，結果在自學 3 天後，就以 100：0 打敗了舊版 AlphaGo ，自學 40 天後，就擊敗了曾經戰勝中國棋手柯潔的 AlphaGo Master，成為世界上最強的圍棋程式！

雖然未來人類可能再也贏不過AI，不過AI 的加入反而讓圍棋有了更多玩法，這時候 AI 的功能，是在擴展人類棋手的思路，和人類合作一起探索圍棋還未被發掘的領域。

因為圍棋是世界上最複雜的遊戲！是看哪個顏色的棋子，圈出的空間最多，誰就獲勝。聽起來規則很簡單，但實際上卻複雜到不行。

圍棋的棋盤是 19X19，通常一步會有 200 種下法，圍棋變化位置的排列組合一共有10 的 170 次方種可能性，比整個宇宙的原子數ㄅ10 的 80 次方還要多更多！人類通常都只能憑經驗跟感覺判斷，但判斷才是最困難的。剛有說嘛，圍棋的勝負是由最終局時，雙方控制地盤的多寡決定，但棋局進行到一半，雙方的地盤都還沒封閉，怎麽判斷形勢呢？很多職業棋手之間微妙的差異，就是體現在這個判斷能力上。

但就連開發 AlphaGo 的團隊都坦言，AlphaGo 面前的最大問題，和人類棋手是一樣的，就是圍棋太難了，還有規則中的規則，例如優勢、虧損、打劫，雖然 AlphaGo 的勝利或失敗，完全取決於這些機率的估計是否準確，但計算力還遠遠達不到『最優解』的程度。目前AlphaGo 團隊的做法是，讓AlphaGo學習像人類棋手一樣，去選點和判斷。

當機器把一件事情做得比人類好時，我們還能做什麼？
你對棋王退休有什麼看法？快和我們一起分享！

---------
《#范琪斐ㄉ寰宇漫遊》每週四晚間十點在寰宇新聞播出，沒跟上的也沒關係，歡迎訂閱我們的 YouTube 頻道 🔔#范琪斐ㄉ寰宇漫遊 🔔https://reurl.cc/ZvKM3 十點半準時上傳完整版！

范琪斐ㄉ寰宇漫遊范琪斐ㄉ寰宇漫遊

范琪斐

About author

《#斐姨所思》每週二晚間7點30分，在《#范琪斐的美國時間》臉書粉絲團、#范琪斐 YouTube官方頻道、Clubhouse同步直播。資深媒體人范琪斐與夥伴們，邀大家一起上線聊聊天，關心國內外重要議題。喜歡我們的節目請別忘了訂閱按讚分享、開啟小鈴鐺喔！追蹤《#范琪斐的美國時間》掌握全球脈動 ?https://bit.ly/3vG5Nhg 范琪斐 YouTube 官方頻道 ?https://bit.ly/3f6WZvI

alphago演算法在 PanSci 泛科學 Youtube 的最讚貼文

By PanSci 泛科學

2016-05-19 18:25:44 有 36,419 人看過有 185 人喜歡

#科學大爆炸 3月 AlphaGo V.S. 李世乭的世紀圍棋大賽，人工智慧以4:1下贏了天才棋士李世乭，開啟了人工智慧的新里程碑。

究竟AlphaGo厲害在哪裡？第四場為什麼AlphaGo會輸呢？人工智慧比人腦厲害在哪裡？我們真的就從此贏不了電腦了嗎？一起來聽聽台灣紅面棋王周俊勳，和又懂人工智慧又下棋的于天立老師怎麼說！

延伸必讀：
AlphaGo 爆冷從李世乭手中拿下首勝。台灣棋王怎麼看？電腦為何辦得到？
https://panx.asia/archives/42998
AlphaGo成為「棋靈王」是有多厲害？人工智慧未來又要怎麼走？
http://pansci.asia/archives/95263
AlphaGo既不是起點也不會是終點，從頭述說人工智慧走過的這70年
http://pansci.asia/archives/94904
人工智慧贏了圍棋，然後呢
http://blog.udn.com/DrVader/45626041

＿＿＿＿＿＿＿＿＿＿＿＿＿＿＿＿

周俊勳棋士：
臺灣棋院九段、中國圍棋協會三段、職業圍棋棋士，是臺灣1979年成立職業圍棋制度以來第一位職業九段棋手。因右臉有大片紅色胎記，號紅面棋王。
他是世界圍棋棋壇上唯一擁有三個職業圍棋組織（中國圍棋會，中國圍棋協會（中國棋院），臺灣棋院）棋籍的棋手。
https://goo.gl/zU5l6A

于天立副教授：
任教於台大電機系，研究領域為基因遺傳演算法、演化計算、機器學習、人工智慧。

俞俐均棋士：
職業一段，為目前台灣職業圍棋最年輕的女棋士。
http://times.hinet.net/news/18253327

科學大爆炸

PanSci 泛科學

About author

PanSci 泛科學，讓天下沒有難學的知識。歡迎找我們一起用知識說各種有趣的故事

社群媒體上有些相關的討論：

alphago演算法在 [新聞] AlphaGo新演算法仍有一大弱點- 看板GO 的必吃

作者zkow (逍遙山水憶秋年)

看板GO

標題[新聞] AlphaGo新演算法仍有一大弱點

時間Wed Jan 11 02:05:14 2017

AlphaGo新演算法仍有一大弱點柯潔不要被它嚇倒

　[文/觀察者網專欄作者陳經]

　　2016年12月29日至2017年1月4日，谷歌AlphaGo的升級版本以Master為名，在弈城圍
棋網和野狐圍棋網的快棋比賽中對人類最高水準的選手取得了60：0的壓倒戰績，再次讓
人們對圍棋AI的實力感到震驚。

　　之前《自然》論文對AlphaGo的演算法進行了非常細緻的介紹，世界各地不少研發團
隊根據這個論文進行了圍棋AI的開發。其中進展最大的應該是騰訊開發的 “刑天”（以
及之前的版本“絕藝”），職業棋手和棋迷們感覺它的實力達到了2016年3月與李世石對
戰的AlphaGo版本。但是經過近一年的升級，Master的實力顯然比之前版本要強得多，它
背後的演算法演變成什麼樣了，卻幾乎沒有資料。本文對AlphaGo的升級後的演算法框架
進行深入的分析與猜測，試圖從電腦演算法角度揭開它的神秘面紗一角。

　　在1月4日AlphaGo團隊的正式聲明中，Deepmind提到了“our new prototype version
（我們新的原型版本）”。prototype這個詞在軟體工程領域一般對應一個新的演算法框
架，並不是簡單的性能升級，可能是演算法原理級的改變。由於資料極少，我只能根據
很少的一些資訊，以及Master的實戰表現對此進行分析與猜測。

　　下文中，我們將2015年10月戰勝樊麾二段的AlphaGo版本稱為V13，將2016年3月戰勝
李世石的版本稱為V18，將升級後在網路上60：0戰勝人類高手群體的版本稱為V25（這個
版本Deepmind內部應該有不同的稱呼）。

　　V13與V25：從廖化到關羽

　　版本V13的戰績是，正式的慢棋5：0勝樊麾，棋譜公佈了，非正式的快棋3：2勝樊麾
，棋譜未公佈。樊麾非正式快棋勝了兩局，這說明版本V13的快棋實力並不是太強。

　　版本V18的戰績是，每方2小時3次1分鐘讀秒的慢棋，以4：1勝李世石。比賽中
AlphaGo以非常穩定的1分鐘1步的節奏下棋。比賽用的分散式機器有1202個CPU和176個GPU
，據說每下一局光電費就要3000美元。

　　版本V25的戰績是，Master以60：0戰勝30多位人類棋手，包括排名前20位的所有棋手
。比賽大部分是3次30秒讀秒的快棋，開始10多局人們關注不多時是20秒讀秒用時更短，
僅有一次60秒讀秒是照顧年過六旬的聶衛平。比賽中Master每步幾乎都在8秒以內落子，
從未用掉過讀秒（除了一次意外掉線），所以20秒或者30秒對機器是一回事。在KGS上天
元開局三局虐殺ZEN的GodMoves很可能也是版本V25，這三局也是快棋，GodMoves每步都是
幾秒，用時只有ZEN的一半。

　　可以看出，版本V13的快棋實力不強。而版本V18的快棋實力應該也不如慢棋，谷歌為
了確保勝利，用了分散式的版本而非48個CPU與8個GPU的單機版，還用了每步1分鐘這種
在AI中算多的每步用時。在比賽中，有時AlphaGo的剩餘用時甚至比李世石少了。應該說
這時的AlphaGo版本有堆機器提升棋力的感覺，和IBM在1997年與卡斯帕羅夫的國際象棋
人機大戰時的做法類似。

　　但是版本V25在比賽用時上進步很大，每步8秒比版本V18快了六七倍，而棋力卻提升
很大。柯潔與朴廷桓在30秒用時的比賽中能多次戰勝與版本V18實力相當的刑天，同樣的
用時對Master幾盤中卻毫無機會。應該說版本V25在用時大大減少的同時還取得了棋力巨
大的進步，這是雙重的進步，一定是因為演算法原理有了突破，絕對不是靠提升機器性
能。而這與國際像棋AI的進步過程有些類似。

　　IBM在人機大戰中戰勝卡斯帕羅夫後解散了團隊不玩了，但其它研究者繼續開發國際
象棋AI取得了巨大的進步。後來演算法越做越厲害，最厲害的程式能讓人類最高水準的棋
手一個兵或者兩先。水準極高的國際象棋AI不少，其中一個是鱈魚（stockfish），由許
多開發者集體開發，攻殺淩厲，受到愛好者追捧。

　　另一個是變色龍（Komodo），由一個國際象棋大師和一個程式師開發，理論體系嚴謹
，攻防穩健。AI互相對局比人類多得多，二者對下100盤，變色龍以 9勝89平2負領先人氣
高的鱈魚。因為AI在平常的手機上都可以戰勝人類最高水準的棋手，國際象棋（以及類似
的中國象棋）都禁止棋手使用手機，曾經有棋手頻繁上廁所看手機被抓禁賽。國際象棋
AI在棋力以及計算性能上都取得了巨大的進步，運算平臺從特別造的大型伺服器移到了人
人都有的手機上。

　　局面評估函數的作用

　　從演算法上來說，高水準國際象棋AI的關鍵是人工植入的一些國際象棋相關的領域知
識，加上傳統的電腦搜索高效剪枝演算法。值得注意的是，AlphaGo以及之前所有高水準
AI如ZEN和CrazyStone都採用MCTS（蒙特卡洛樹形搜索），而最高水準的國際象棋AI是不
用的。MCTS是 CrazyStone的作者法國人Remi Coulom 在2006年最先提出的，是上一次圍
棋人工智慧演算法取得巨大進步能夠戰勝一般業餘棋手的關鍵技術突破。

　　但MCTS其實是傳統搜索技術沒有辦法解決圍棋問題時，想出來的變通辦法，並不是說
它比傳統搜索技術更先進。實際MCTS隨機模擬，並不是太嚴謹，它是成千上萬次模擬，
每次模擬都下至終局數子確定勝負統計各種選擇的勝率。這是一個對人類棋手來說相當不
自然的方法，可以預期人類絕對不會用這種辦法去下棋。

　　國際象棋也可以用MCTS去做，但沒有必要。谷歌團隊有人用深度學習和MCTS做了國際
象棋程式，但是棋力僅僅是國際大師，並沒有特別厲害。高水準國際象棋演算法的核心技
術，是極為精細的“局面評估函數”。而這早在幾十年前，就是人工智慧博弈演算法的核
心問題。國際象棋的局面評估函數很好理解，基本想法是對皇后、車、馬、象、兵根據戰
鬥力大小給出不同的分值，對王給出一個超級大的分值死了就是最差的局面。一個局面就
是棋子的分值和。

　　但這只是最原始的想法，子力的搭配、兵陣的形狀、棋子的位置更為關鍵，象棋中的
棄子攻殺極為常見。這需要國際象棋專業人士進行極為專業細緻的估值調整。國際象棋
AI的水準高低基本由它的局面評估函數決定。有了好用的局面評估函數以後，再以此為基
礎，展開一個你一步我一步的指數擴展的博弈搜尋樹。在這個搜索樹上，利用每個局面
計算出來的分值，進行一些專業的高效率“剪枝”（如Alpha-Beta剪枝演算法）操作，縮
小樹的規模，用有限的計算資源盡可能地搜索更多的棋步，又不發生漏算。

　圖為搜尋樹示例，方塊和圓圈是兩個對手，每一條線代表下出一招。局面評估後，棋手
要遵守MIN-MAX的原則，要“誠實”地認為對手能下出最強應對再去想自己的招。有局面
評估分數的葉子節點其實不用都搜索到，因為理論上有剪枝演算法證明不用搜索了。如一
下被人吃掉一個大子，又得不到補償的分枝就不用繼續往下推了。這些搜索技術發展到
很複雜了，但都屬於傳統的搜索技術，是人可以信服的邏輯。

　　國際象棋與中國象棋AI發展到水準很高後，棋手們真的感覺到了電腦的深不可測，就
是有時電腦會下出人類難於理解的“AI棋”。人類對手互相下，出了招以後，人就會想
對手這是想幹什麼，水準相當的對手仔細思考後總是能發現對手的戰術意圖，如設個套雙
吃對手的馬和車，如果對手防著了，就能吃個兵。而“AI 棋”的特徵是，它背後並不是
一條或者少數幾條戰術意圖，而是有一個龐大的搜尋樹支持，人類對手作出任何應對，它
都能在幾手、十幾手後占得優勢，整個戰略並不能用幾句話解釋清楚，可能需要寫一篇
幾千字的文章。

　　這種“AI棋”要思考非常周密深遠，人類選手很難下出來。近年來中國象棋成績最好
的是王天一，他的棋藝特點就是主動用軟體進行訓練，和上一輩高手方法不同。王天一
下出來的招有時就象AI，以致于有些高手風言風語影射他用軟體作弊引發風波，我認為應
該是訓練方法不同導致的。國際象棋界對軟體的重視與應用比中國象棋界要強得多，重
大比賽時，一堆人用軟體分析雙方的著手好壞，直接作為判據，增加了比賽的可看性。

　　軟體能下出“AI棋”，是因為經過硬體以及演算法的持續提升，程式的搜索能力終於
突破了人類的腦力限制，經過高效剪枝後，幾千萬次搜索可以連續推理多步並覆蓋各個分
枝，在深度與廣度方面都超過人類，可以說搜索能力已經超過人類。

　　其實最初的圍棋AI也是用這個思路開發的，也是建立搜尋樹，在葉子節點上搞局面評
估函數計算。但是圍棋的評估函數特別難搞，初級的程式一般用黑白子對周邊空點的“
控制力”之類的原始邏輯進行估值，差錯特別大，估值極為離譜，棋力極低。無論怎麼人
工加調整，也搞不好，各種棋形實在是太複雜。很長時間圍棋AI 沒有實質進步，受限於
評估函數極差的能力，搜索能力極差。

　　實在是沒有辦法了，才搞出MCTS這種非自然的隨機下至終局統計勝率的辦法。MCTS部
分解決了估值精確性問題，因為下到終局數子是準確的，只要模擬的次數足夠多，有理
論證明可以逼近最優解。用這種變通的辦法繞開了局面評估這個博弈搜索的核心問題。以
此為基礎，以ZEN為代表的幾個程式，在根據棋形走子選點上下了苦功，終於取得了棋力
突破，能夠戰勝一般業餘棋手。

　　接下來自然的發展就是用深度學習對人類高手的選點直覺建模，就是“策略網路”。
這次突破引入了機器學習技術，不需要開發者辛苦寫代碼了，高水準圍棋AI的開發變容
易了。即使這樣，由於評估函數沒有取得突破，仍然需要MCTS來進行勝率統計，棋力仍然
受限，只相當於業餘高手。

　　“價值網路”橫空出世

　　AlphaGo在局面評估函數上作出了嘗試性的創新，用深度學習技術開發出了“價值網
路”。它的特點是，局面評分也是勝率，而不是領先多少目這種較為自然的優勢計算。
但是從《自然》論文以及版本V13與V18的表現來看，這時的價值網路並不是太準確，不能
單獨使用，應該是一個經常出錯的函數。論文中提到，葉子節點勝率評估是把價值網路
和MCTS下至終局混合使用，各占0.5權重。這個意思是說，AlphaGo會象國際象棋搜索演
算法一樣，展開一個葉子節點很多的樹。

　　在葉子節點上，用價值網路算出一個勝率，再從葉子節點開始黑白雙方一直輪流走子
終局得出勝負。兩者都要參考，0.5是一個經驗性的資料，這樣棋力最高。這其實是一個
權宜之計，價值網路會出錯，類比走子終局也並不可靠，通過混合想互相彌補一下，但並
不能解決太多問題。最終棋力還是需要靠MCTS海量類比試錯，模擬到新的關鍵分枝提升
棋力。所以版本V18特別需要海量計算，每步需要的時間相對長，需要的CPU與GPU個數也
不少，谷歌甚至開發了特別的TPU 進行深度神經網路平行計算提高計算速度。

　　整個《自然》論文給人的感覺是，AlphaGo在圍棋AI的工程實施的各個環節都精益求
精做到最好，最後的棋力並不能簡單地歸因於一兩個技術突破。演算法研發與軟體工程
硬體開發多個環節都不計成本地投入，需要一個人數不小的精英團隊全力支援，也需要大
公司的財力與硬體支援。V13與V18更多給人的感覺是工程成就，之前的圍棋AI開發者基
本是兩三個人的小團隊小成本開發，提出了各式各樣的演算法思想，AlphaGo來了個集大
成，終於取得了棋力突破。

　　即使這樣，V18在實戰中也表現出了明顯缺陷，輸給李世石一局，也出了一些局部計
算錯誤。如果與國際象棋AI的表現對比，對人並不能說有優勢，而是各有所長。人類高手
熟悉這類圍棋AI的特點後，勝率會上升，正如對騰訊AI刑天與絕藝的表現。

　　ZEN、刑天、AlphaGo版本V18共同的特點是大局觀很好。連ZEN的大局觀都超過一些不
太注意大局的職業棋手，但是戰鬥力不足。這是MCTS海量類比至終局精確數目帶來的優
勢，對於地塊的價值估計比人要准。它們共同的弱點也是局部戰鬥中會出問題，死活搞不
清，棋力高的問題少點。這雖然出乎職業棋手的預料，從演算法角度看是自然的。海量
終局模擬能體現虛虛的大局觀，但是這類圍棋AI的“搜索能力”仍然是不足的，局面評估
函數水準不高，搜索能力就不足，或者看似搜得深但有漏洞。正是因為搜索能力不足，
才需要用MCTS來主打。

　　但是AlphaGo的價值網路是一個非常重要而且有巨大潛力的技術。它的革命性在於，
用機器學習的辦法去解決局面評估函數問題，避免了開發者自己去寫難度極大甚至是不可
能寫出來的高水準圍棋局面評估函數。國際象棋開發者可以把評估思想寫進代碼裡，圍棋
是不可能的，過去的經驗已經證明了這一點。機器學習的優點是，把人類說不清楚的複雜
邏輯放在多達幾百M的多層神經網路係數裡，通過海量的大資料把這些係數訓練出來。

　　給定一個圍棋局面，誰占優是有確定答案的，高手也能講出一些道理，有內在的邏輯
。這是一個標準的人工智慧監督學習問題，它的難度在於，由於深度神經網路結構複雜
係數極多，需要的訓練樣本數量極大，而高水準圍棋對局的資料更加難於獲取。Deepmind
是通過機器自我對局，積累了2000萬局高品質對局作為訓練樣本，這個投入是海量的，
如果機器數量不多可能要幾百年時間，短期生成這麼多棋局動用的伺服器多達十幾萬台。
但如果真的有了這個條件，那麼研究就是開放的，怎麼準備海量樣本，如何構建價值網
路的多層神經網路，如何訓練提升評估品質，可以去想辦法。

　　AlphaGo團隊演算法負責人David Silver在2016年中的一次學術報告會上說，團隊又
取得了巨大進步，新版本可以讓V18四個子了，主要是價值網路取得了巨大進步。這是非
常重要的資訊。

　　V25能讓V18四個子，如果V18相當於人類最高水準的棋手，這是不可想像的。根據
Master對人類60局棋來看，讓四子是絕對不可能的，讓二子人類高手們都有信心。我猜
測，V18是和V25下快棋才四個子還輸的。AlphaGo的訓練與評估流水線中，機器自我對局
是下快棋，每步5秒這樣。2016年9月還公佈了三局自我對局棋譜，就是這樣下出來的。
V18的快棋能力差，V25在價值網路取得巨大進步能力後，搜索能力上升極大，只要幾秒的
時間，搜索質量就足夠了。為什麼價值網路的巨大進步帶來的好處這麼大？

　　如果有了一個比V18要靠譜得多的價值網路，就等於初步解決了局面評估函數問題。
這樣，AlphaGo新的prototype就更接近于傳統的以局面評估為核心的搜索框架，帶有確
定性質的搜索就成為演算法能力的主要力量，碰運氣的MCTS不用主打了。因此，V25對人
類高手的實戰表現，可以與高水準國際象棋 AI相當了。

　　我可以肯定V25的搜索框架會給價值網路一個很高的權重（如0.9），只給走子至終局
數子很低的權重。如果局面平穩雙方展開圈地運動，那麼各局面的價值網絡分值差不多
，MCTS模擬至終局的大局觀會起作用。如果發生局部戰鬥，那麼價值網路就會起到主導作
用，對戰鬥分枝的多個選擇，價值網路都迅速給出明快的判斷，通過較為完整的搜索展開
，象國際象棋AI一樣論證出人類棋手看不懂的“AI棋”。

https://n.sinaimg.cn/sports/crawl/20170110/j4zJ-fxzkfvn1218631.jpg

　上圖為Master執白對陳耀燁。在黑子力占優的左上方，白20掛入，黑21尖頂奪白根據地
意圖整體攻擊，白22飛靈活轉身是常型，23團準備切斷白，這時Master忽然在24位靠黑
一子。Master比起之前的版本V18，感覺行棋要積極一些，對人類棋手的考驗也更多。可
以想見這裡黑內扳外扳兩邊長脫先各種應法很多，並不是很容易判斷。

　　但是如果有價值網路對各個結果進行準確估值，Master可能在下24的時候就已經給出
了結論，黑無論如何應，白棋都局勢不錯。陳耀燁自戰解說認為，24這招他已經應不好了
，實戰只好委屈地先穩住陣腳，複盤也沒有給出好的應對。同樣的招法Master對朴廷桓也
下過。

https://n.sinaimg.cn/sports/crawl/20170110/iSPW-fxzkfuk3297663.jpg

上圖為Master執白對羋昱廷，左上角的大雪崩外拐定式，白下出新手。白44職業棋手都是
走在E13長的，後續變化很複雜。但是Master卻先44打一下，下了讓所有人都感到震驚的
46扳，在這個古老的定式下出了從未見過的新手。這個新手讓羋昱廷短時間內應錯了，吃
了大虧。後來羋昱廷自戰回顧時說應該可以比實戰下得好些，黑棋能夠厚實很多，但也難
說占優。但是對白46這招還沒有完全接受。這個局面很複雜，有多個要點，Master的搜索
中是完全沒有定式的概念的。

　　我猜測它會各種手段都試下，由於價值網路比過去精確了，可以建立一個比較龐大的
搜尋樹，然後象國際象棋AI一樣多個局面都考慮過之後綜合出這個新手。這次 Master表
現得不怕複雜變化，而之前版本感覺上是進行大局掌控，複雜變化算不清繞開去。Master
卻經常主動挑起複雜變化，明顯感覺搜索能力有進步，算路要深了。

　　局面評估函數精確到一定程度突破了臨界點，就可以帶來搜索能力的巨大進步。因為
開發者可以放心地利用局面評估函數進行高效率的剪枝，節省出來的計算能力可以用於更
深的推導，表現出來就是算得深算得廣。實際人類的剪枝能力是非常強大的，計算速度太
慢，如果還要去思考一些明顯不行的分枝，根本沒辦法進行細緻的推理。在一個局面人類
的推理，其實就是一堆變化圖，眾多高手可能就取得一致意見了。而Master以及國際象棋
AI也是走這個路線了，它們能擺多得多的變化圖，足以覆蓋人類考慮到的那些變化圖給出
靠譜的結論。

　　但這個路線的必須依靠足夠精確的價值網路，否則會受到多種干擾。一是估值錯了，
好局面扔掉壞局面留著選錯棋招。二是剪枝不敢做，搜索大量無意義的局面，有意義的局
面沒時間做或者深度不足。三是要在葉子節點引入快速走子下完的“驗證”，這種驗證未
必靠譜，價值網路正確的估值反而給帶歪了。

　　從實戰表現反推，Master的價值網路品質肯定已經突破了臨界點，帶來了極大的好處
，思考時間大幅減少，搜索深度廣度增加，戰鬥力上升。AlphaGo團隊新的prototype，
架構上可能更簡單了，需要的CPU數目也減少了，更接近國際象棋的搜索框架，而不是以
MCTS為基礎的複雜框架。比起國際象棋AI複雜的人工精心編寫的局面評估函數，AlphaGo
的價值網路完全由機器學習生成，編碼任務更為簡單。

　　理論上來說，如果價值網路的估值足夠精確，可以將葉子節點價值網路的權重上升為
1.0，就等於在搜索框架中完全去除了MCTS模組，和傳統搜索演算法完全一樣了。這時的
圍棋AI將從理論上完全戰勝人，因為人能做的機器都能做，而且還做得更好更快。而圍棋
AI的發展過程可以簡略為兩個階段。第一階段局面估值函數能力極弱，被逼引入MCTS以
及它的天生弱點。第二階段價值網路取得突破，再次將MCTS從搜索框架逐漸去除返朴歸真
，回歸傳統搜索演算法。

　　由於價值網路是一個機器學習出來的黑箱子，人類很難理解裡面是什麼，它的能力會
到什麼程度不好說。這樣訓練肯定會碰到瓶頸，再也沒法提升了，但版本V18那時顯然沒
到瓶頸，之後繼續取得了巨大進步。通常機器學習是模仿人的能力，如人臉識別、語音辨
識的能力超過人。但是圍棋局面評估可以說是對人與機器來說都非常困難的任務。

　　職業棋手們的常識是，直線計算或者計算更周密是可以努力解決的有客觀標準的問題
，但是局面判斷是最難的，說不太清楚，棋手們的意見並不統一。由於人的局評估能
力並不太高，Master的價值網路在幾千萬對局巧妙訓練後超過人類是可以想像的，也帶來
了棋力與用時表現的巨大進步。但是可以合理推測，AlphaGo團隊也不太可能訓練無缺陷
的價值網路，不太可能訓練出國際象棋AI那種幾乎完美的局面評估函數。

　　我的猜測是，Master現在是一個“自信”的棋手，並不像之前版本那樣對搜索沒信心
靠海量模擬至終局驗算。它充分相信自己的價值網路，以此為基礎短時間內展開龐大的搜
尋樹，下出信心十足算路深遠的“AI棋”，對人類棋手主動挑起戰鬥。這個姿態它是有了
。但是它這個“自信”並不是真理，它只是堅定地這樣判斷了。肯定有一些局面它的評估
有誤差，如圍棋之神說是白勝的，Master認為是黑勝。人類棋手需要找到它的推理背後的
錯誤，與之進行判斷的較量，不能被它嚇倒。

https://n.sinaimg.cn/sports/crawl/20170110/d8Ib-fxzkfuh6523669.jpg

　上圖是Master執黑對孟泰齡。本局下得較早，Master雖然連勝但沒有戰勝太多強手，孟
泰齡之前有戰勝絕藝的經驗，心理較為穩定並不怕它，本局發揮不錯。Master黑69點入，
71、73、75將白棋分為兩段發起兇猛的攻擊。但是孟泰齡下出78位元靠的好手，局部結果
如下圖。

https://n.sinaimg.cn/sports/crawl/20170110/rxaD-fxzkfuk3297669.jpg

　黑棋右邊中間分斷白棋的四子已經被吃，白棋厚勢與左下勢力形成呼應，右上還有R17
斷吃角部一子的大官子。黑棋只吃掉了白棋上邊兩子，這兩子本就處於受攻狀態白並不想
要。這個結果無論如何應該是白棋獲利，Master發生了誤算，或者局面評估失誤。

　　現在職業棋手與AlphaGo團隊的棋藝競爭態勢可能是這樣的。AlphaGo不再靠MCTS主導
搜索改而以價值網路主打，思考時間大大縮短，在10秒以內就達到了極高棋力，之後時間
再長棋力增長也並不多。棋力主要是由價值網路的品質決定的，堆積伺服器增加搜索時間
對搜索深度廣度意義並不太大。所以Master已經較充分的展示了實力，並不是說還有棋力
強大很多的版本。這和國際象棋AI類似，兩個高水準AI短時間就能大戰100局，並不需要
人類那麼長的思考時間。

　　Master的60局快棋擊中了人類棋藝的弱點，它極為自信地主動發起挑戰敢於導入複雜
局面，而人類高手卻沒有能力在30秒內完善應對這些不太熟悉的新手。而這些新手並不
是簡單的新型，背後有Master的價值網路支援的龐大搜尋樹。如果價值網路的這些估值是
準確的，人類高手即使完美應對，也只能是不吃虧，犯錯就會被佔便宜。有些局面下，
價值網路的估計會有誤差，這時人類高手有懲罰Master的機會，但需要充足的時間思考，
也要有足夠的自信與 Master的判斷進行較量。這次60局中棋手由於用時太短心態失衡很
少做到，一般還是會吃虧。

　　以下是我對柯潔與AlphaGo的人機大戰的建議：

　　1。要對機器有足夠瞭解，不要盲目猜測。可以簡單的理解，它接近一個以價值網路
為基礎的傳統搜索程式。

　　2。要相信機器並不完美。如果它的局面評估函數沒有錯誤了，或者遠遠超過人，那
就和國際象棋AI一樣不可戰勝了。但圍棋足夠複雜，即使是幾千萬局的深度學習，也不可
能訓練出特別好的價值網路，一定會有漏洞與誤差。只是因為人的局面評估也不是太好，
才顯得機器很厲害。

　　3。這次機器會堅定而自信地出手，它改變了風格，在局面仍然膠著的時候不會回避
複雜變化。因為它的搜索深度廣度增加了，它認為自己算清了，堅定出手維護自己的判斷
，甚至會主動撲劫造劫。

　　4。機器的退讓是在勝定的情況下，它認為反正是100%獲勝了，就隨機選了一手。後
半盤出現這種情況不用太費勁去思考了，應該保留體力迅速下完，下一局再戰鬥。

　5。機器的大局觀仍然會很好，基於多次模擬數空，對於虛空的估計從原理上就比人強
，這方面人要頂住但不能指望靠此獲勝。還是應該在複雜局部中與機器進行戰鬥，利用機
器價值網路的估值失誤，以人對局面估計的自信與機器的自信進行比拼。機器是自信的，
人類也必須自信。也許機器評估正確的概率更大，但是既然都不完美，人類也可能在一些
局面判斷更為正確。

　　6。機器對稍複雜戰鬥局面的評估是有龐大搜尋樹支持的，並不會發生簡單的漏算，
不應該指望找到簡單的手段給機器毀滅性打擊。由於人類的思考速度慢，時間有限，不能
進行太全面的思考。應該集中思考自己判斷不錯的局面，圍繞它進行論證。如果這個判斷
正好是人類正確、機器錯誤，那人是有機會占優的。

　　通過以上分析，我對人機大戰柯潔勝出一局甚至更多局還是抱有一定期望的。希望柯
潔能夠總結分析圍棋AI的技術特點，增加自信，針鋒相對採取正確的戰略，捍衛人類的圍
棋價值觀。

https://sports.sina.com.cn/go/2017-01-10/doc-ifxzkfuk3300666.shtml

--

※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 123.192.114.161
※ 文章網址: https://www.ptt.cc/bbs/GO/M.1484071517.A.CBC.html
※ 編輯: zkow (123.192.114.161), 01/11/2017 02:15:16

推 s891234: 推 01/11 05:00

推 pikachu2421: 推 01/11 05:20

推 liaon98: 這整篇得建立在他猜測的AG已加大傳統方式權重的前提下 01/11 05:36

推 sunev: 這次master用的硬體規格還沒公布吧? 01/11 07:32

噓 suvroc: 怎麼讀到後面有種"暗夜吹口哨的"感覺XDD 01/11 08:53

→ moonlind: 跟我自己的想法很像但是難保不是錯的訊息還是太少 01/11 09:12

噓 Fonger: 捍衛人類的圍棋價值觀lol 01/11 09:41

→ arthurwang: 「捍衛人類的圍棋價值觀」 XDDD 01/11 10:13

推 lwei781: 錯的機率不低 01/11 10:15

推 brighton16: 演算法還不完善離神之一手還很遠，但快棋足夠贏人類了 01/11 10:35

推 MonkeyCL: 這文章也太長了 01/11 11:16

→ kenwufederer: 呵呵，看電腦下棋，會發現實地跟厚勢真的完美配合 01/11 11:36

→ kenwufederer: 就給對手贏不了的實地跟發揮不了的厚勢 01/11 11:37

→ kenwufederer: 電腦不是官子有問題，是算到第一步勝率就100% 01/11 11:37

→ kenwufederer: 後面當然就不用算了…有點程式概念都知道 01/11 11:38

→ kenwufederer: 只能等自我對戰或是慢棋來考驗看看 01/11 11:38

推 gamera: 價值網路除了BDT（加速決策樹）與BNN（貝式神經網路）這些 01/11 12:03

→ gamera: 蠻力的方法外，還有何關鍵詞可google? 01/11 12:04

→ ddavid: 用學術搜尋從引用關係開始讀Paper啊 01/11 13:27

推 Eric0605: 推 01/11 13:41

推 sck921: 你怎麼確定它的100%就是真的100%？ 01/11 14:59

→ sck921: 對方應棋後，AI自己估的勝率改變也不是第一次的事了 01/11 14:59

→ sck921: 想幾秒後落子，下一手想幾分鐘也是有的啊 01/11 14:59

→ birdy590: 這篇太看重價值網路其實從理論上判斷是不可能的 01/11 15:36

→ birdy590: 網路訓練的再成功裡面都沒有計算的成份還是接近直覺 01/11 15:36

→ birdy590: 靠直覺給出選擇做為優先驗證的對象是很好但直接拿來下 01/11 15:37

→ birdy590: 肯定強不到哪裡去 01/11 15:37

推 winken2004: 推這篇 01/11 17:30

→ kenwufederer: 他就是當下認為100%，對手下完還是一樣 01/12 09:31

→ kenwufederer: 勝率一直改變是正常的，而這個100%或許是80% 01/12 09:31

→ kenwufederer: 可能大於多少就直接不考慮其他路線 01/12 09:32

→ kenwufederer: 這些是否正確，只能等接近勝負的時候驗證了 01/12 09:33

→ kenwufederer: 我目前感覺，電腦掌握中腹能力真的太強 01/12 09:34

→ kenwufederer: 然後一手棋的價值充分體現，很常看到逆轉厚薄 01/12 09:35

→ kenwufederer: 這點實在高明，再來就是確定領先後的下法 01/12 09:35

→ kenwufederer: 讓人覺得找不到機會突破 01/12 09:36

→ aegis43210: 不過要另外提，目前只有master是真正的高者在腹 01/12 11:46

→ aegis43210: 去年三月的alphaGO就沒有那麼大膽 01/12 11:46

推 ksm: 推 01/12 14:48

推 airflow: 價值網路已經強到接近真理了嗎?那就展開一階來挑就好了啊 01/12 22:19

→ airflow: 想看 Master 下這種直覺棋來論證, 但那是不可能的 01/12 22:21

推 aegis43210: 八秒一手就接近直覺棋了，要論證要人類慢棋，AI快棋 01/12 22:32

推 yamiyodare: 看到一半還以為是要拔插頭 01/14 19:42

推 eric81123: 看完還是覺得拔插頭比較快 01/16 18:33

... <看更多>

alphago演算法在【AI入門】AlphaGo致勝原理分解--蒙地卡羅樹搜尋 - YouTube 的必吃

Transcript · 深度强化学习(5/5)： AlphaGo & Model-Based RL · 【AI入門】 AlphaGo 的致勝原理分解--蒙地卡羅方法#哥布林挨踢頻道 · 阿尔法狗用什么算法击败 ... ... <看更多>

alphago演算法在也就是AlphaGo，怎麼辦到的？電腦下棋要贏過人 ... - Facebook 的必吃

後來這樣的演算法就被電腦西洋棋程式深藍，於1997年用來打敗世界棋王卡斯巴羅夫。 ... AlphaGo的模擬算法有兩種，一種是估值函數，也就是利用迴歸分析，以歷史棋譜為 ... ... <看更多>

你可能也想看看

搜尋相關連結

#1. 淺談AlphaGo演算法 - StartUpBeat

AlphaGo 的演算法，是由四部分組成：. 1. Value Network，一個deep learning 的神經網絡（Convolutional/Space Invariant Artificial Neural Network, ...

#2. AlphaGo人工智慧技術 - 國立臺灣大學科學教育發展中心

此演算法的核心概念在於，一開始不要開放所有的子點作為選擇步驟的候選點，而是根據某些經驗法則，或是棋型分數，將所有著手給予排名，只有前若干名的著手 ...

#3. 淺談Alpha Go所涉及的深度學習技術｜數位時代BusinessNext

AlphaGo 技術的最後環節就是蒙地卡羅搜尋樹，相較於以前深藍所使用的搜索(搭配MinMax搜索算法以及Alpha-Beta修剪法，這裡就不再贅述)，由於我們並非 ...

#4. AlphaGo成為「棋靈王」是有多厲害？人工智慧未來又要怎麼走？

關於圍棋，比我專業的人太多，這邊我只簡單從演算法的角度講幾句。AlphaGo 中所使用的蒙地卡羅法，所搜尋的是最大勝率的一步，而並非最好的一步。也就是說，當AlphaGo ...

#5. 【AI入門】AlphaGo致勝原理分解--蒙地卡羅樹搜尋 - YouTube

Transcript · 深度强化学习(5/5)： AlphaGo & Model-Based RL · 【AI入門】 AlphaGo 的致勝原理分解--蒙地卡羅方法#哥布林挨踢頻道 · 阿尔法狗用什么算法击败 ...

#6. AlphaGo 再進化！通用演算法AlphaZero 再攻克幾種棋又有何難

現在DeepMind 研究人員想把AlphaGo Zero 變成更通用化、能下更多不同棋的演算法時，就需要重新思考處理方法。比如西洋棋和將棋，如何走子高度取決於 ...

#7. AlphaGo 之父：AI 打破人類圍棋3000 年來的盲點 - INSIDE

儘管1997 年IBM 的人工智慧DeepBlue（深藍）打敗了當時的西洋棋世界冠軍Garry Kasparov，圍棋一直是人工智慧領域的難解之謎。我們能否做出一個演算法來與 ...

#8. 人工智慧如何用來下圍棋（三）：世界新棋王AlphaGO的誕生

人工智慧AlphaGo憑藉深度學習技術，於2016年打敗世界棋王李世乭，一戰打響人工智慧 ... 該動物是一隻狗，而深度學習技術正是讓電腦透過演算法來找出這些屬於狗的特徵。

#9. 採用比AlphaGo 更複雜的演算法，日本麻將AI 在四個月內電爆 ...

不同於圍棋、撲克牌等遊戲，麻將擁有大量的隱藏資訊，無法採用AlphaGo 等AI 所使用的蒙特卡羅樹搜尋演算法。那麼 Suphx 使用怎樣的演算技術，解決隱藏 ...

#10. AlphaGo如何打敗世界棋王 - 心得報告

讀書會進度內容：AlphaGo Zero 演算邏輯. (1)複習上次會議應用AlphaGo Zero 演算法於井字遊戲範例，並詳述MCTS模擬過程；. (2)介紹AlphaGo Zero ...

#11. AlphaZero 登上《科學》雜誌封面：一個演算法就能通吃三大棋類

彼時DeepMind表示，棋類AI的演算法主要基於復雜的枚舉，同時需要人工進行評估，人們在過去幾十年內已經將這種方法做到極致了。而AlphaGo Zero在圍棋中的 ...

#12. 打開AlphaGo ！

法則是minmax 搜尋演算法（也稱minimax 法）. 加上alpha-beta 剪枝法的技巧。所謂minmax 方法，首先根據目前盤面，往下不. 谷歌DeepMind 團隊的AlphaGo 在今年3 月擊.

#13. 強化式學習：打造最強AlphaZero 通用演算法 - 博客來

Deepmind 將強化式學習應用於開發圍棋AI 上，打造出AlphaGo，並連續擊敗李世乭、柯潔等世界第一流的圍棋高手，這段情節想必你並不陌生。而接續發展出來的AlphaZero 不僅 ...

#14. 為什麼AlphaGo不懂圍棋規則也可以擊敗棋王？ - 關鍵評論網

AlphaGo 的模擬算法有兩種，一種是估值函數，也就是利用迴歸分析，以歷史棋譜為比對根據，算出目前棋局的可能勝負，另一種是快速布局網絡，也就是利用棋局 ...

#15. 26種演算7種資料結構數據分析邏輯思考/ 深度思考：從深藍到 ...

... 以及「網頁排名」等各種廣泛使用的基礎演算法。不用艱澀的專有名詞，步步口語分解，完全沒有概念的人也能漸進學習。 @@@深度思考：從深藍到AlphaGo，了解人工智慧 ...

#16. 由AlphaGo 看演算法聊聊演算法最基本的元素- SayDigi

能達成這樣的里程碑，其實要有兩個重要的關鍵，其一就是演算速度相當快速的電腦設備，另外一個就是合適又有效率的演算法，兩者缺一不可。

#17. AlphaGo 演算法 - Stories Tech Biz

AlphaGo 的演算法，是由四部份組成： 1. Value Network，一個deep learning 的神經網絡（Convolutional/Space Invariant Artificial Neural Network, CANN ...

#18. 碁人中華兒童棋院

困難的地方在於：高手不一定具備寫出好的演算法的能力（如何教導機器執行你的思考 ... 2015年的10月，作為歐洲圍棋冠軍的職業棋手樊麾二段已經私下與AlphaGo對弈了五 ...

#19. 由AlphaGo 看演算法聊聊演算法最基本的元素

由AlphaGo 看演算法聊聊演算法最基本的元素 ... 在近期科技界最引人注目的新聞話題，就是電腦與人類進行圍棋對弈，名為AlphaGo 的電腦擊敗世界排名相當高的韓國九段職業棋士 ...

#20. 國立台灣師範大學資訊工程研究所碩士論文

本研究將嘗試利用蒙地卡羅演算法、卷積式類神經網路的方法，嘗試使用、尋找各 ... 該篇論文於2016 年發表於Nature 論文期刊上，論文內說明了AlphaGo 圍棋下棋程式.

#21. 新版AlphaGo更聰明三天自己學會下圍棋 - TVBS新聞網

曾經讓各國好手眉頭深鎖的超級電腦AlphaGo，現在不必再依靠人類學習了，新一代稱為AlphaGo Zero，藉著新的演算法，在三天內就能從零學會圍棋並自創新 ...

#22. 人工智慧在音樂領域的應用(AI發展史與簡介- 一戰封神AlphaGo)

那我們談回AlphaGo，AlphaGo背後其實有多個演算法再做運算，但主要來說我們可以說他是以深度學習(Deep Leanring, 簡稱DL)與蒙地卡羅數搜尋(Monte Carlo tree search, ...

#23. 電腦如何擊敗世界棋王？—AlphaGo人工智慧技術 - 科學月刊

由Google DeepMind 所開發的人工智慧圍棋程式── AlphaGo，在今（2016）年3月以四 ... 因此，2006年蒙地卡羅樹搜尋演算法的提出，使得電腦圍棋的研究有驚人的突破。

#24. 以AlphaGo Zero演算法為基礎的Net2Net網路擴增方法

在遵從AlphaGo Zero 演算法的電腦圍棋程式中，殘差網路(residual network)區塊的數量通常影響了整個程式的強度。這篇論文提出了一個方法來加深殘差網路，同時也不降低 ...

#25. AlphaZero背後技術大解析！手把手用python實作完勝賽局 - 知勢

強化式學習：打造最強AlphaZero 通用演算法》透過圖說、實例， ... 日本將棋及圍棋三種棋藝，更打敗全球三大棋藝AI，連AlphaGo也成為它的手下敗將。

#26. 7. AlphaGo使用的搜尋演算法： (A) Depth-first ... - 阿摩線上測驗

AlphaGo 使用的搜尋演算法： (A) Depth-first演算法 (B) Breadth-first 演算法 (C) A* 演算法 (D) Monte Carlo演算法。教甄◇資訊科技概論專業(電腦科)- 109 年- 109 ...

#27. 機器學習筆記: 強化式學習-打造最強通用演算法(一) - 小狐狸事務所

Alpha Zero (可用於各種棋類, 通用式AI 演算法) : 2017-12 : 擊敗世界三大棋類冠軍AlphaGo Zero (圍棋), StockFish (象棋), Elmo (將棋).

#28. 機器學習、演算法、大數據(7) AlphaGo 與購物推薦系統

AlphaGo 是2014年開始由英國倫敦Google DeepMind開發的人工智慧圍棋軟體，見圖2，其原理是由人類輸入大量的棋譜到電腦，讓電腦紀錄每一步可能輸或贏的機率 ...

#29. 淺談Alpha Go所涉及的深度學習技術| 尹相志Allan's blog - 點部落

介紹AlphaGo的技術原理，以及背後涉及到的類神經網路以及深度學習技術。 ... 簡單的西洋棋)，所以他利用了像是MinMax搜索算法以及Alpha-Beta修剪法來 ...

#30. 超越人類認知的極限：從人工智慧到深度學習 - 科普寫作網路平台

相隔了20年，今天稱霸圍棋界的AlphaGo與1997年由IBM開發的西洋棋專用超級電腦的 ... 之下DeepMind所開發的AlphaGo屬於通用人工智慧的作品，通用人工智慧的系統演算法 ...

#31. 也就是AlphaGo，怎麼辦到的？電腦下棋要贏過人 ... - Facebook

後來這樣的演算法就被電腦西洋棋程式深藍，於1997年用來打敗世界棋王卡斯巴羅夫。 ... AlphaGo的模擬算法有兩種，一種是估值函數，也就是利用迴歸分析，以歷史棋譜為 ...

#32. AlphaGo演算法論文《精通圍棋博弈的深層神經網路和樹搜索 ...

AlphaGo演算法論文《精通圍棋博弈的深層神經網路和樹搜索演算法》 ... 這裡，我們介紹一種新的電腦圍棋演算法：使用「估值網路」評估棋局、「策略網路」選擇落子。

#33. 以AlphaGo+Zero演算法為基礎的Net2Net網路擴增方法

Net2Net Extension for the AlphaGo Zero Algorithm ... 在遵從AlphaGo Zero 演算法的電腦圍棋程式中，殘差網路(residual network)區塊的數量通常影響了整個程式的強度 ...

#34. AlphaGo Zero 演算法的Open Source 實做

Leela 的作者Gian-Carlo Pascutto 依照paper 的描述寫完了，放在GitHub 上的gcp/leela-zero： I made an open source re-implementation of AlphaGo ...

#35. 把李世乭打到退出棋壇的神秘高手 - AlphaGo｜方格子vocus

AlphaGo 使用了蒙地卡羅樹狀演算法結合二個深度神經網路的圍棋程式. 讓他不斷的學習圍棋直到擁有最強的下法，形成一個專形成一個專門下圍棋的程式。

#36. 電腦如何擊敗頂尖棋士？淺談AlphaGo人工智慧系統

2016 年谷歌DeepMind 團隊的AlphaGo 擊敗南韓九段圍棋棋王李世乭，震撼全世界， ... 在強化式學習部分，AlphaGo 採用一種稱為蒙地卡羅樹搜尋演算法（Monte-Carlo Tree ...

#37. 【尹相志深度學習實戰6】AlphaGO的秘密-AI強化學習

你知道強化學習嗎？打敗圍棋高手李世乭的AlphaGO總聽過吧？深度強化學習便是本課程的主題，尹相志老師將從基本概念到討論DQN思路、Q learning...等演算法，一直到最 ...

#38. 深度學習之棋盤遊戲 - 資訊工程學系

本專題構想發想於AlphaGo 圍棋對弈人工智慧，再加入深度學習中的蒙地卡羅樹搜尋或是其他演算法，從而嘗試模仿設計出有深度學習能力的程式。

#39. AlphaGo Zero 强化学习算法原理深度分析 - CSDN博客

AlphaGo Zero是Deepmind 最后一代AI围棋算法，因为已经达到了棋类游戏AI的终极目的：给定任何游戏规则，AI从零出发只通过自我对弈的方式提高， ...

#40. 【一文讀懂AlphaGo Zero演算法】白話蒙特卡洛樹搜尋和ResNet

alphago zero 令人驚豔不過，有些評論似乎渲染過度，把它的演算法說得神乎其神大數醫達創始人，cmu計算機學院暨機器人研究所博士鄧侃在本文中， ...

#41. 以python 自製AlphaGo 教學- HackMD

完整的使用教學和訓練資料，讓你一步步訓練自己的圍棋程式 · GTP 界面和內建的GUI ，訓練完後即可馬上使用 · 內附演算法文檔，方便一步步重新復現整個演算法 · TCGA 比賽資訊.

#42. 何謂人工智慧？Google AlphaGo是怎麼學習下圍棋的？未來AI ...

AlphaGo （這裡中文翻譯成阿發狗或是阿法狗）是一個圍棋(board game Go)軟體程式 ... 而基於仿生學、認知心理學，以及基於概率論和經濟學的算法等等也在逐步探索當中。

#43. 近期看到AlphaGo算法最清晰的解读 - 阿里云开发者社区

来看看人工智能专家同时又是围棋高手的如何解读AlphaGo算法的. ... 最近DeepMind团队（google旗下）的AlphaGo（一个围棋的AI）以4:1战胜顶尖人类职业棋手李世石。

#44. AlphaGo~人工智慧圍棋程式&星海爭霸@ 紫星齋 - 隨意窩

AlphaGo~人工智慧圍棋程式&星海爭霸AlphaGo演算法AlphaGo使用蒙特卡洛樹搜尋（Monte Carlo tree search），藉助估值網路（value network）與走棋網路（policy ...

#45. 人工智慧與AlphaGo

AlphaGo 與韓國棋王李世乭的圍棋大戰是這陣子資訊產業中最轟動的消息，賽前許多專家 ... 的限制以及演算法本身的缺陷，專家們很快就遇到了瓶頸，人工智慧就此步入寒冬。

#46. 從圍棋到星海爭霸- 淺談人工智慧的挑戰(1)

但由於早期的計算機的能力限制以及演算法的發展，較為複雜的棋類遊戲仍無法 ... 在與AlphaGo對弈後一年，2017年1月中國圍棋網忽然出現了一位神秘棋 ...

#47. 184期編者的話 - 中央研究院

Deep Blue 只需以brute force 快速分析, AlphaGo 則藉助於強化 ... 迄今已開發出許多強化學習訓練演算法, 其中最熱門者是以Deep Neural Network 來建構。

#48. 人類如何向AlphaGo學習出人頭地? :創客,強化學習,ADP - CTIMES

AI強化學習已經把這種「探索-利用」最佳平衡的演算法效益發揮出來，然而搭配著一種降低風險的策略。AlphaGo的目標總是將獲勝機率最大化放在第一位，它會 ...

#49. 跟李世乭對弈者來自台灣！「阿爾法圍棋」首席設計師 - 風傳媒

Google旗下的人工智能「阿爾法圍棋」（AlphaGo）9日成功打敗韓國圍棋高手 ... 棋類電腦程式通常會使用搜尋樹演算法，先列出對手下子的可能性，透過 ...

#50. 人工智慧60年AlphaGo開啟新里程 - i創科技

因此，當2016年3月，由Google DeepMind所研發的人工智慧軟體AlphaGo，出乎 ... 深層學習（deep learning）、增強式學習與蒙地卡羅樹狀演算法（Monte ...

#51. 資產管理AI演算法之運用 - 證券暨期貨市場發展基金會

證基會「金融大數據分析與演算法交易實務人才培訓班」. 33.另類技術分析. 林俊良/ FRM ... •AlphaGo Zero 只使用棋盤上的黑子和白子作為輸入，而之前版本.

#52. 台大教授：「戰勝自己」對AlphaGo而言，不只是口號 - 親子天下

世界圍棋棋王李世乭和電腦AlphaGo的「人機大戰」引起舉世關注，台大資工系教授林守德 ... 演算法總結：AlphaGo第一階段的訓練過程就像是把一個人關在房間裡，不告訴他 ...

#53. 新AlphaGo Zero 自學21 日擊敗上代AlphaGo 不靠人類知識

不過DeepMind 已經準備好用全新技術製作的「AlphaGo Zero」AI 系統，最大的進化是它毋須學習人類對弈，僅透過自我強化學習的演算法，就能學成精通的 ...

#54. IBM深藍時代已結束AlphaGo時代才開始 - 電子時報

大陸天才棋手柯潔和AlphaGo連戰三局，柯潔三戰皆敗引發全球矚目。 ... 單一系統或者演算法組合並不能直接解決各種問題，更不用說以前沒遇到過的問題。

#55. 終極版AlphaGo，DeepMind新演算法MuZero作者解讀

MuZero是一種機器學習演算法，因此自然要先了解它是如何使用神經網路的。簡單來說，該演算法使用了AlphaGo和AlphaZero的策略網路和值網路：.

#56. AlphaGo背後的搜索算法：蒙特卡羅樹搜索MCTS - 每日頭條

日前，圍棋人機大戰激戰正酣，代表人工智慧出戰的阿爾法狗（AlphaGo）已經2：0領先韓國世界冠軍李世石，展示出雄厚實力。AlphaGo最初通過模仿人類玩家 ...

#57. 張經緯觀點：Google AlphaGo人機大戰，熱鬧之外的省思

AlphaGo 採用4種主要演算法，其中評估網路及策略網路是深層多層人工神經網絡(deep artificial neural network)，人工神經網絡模仿生物神經經過反覆連接 ...

#58. 深度學習與機器學習的比較：差別為何？ - Zendesk

機器學習是一種人工智慧的應用，透過演算法剖析資料、吸收資料內容，然後 ... AlphaGo 的深度學習模型透過和專業棋手對奕，學會超越先前人工智慧境界 ...

#59. 細思極恐︱AlphaGo再進化MuZero不知規則卻精通十款電玩與 ...

2016年，AlphaGo戰勝韓國棋王李世乭，向全世界宣示了AI在遊戲領域的強悍實力。 ... MuZero的設計理念是考慮到現實應用環境，演算法不必全盤了解所有 ...

#60. AlphaGo 與深度學習工業自動化| 康耐視 - Cognex

首先，將對弈資料提供給電腦系統，以學習基本落子、規則及策略，然後使用深度學習演算法，根據實際對弈資料自我訓練。AlphaGo 採用兩種神經網 ...

#61. 技術文章-強化學習(Reinforcement Learning)：入門指南

最著名的強化學習案例就是AlphaGo，它是第一支打敗人類圍棋比賽世界冠軍的電腦程式。 ... 強化學習演算法的目標，即是於找出能夠產生最佳結果的策略。強化學習之所以能 ...

#62. 林順喜教授(師大資工系教授、AlphaGo圍棋程式製作人黃士傑 ...

那後來演算法有一個應用，就是人工智慧的應用，就是賽局程式的研發，需要大量演算法的技術，所以現在有一部份的主力都放在賽局程式的研發。 3. 在念研究所 ...

#63. 開發出AlphaGo而聲名大噪的DeepMind，如今又有新突破

Google的DeepMind團隊開發了一種人工智慧演算法似乎已經破解了一道難題，這問題在生物學界已經困擾了好幾十年，甚至幾乎不可能解決，不過如今卻被人工 ...

#64. AlphaGo zero 分享. ref. nature… | by Yu-Cheng Chang - Medium

DeepMind 團隊在此之後，仍然繼續精進AlphaGo 的架構與演算法，陸續有AlphaGo Master 及本篇主要的分享目標- AlphaGo Zero。

#65. 從Google AlphaGo VS 圍棋棋王談電腦人工智慧

AlphaGo 最初通過模仿人類玩家，嘗試匹配職業棋手的過往棋局，其資料庫. 中約含3000萬步棋著。 ... 圖像的人工智慧算法，DeepDream 除了能.

#66. 【專訪】AI 熱潮持續發燒：AlphaGo Zero 跳脫思維框架

... 快速提升應戰能力。2016 年以4:1 擊敗李世乭的AlphaGo，正是以此方式訓練出前無古人的棋術，它「吸收」人類棋譜、歸納出輸贏的模式，再藉由演算法 ...

#67. 「AI可以讓棋弈遊戲更好玩嗎？」之專家意見 - 台灣科技媒體中心

... 則與AlphaGo Zero類似，但AlphaZero的演算法有延伸到將棋與西洋棋。Muzero演算法則可自行學習遊戲的規則和策略，能夠用在比圍棋更複雜的遊戲。

#68. 谷歌用AI接管其資料中心冷卻系統可省電近4成 - 鏡週刊

同樣利用了強化學習的，還有此前在圍棋比賽中擊敗了頂級人類棋手的AlphaGo。在專案中，DeepMind將谷歌資料中心收集的大量相關資訊輸入給演算法，讓其 ...

#69. 深度學習搭配強化學習，「AlphaGo之父」預言：AI未來也懂跨 ...

被譽為「AlphaGo之父」的DeepMind工程師黃士傑這麼說。 ... 「AlphaStar用了更大的演算法，」黃士傑指出，AlphaStar已經在《星海爭霸2》的電競賽事中 ...

#70. 人腦PK 電腦》電腦運算終究技高一籌？對弈三小時Alphago 勝 ...

Google 旗下人工智慧公司Deep Mind 所開發的「AlphaGo」以5：0 擊敗歐洲 ... 和蒙地卡羅樹搜尋演算法，讓Alphago 模仿10 萬場賽事再不斷與自己對奕。

#71. 教你用Python和Keras建立自己的AlphaZero - 開源工場

在一篇名為『Mastering the Game of Go without Human Knowledge（無師自通圍棋）』的論文公布了一種新的演算法，AlphaGo Zero 用其100–0 大敗AlphaGo ...

#72. 優拓Paper Note ep.13: AlphaGo Zero - YOCTOL.AI

大約20 年後，Google 的DeepMind 團隊推出了所謂的AlphaGo 電腦圍棋程式， ... AlphaGo Zero 演算法可以視為一種近似策略迭代的演算法，這裡用MCTS 的 ...

#73. 兩分鐘論文--DeepMind如何用深度學習（AlphaGo）征服圍棋 ...

【看影片學英語】數萬部YouTube 影片，搭配英漢字典即點即查，輕鬆掌握單字發音與用法，長久累積看電影不必再看字幕。學這些英文用法：圍棋,演算法, ...

#74. 站在A.I.時代的交叉點：人類真的會被取代嗎？

AlphaGo 所用的演算法(Credits:《自然》期刊). Hassabis感嘆，第二局開頭一百子是人類與AlphaGo實力最接近的水平。去年李世石仍能下出反敗為勝的妙手， ...

#75. AI新棋王AlphaZero下一步打敗阿茲海默症- 國際 - 自由時報

該論文總結，比起下圍棋的AlphaGo Zero，AlphaZero應用更廣泛的強化學習演算法，幾小時內就能展現驚人的學習成果。 Google Deepmind認為，人類幾百年 ...

#76. 關於AlphaGo的想法 - 逍遙文工作室

之後隨著自我學習能力提升，無論是增強軟體（演算法、棋譜）或硬體（分散式電腦），AlphaGo肯定能完勝全世界圍棋第一名的人類棋手！

#77. 設計AlphaGo的台灣人黃士傑現身！解讀人機大賽背後秘辛

2011年以應用於電腦圍棋的蒙地卡羅樹搜尋創新演算法論文研究，取得博士學位，2012年也因為這個優秀成果，被網羅至英國DeepMind團隊，後來2014年公司以高達 ...

#78. Python機器學習 - iSpan資展國際

之前轟動全球的AlphaGo，更是機器學習發展以來的一大里程碑，AlphaGo 透過大量職業比賽的棋譜來「訓練」其演算法，讓AlphaGo 在短短的兩年內就站上了職業圍棋的頂端， ...

#79. AlphaGo能打敗大盤嗎? - StockFeel 股感

其實透過人工智能演算法解決難題的方法在投資領域上已行之有年，從投資組合最佳化到程式交易，都是透過演算法來分析大量數據、預測價格並尋找獲利 ...

#80. 「AlphaGo之父」大預言30年後AI也懂跨領域 - 今周刊

「AlphaStar用了更大的演算法，」黃士傑指出，AlphaStar已經在《星海爭霸2》的電競賽事中擊敗頂尖玩家，取得10勝1敗的戰績。而DeepMind也將在近期發表 ...

#81. 月眉書訊 Google開始玩圍棋之後 - 東華大學圖書館

AlphaGo 主要是以Deep Neural Networks(深層神經網路) 與MCTS(蒙地卡羅樹搜尋演算法)的技術來開發，並以自我學習的方式彌補訓練棋譜資料的不足。

#82. 人工智慧自學三天能勝出人類千年？ - 看雜誌

AlphaGo 項目的主要負責人David Silver表示：「過去人們普遍認為機器學習是基於巨量的大數據，但是從AlphaGo Zero身上，我們發現演算法比數據更重要。」.

#83. AlphaZero - Wikiwand

AlphaZero使用與AlphaGo Zero類似但更一般性的演算法，在不做太多改變的前提下，並將演算法從圍棋延伸到將棋與西洋棋上。AlphaZero與AlphaGo Zero不同之處在於：.

#84. All Article - 沐恩生醫光電股份有限公司

深度學習的演算法模型則以類神經網路（函數集合）為架構，並可用於AlphaGo下圍棋、自動駕駛等，也逐漸與醫療服務結合，締造出AI產業更高層次、更複雜的應用。人工智慧 ...

#85. AlphaGo贏中國棋王，戰力1年提升多少？ - 天下雜誌

Google背後的超級運算實力，也跟著這場比賽曝了光。廣告. AlphaGo團隊負責人席爾瓦賽後透露：「AlphaGo算法超越數據計算 ...

#86. 人機大戰柯潔首輪不敵AlphaGo 慨歎棋力接近上帝 - 鉅亨

人類棋手與人工智能AlphaGo 的圍棋「人機大戰」23 日在浙江登場，世界排名第一的中國棋手柯 ... 在這樣的演算法下，AlphaGo 2.0 對計算資源開銷極小。

#87. 人類與電腦要於圍棋桌鬥智， Google AlphaGo 要挑戰圍棋天才 ...

人工智慧是一直以來科技產業發展的重大技術與願景目標，而圍棋由於其多變性更被視為發展人工智慧演算法的終極目標， Google 認為AlphaGo 若能在圍棋 ...

#88. AlphaGo連勝人類：從圍棋複雜程度淺談人工智能重要性

無論何種機械學習演算法，其共通點是電腦會從過往經驗中學習，自動分析出最佳執行策略。以棋類為例，為什麼必須使用機械學習？原因在於其可能步法數量 ...

#89. 柯潔輸得不冤枉Master 版AlphaGo 進步神速可讓李世石版3 子

AlphaGo 能屢屢擊敗人類頂尖棋手，在於其先進的機器學習演算法。一直以來，圍棋被認為是傳統遊戲中對人工智能最具挑戰的項目。

#90. AlphaGo背後的搜尋演算法：蒙特卡羅樹搜尋&& alphago 程式碼

,要知道Alpha GO其實除了DL+RL外，同時也有用到MCTS. 全稱Monte Carlo Tree Search. 是一種人工智慧問題中做出最優決策的方法. 基本算法. 基本的MCTS 算法 ... ,2017年6月3 ...

#91. AlphaGo究竟是如何「思考」的？用國中生也能懂的語言說給你聽

Google Deepmind推出的AlphaGo人工智慧圍棋程式，在與李世乭九段的大戰 ... 這種「對局搜尋」有一個很明確的做法，叫做「MinMax」極小極大演算法。

#92. 只有AI 才能打敗AI： AlphaGo Zero 不需人類指導自學3天完勝 ...

因此，AI研究的長期目標是繞過這一步驟，創造算法，在沒有人類投入的時候自行處理數據。這種非監督式學習（Un-supervised learning），所有資料都沒有標準 ...

#93. AlphaGo 研究筆記 - 雲書苑-人工智慧AI學苑

谷歌旗下DeepMind 公司研發的AlphaGo ，戰勝了人類職業棋王選手，不為 ... AlphaGo 最後是選擇裝上MCTS 的演算法模組，讓它嵌入不同功能去評估變種。

#94. 擊敗了李世乭的圍棋人工智慧「AlphaGo」究竟是什麼？ - 財訊

做為一種人工智慧的AlphaGo，和IBM 在上個世紀打敗西洋棋大師卡斯帕羅夫的 ... 不僅如此，AlphaGo 借鑒了蒙地卡羅樹狀搜尋演算法（Monte Carlo Tree ...

#95. 人工智慧下出罕見妙手 - 科學人雜誌

從蒙地卡羅樹搜尋演算法到深度神經網路，層層剖析AlphaGo如何在圍棋比賽中出奇制勝。今年3月DeepMind公司的AlphaGo圍棋程式和多次世界冠軍南韓職業 ...

#96. [新聞] AlphaGo新演算法仍有一大弱點- 看板GO

AlphaGo 新演算法仍有一大弱點柯潔不要被它嚇倒[文/觀察者網專欄作者陳經] 2016年12月29日至2017年1月4日，谷歌AlphaGo的升級版本以Master為名， ...

#97. 用十分鐘瞭解《電腦到底是怎麼下棋的》 - SlideShare

寫在AlphaGo首次擊敗李世石的隔天！ ... 接著我上網搜尋了一下AlphaGo 演算法的資訊○ 找到了這些○ https://deepmind.com/alpha-go.html ○ Training ...

#98. AlphaGo第四戰輸了、為什麼連黃士傑也不知道原因？ - 三立新聞

Google推出的AlphaGo人工智慧圍棋程式，在與李世乭九段的大戰中，以五戰四 ... 這種「對局搜尋」有一個很明確的做法，叫做「MinMax」極小極大演算法。

關於 alphago演算法 ，我們在網路上蒐集到這些相關的討論、資訊與評價

「alphago演算法」的推薦目錄：

alphago演算法 在 Inside 硬塞的網路趨勢觀察 Facebook 的最佳解答

About author

alphago演算法 在 台灣物聯網實驗室 IOT Labs Facebook 的精選貼文

About author

alphago演算法 在 純靠北工程師 Facebook 的最讚貼文

About author

alphago演算法 在 范琪斐 Youtube 的精選貼文

About author

alphago演算法 在 PanSci 泛科學 Youtube 的最讚貼文

About author

你可能也想看看

搜尋相關連結

關於 alphago演算法，我們在網路上蒐集到這些相關的討論、資訊與評價

alphago演算法在 Inside 硬塞的網路趨勢觀察 Facebook 的最佳解答

alphago演算法在台灣物聯網實驗室 IOT Labs Facebook 的精選貼文

alphago演算法在純靠北工程師 Facebook 的最讚貼文

alphago演算法在范琪斐 Youtube 的精選貼文

alphago演算法在 PanSci 泛科學 Youtube 的最讚貼文