被閱讀2377次,日期:2017-03-16 10:24:47
2016年3月15日,圍棋“人機大戰(zhàn)”在韓國首爾進行最后一盤的對弈,韓國棋手李世石九段執(zhí)黑中盤280手告負,至此他的總比分1比4不敵“阿爾法圍棋”,在本次“人機大戰(zhàn)”中宣告失敗。
阿爾法圍棋的主要工作原理是“深度學習”,其核心是“策略網(wǎng)絡”和“價值網(wǎng)絡”兩種不同的深度神經(jīng)網(wǎng)絡。其中,“價值網(wǎng)絡”主要任務是一邊推算一邊判斷局面,一旦局面處于明顯劣勢時,就直接拋棄一些路線;而“策略網(wǎng)絡”則是負責減少搜索的寬度,判斷某些棋步該不該走,防止隨便送子給別人吃。
這兩個工具通過相互合作做出一些類似于人們思考的行為,“挑選”出那些比較有前途的棋步,拋棄明顯的差棋,從而將計算量控制在計算機可以完成的范圍里,以期取得最終的勝利。
事實上阿爾法圍棋的強大,除了其本身采用了最先進的深度學習技術,利用深度神經(jīng)網(wǎng)絡對棋盤的局勢進行了預測之外,還在于研發(fā)團隊在前期搜集了大量圍棋名人對弈的歷史數(shù)據(jù),使得這一人工智能機器可以迅速汲取眾多圍棋高手的棋局,充分利用人類棋手的即有經(jīng)驗。
這次“阿爾法圍棋”的勝利,代表著人工智能在自主學習、自我完善等方面有了更進一步的發(fā)展。隨著人工智能的應用,必將會在推動計算機技術的不斷進步,人類生活方式的持續(xù)改善等方面產(chǎn)生更加深遠的影響,為人類社會做出巨大的貢獻。(本文來源:中國科普網(wǎng))