2026-03-09 23:03:06
AlphaGo Zero是谷歌DeepMind团队研发的围棋人工智能系统,其核心突破在于完全摒弃人类棋谱与先验知识,仅基于围棋基本规则,通过自我对弈与强化学习实现棋力跃升。该系统不依赖任何历史对局数据,而是以神经网络结合搜索算法,在左右互搏中不断优化落子预测与胜率评估,形成持续迭代的强版本。
在与此前击败李世石、柯洁及实现60连胜的AlphaGo Master(即AlphaGo 2.0)的直接对比中,AlphaGo Zero取得100比0的全胜战绩,证实其棋艺层级已全面超越所有基于人类知识训练的旧版AlphaGo。其40天内从零起步达到碾压Master的水平,训练仅需4块TPU与72小时即可胜过原版数月训练成果,展现出远超前代的效率与自主进化能力。
尽管AlphaGo Zero的中盘着法被职业棋手称为“来自未来的下法”,具有高度原创性与非常规性,但其开局仍遵循星位、点三三等人类公认合理选点,说明其策略生成并非脱离围棋本质逻辑。该系统所验证的纯自我学习范式,为人工智能在蛋白质折叠、新材料发现等复杂结构性问题中的应用提供了可迁移的技术路径。
热门推荐
评论区