2026-03-09 15:13:26
阿尔法围棋-零是英国深度思维公司开发的人工智能围棋程序,属于阿尔法围棋系列的第四代版本,其核心突破在于完全摒弃人类棋谱输入,实现从零开始的自我对弈学习。
该程序在训练初期不依赖任何人类围棋知识,仅通过强化学习与蒙特卡洛树搜索算法进行自主迭代。训练启动3天后,阿尔法围棋-零即以100比0的全胜战绩击败第二代版本阿尔法围棋-李;持续训练40天后,进一步战胜第三代版本阿尔法围棋-大师,后者曾于正式比赛中完胜世界排名第一的柯洁及多位围棋世界冠军。
阿尔法围棋系列的发展脉络清晰体现技术演进:阿尔法围棋-樊于2015年首胜职业棋手樊麾;阿尔法围棋-李于2016年击败李世石;阿尔法围棋-大师随后战胜柯洁并横扫多位世界冠军。而阿尔法围棋-零标志着人工智能围棋进入纯自主学习新阶段,其算法架构与训练范式成为人工智能领域的重要研究范本。
热门推荐
评论区