📕 Description [en]: |
📕🐧"A free AI for the Go game, using Deep Learning, ranked among the best in the world"🐧📕.
KataGo is a strong open-source self-play-trained Go engine, with many improvements to accelerate learning (arXiv paper and further techniques since). It can predict score and territory, play handicap games reasonably, and handle many board sizes and rules all with the same neural net.
KataGo has begun its first public distributed training run! See https://katagotraining.org/ for more details, to download the latest and strongest neural nets, or to learn how to contribute if you want to help KataGo improve further!
As of 2023, KataGo remains one of the strongest open source Go bots available online. KataGo was trained using an AlphaZero-like process with many enhancements and improvements, and is capable of reaching top levels rapidly and entirely from scratch with no outside data, improving only via self-play. Some of these improvements take advantage of game-specific features and training targets, but also many of the techniques are general and could be applied in other games. As a result, early training is immensely faster than in other self-play-trained bots - with only a few strong GPUs for a few days, any researcher/enthusiast should be able to train a neural net from nothing to high amateur dan strength on the full 19x19 board. If tuned well, a training run using only a single top-end consumer GPU could possibly train a bot from scratch to superhuman strength within a few months.
Experimentally, KataGo did also try some limited ways of using external data at the end of its June 2020 run, and has continued to do so into its most recent public distributed run, "kata1" at https://katagotraining.org/. External data is not necessary for reaching top levels of play, but still appears to provide some mild benefits against some opponents, and noticeable benefits in a useful analysis tool for a variety of kinds of situations that don't occur in self-play but that do occur in human games and games that users wish to analyze.
Paper about the major new ideas and techniques used in KataGo: Accelerating Self-Play Learning in Go (arXiv). A few major further improvements have been found since then, which have been incorporated into KataGo's more recent runs. These and a few research notes can be found here.
Many thanks to Jane Street for supporting the training of KataGo's major earlier published runs, as well as numerous many smaller testing runs and experiments. Blog posts about the initial release and some interesting subsequent experiments:
• Accelerating Self-Play Learning in Go • Deep-Learning the Hardest Go Problem in the World.
KataGo's engine also aims to be a useful tool for Go players and developers, and supports the following features:
• Estimates territory and score, rather than only "winrate", helping analyze kyu and amateur dan games besides only on moves that actually would swing the game outcome at pro/superhuman-levels of play. • Cares about maximizing score, enabling strong play in handicap games when far behind, and reducing slack play in the endgame when winning. • Supports alternative values of komi (including integer values) and good high-handicap game play. • Supports board sizes ranging from 7x7 to 19x19, and as of May 2020 may be the strongest open-source bot on both 9x9 and 13x13 as well. • Supports a wide variety of rules, including rules that match Japanese rules in almost all common cases, and ancient stone-counting-like rules. • For tool/back-end developers - supports a JSON-based analysis engine that can batch multiple-game evaluations efficiently and be easier to use than GTP.
|
📕 Description [fr]: |
Une IA pour le jeu de Go faisant appel au Deep Learning, par la KataGo Team, initié par David J Wu (lightvector, dwu). En C++ & Python.
KataGo est une IA gratuite et multi-plateforme pour le jeu de Go (une IA spécialisée dans ce type de jeux), faisant appel au Deep Learning (un processus similaire à AlphaZéro avec de nombreuses améliorations et perfectionnements). Elle est classée parmi les meilleures au monde (puissance estimée à 5274 Elo/18D pour la v.g170, classée 1ere devant Leela Zero sur GitHub en Mars 2021 ; les humains atteignent 3800 Elo), communiquant avec le protocole GTP. Elle peut prédire le score et le territoire, jouer à des jeux à handicap raisonnable, et gérer plusieurs tailles de plateau et règles, le tout avec le même réseau neuronal.
KataGo est un puissant moteur de Go open-source autodidacte, avec de nombreuses améliorations pour accélérer l'apprentissage (papier arXiv et autres techniques depuis). Il peut prédire le score et le territoire, jouer à des jeux à handicap raisonnable, et gérer plusieurs tailles de plateau et règles, le tout avec le même réseau neuronal.
KataGo a commencé sa première session d'entraînement distribuée en public ! Voir https://katagotraining.org/ pour plus de détails, pour télécharger les derniers et plus puissants réseaux neuronaux, ou pour apprendre comment contribuer si vous voulez aider KataGo à s'améliorer encore !
En 2023, KataGo reste l'un des bots de Go open source les plus puissants disponibles en ligne. KataGo a été entraîné à l'aide d'un processus semblable à celui d'AlphaZero, avec de nombreuses améliorations, et il est capable d'atteindre des niveaux élevés rapidement et entièrement à partir de zéro, sans données extérieures, en s'améliorant uniquement par le biais de son propre jeu. Certaines de ces améliorations tirent parti de caractéristiques et d'objectifs d'entraînement spécifiques au jeu, mais de nombreuses techniques sont générales et peuvent être appliquées à d'autres jeux. Avec seulement quelques GPU puissants pendant quelques jours, n'importe quel chercheur/enthousiaste devrait être capable d'entraîner un réseau neuronal à partir de rien jusqu'à une force de dan d'amateur sur la carte 19x19 complète. S'il est bien réglé, un entraînement utilisant un seul GPU grand public haut de gamme pourrait permettre d'entraîner un robot à partir de rien jusqu'à une force surhumaine en l'espace de quelques mois.
À titre expérimental, KataGo a également essayé quelques moyens limités d'utiliser des données externes à la fin de sa campagne de juin 2020, et a continué à le faire lors de sa dernière campagne distribuée au public, "kata1", sur https://katagotraining.org/. Les données externes ne sont pas nécessaires pour atteindre les niveaux de jeu les plus élevés, mais elles semblent tout de même apporter quelques avantages légers contre certains adversaires, ainsi que des avantages notables dans un outil d'analyse utile pour divers types de situations qui ne se produisent pas dans le jeu en solo mais qui se produisent dans les jeux humains et les jeux que les utilisateurs souhaitent analyser.
Article sur les principales nouvelles idées et techniques utilisées dans KataGo : Accélérer l'apprentissage du jeu vidéo au go (arXiv). Quelques améliorations majeures ont été trouvées depuis lors, qui ont été incorporées dans les runs plus récents de KataGo. Vous trouverez ces améliorations et quelques notes de recherche ici.
Un grand merci à Jane Street pour son aide à l'entraînement des principaux runs de KataGo publiés précédemment, ainsi que pour les nombreux tests et expériences de moindre envergure. Postez des messages sur le blog à propos de la première version et de quelques expériences ultérieures intéressantes :
• Accélérer l'apprentissage du jeu vidéo en Go • Deep-Learning le problème de Go le plus difficile au monde.
Le moteur de KataGo se veut également un outil utile pour les joueurs de Go et les développeurs, et prend en charge les fonctionnalités suivantes :
• Estimation du territoire et du score, plutôt que seulement le " taux de victoire ", aidant à analyser les parties de kyu et de dan amateurs, en plus de ne porter que sur les coups qui feraient basculer le résultat de la partie à des niveaux de jeu pro/superhumains. • Se soucie de maximiser le score, de permettre un jeu fort dans les parties avec handicap lorsqu'on est loin derrière, et de réduire le jeu faible dans la partie finale lorsqu'on gagne. • Supporte les valeurs alternatives de komi (y compris les valeurs entières) et un bon jeu à handicap élevé. • Prend en charge des plateaux de 7x7 à 19x19 et, à partir de mai 2020, pourrait bien être le bot open-source le plus puissant, aussi bien en 9x9 qu'en 13x13. • Supporte une grande variété de règles, y compris des règles qui correspondent aux règles japonaises dans presque tous les cas courants, et d'anciennes règles de type comptage de pierres. • Pour les développeurs d'outils et d'applications de back-end - prend en charge un moteur d'analyse basé sur JSON qui peut regrouper efficacement des évaluations de jeux multiples et qui est plus facile à utiliser que le GTP. |