「C# ドキドキライブコーディング!!」小島の分

C# ドキドキライブコーディング!!
～小島の分～
BuriKaigi 2021 @ Online
30th January 2021
Fujio Kojima
#BuriKaigi

普通にアルゴリズム作って AI 作成();
5
アルファ・ベータ法 - Wikipedia

alpha-beta法 (negamax法)
7
static int AlphaBetaEvaluate(Reversi reversi,
int depth, int alpha, int beta,
Func<Reversi, int> evaluate)
{
if (reversi.GetPieceCount(Reversi.Piece.None) ==
0 || depth <= 0)
return evaluate(reversi);
var movables = reversi.GetTakePointList();
if (movables.Count == 0) {
var localReversi = GetClone(reversi);
localReversi.Pass();
return -AlphaBetaEvaluate(
localReversi, depth - 1, -beta, -alpha, evaluate);
}
var scoreMax = int.MinValue;
foreach (var move in movables) {
var localReversi = GetClone(reversi);
localReversi.SetPiece(move);
var score = -AlphaBetaEvaluate(
localReversi, depth - 1, -beta, -alpha, evaluate);
if (score >= beta)
return score;
if (score > scoreMax) {
scoreMax = score;
alpha = Math.Max(alpha, scoreMax);
}
}
return scoreMax;
}

係数
• 係数
評価関数
8
static int Evaluate(Reversi reversi)
=> reversi.GetTakePointList().Count + FixedPieceCount(reversi) * FixedPieceCountRate;

• 5万回対戦 = 約300万局面
局面データの作成
13
1000対戦ごとに CSV ファイルに

自分の AI から呼ぶ
24
ReversiRunner での
データ作成に戻って繰り返す

学習1回目
25
まだまだ弱いが、
何度も繰り返すことで
強くなるはず!

今回の戦略と敗因
28
機械学習の API コールが
遅くてデータ作成に時間が
かかりすぎた
本番まで繰り返してる
余裕がない…

「C# ドキドキライブコーディング!!」小島の分

Recommended

Recommended

More Related Content

More from Fujio Kojima

More from Fujio Kojima (20)

Recently uploaded

Recently uploaded (10)