Если вы готовы использовать стандартные инструменты командной строки Linux, такие как, wc
и grep
тогда я думаю, что мой бесплатный процессор PGN, pgn-extract , выполнит большую часть предварительной обработки, необходимой для подсчета игр в каждой категории. Ниже приведен базовый скрипт bash, который я собрал в качестве доказательства концепции. Предполагается, что ваш файл игр называется inputfile.pgn
- настройте его по необходимости или передайте в качестве аргумента командной строки:
#!/bin/bash
# Output stats on castling.
src=inputfile.pgn
# Pre-process the games to allow textual analysis.
pgn-extract -C -V -N --notags --nochecks --linelength 10000 -s -o stripped.pgn ${src}
# Castling by white: detect a preceding move number.
grep '\. O-O ' stripped.pgn > Wkingside.pgn
grep '\. O-O-O ' stripped.pgn > Wqueenside.pgn
# Castling by black: detect no preceding move number.
grep '[^.] O-O ' stripped.pgn > Bkingside.pgn
grep '[^.] O-O-O ' stripped.pgn > Bqueenside.pgn
# Find games in which no castling occurred.
grep -v ' O-O ' stripped.pgn | grep -v ' O-O-O ' | grep -v '^$' > nocastle.pgn
# Output the FEN of the final position to include castling rights and
# look for the presence of rights.
pgn-extract -C -V -N --notags --nomovenumbers --linelength 10000 -s nocastle.pgn --dropply -1 -F | grep ' [wb] [KkQq]' > rights.txt
# Output the results - assumes valid Result tags in the source.
echo 'Number of games: ' `grep '^\[Result ' ${src} | wc -l`
echo 'W Kingside: ' `cat Wkingside.pgn | wc -l`
echo 'W Queenside: ' `cat Wqueenside.pgn | wc -l`
echo 'B Kingside: ' `cat Bkingside.pgn | wc -l`
echo 'B Queenside: ' `cat Bqueenside.pgn | wc -l`
echo 'Neither: ' `cat nocastle.pgn | wc -l`
echo 'Rights retained: ' `cat rights.txt | wc -l`
Я попробовал скрипт в базе данных KingBase (апрель 2019) и после удаления битых игр и дубликатов получил следующую статистику:
Number of games: 2072354
W Kingside: 1633762
W Queenside: 246158
B Kingside: 1670870
B Queenside: 128124
Neither: 69776
Rights retained: 24280
Показатель «ни того, ни другого» составляет около 3,4%, а «сохраненных прав» - около 1,2%. Если удаляются игры с 20 или менее слоями, то показатель «ни» уменьшается примерно до 2,9%, а «сохраненных прав» - около 0,7%.