2025-03-08

yukicoder contest 459 開催記

yukicoder でコンテストを開催しました：yukicoder.me

最近コンテストに出るだけで全然練習していない身ですが、作問は細々と続けていたのでコンテストを開催してみました。今回で 3 回目の yukicoder contest です。

過去回もまだ解いていなければ是非解いてもらえると嬉しいです：

問題について

A. Swing

ブランコのようなイメージで Swing と名付けました。実験（とオーバーフローに対する注意力）が重要な問題です。

B. Contest Coordinator

ABC387への言及を見て思いついた問題です。

$T = 2,\ X \gt Y$ で $(1,3,4,4,10,11,14)$ を選択したときの最適な並び順が $(14, 10, 11, 1, 3, 4, 4)$ になってしまってめちゃくちゃなのでモデリングが妥当ではなさそう。

解法に関しては、一度DPに向かってしまうと軌道修正が苦しいのではないかと思っています。

C. Prefix Removal

二重Σの順序を取り替える操作は主に数え上げを高速化する際によく行うので慣れておくとお得そうです。

個人的には、和を取る領域を二次元平面に描いてあげるとこの取り替えをスムーズに行いやすいです。

D. Make All Divisible

Bで崖を作らないのが大切という話をしておいて大崖を生成して反省。

元々の設定は解説にある言い換え後の問題だったんですが、そうすると最小化の対象が不自然に見えたので問題設定を少し弄って今の形になりました。

「十分大きな値は $k$ だけ減らしても答えが変わらない」の "十分大きな" がどれくらいなのかを正確に見積もるのはやや面倒ですが、実行時間に間に合うギリギリの値を閾値に設定すると間違いなく通ってしまいます。

E. Increasing Sliding Window Minimum

解説にあるように window サイズ $K$ が任意でも同じ計算量で解けるので、ぜひ考えてみてください。$K=2$ が分かればそう難しくないと思います。

元は全て $A _ i = -1$ の設定を考えていましたが、解説にあるように OEIS で簡単にヒットする答えになってしまったので今の設定になりました（全単射の作り方が面白いです）。

F. $((0 \And 1) \mathop{|} 2) \oplus 3$

行列累乗の式を丁寧に計算する方針でも解き得る気がしますが、苦しいと思います。

$1$ に対する遷移が $\begin{pmatrix} 1 & 1 \cr 2 & 2\end{pmatrix}$ という列が等しい行列になっていることに注目できれば解説の方針に合流します。

$0$ が続く部分に関する議論も、$0$ に対する遷移は $(1,0)$ 成分が $0$ の行列 $\begin{pmatrix} 3 & 1 \cr 0 & 2\end{pmatrix}$ で表せることが関係しています。

行列のべき乗の周期を利用した解法は準備時に想定できていませんでした。本当は線形で通して欲しい問題なので制約が甘かったです。

G. Good Modulo

商列挙の方針が初めに浮かぶ人も多そう。経験的に、商列挙で sqrt が付く解法は見方を変えると調和級数の log に落ちることが多い気がします（今回の問題はさらに loglog まで落とせますが）。

$X \log \log X$ を要求したい気持ちにもなりましたが、C++だけでも区別が難しそうで、Python の $X\log\log X$ vs. C++ の $X\log X$ に至っては恐らくどうにもならないので試す前に諦めました。

H. Simple Chicken Game

$3$ 人以上のゲームを考えたくて作った問題です。

問題名はチキンレースですが、本当の元ネタは Blackjack です。ディーラーとの勝負ではなかったり、枚数に制限がなかったりと違いが多く混乱の元になりそうだったので Blackjack という単語を登場させませんでした。

コインを投げても投げなくても順位の期待値が等しい場合の挙動を色々実験していると、今の設定で綺麗な性質が現れたので出題しました。

プレイヤー $i$ のスコアに $-i$ の補正項が入っているのは、後の手番の人は前の人の結果を見られる分だけ有利だからです。ただ、そうすると今度は後の手番の人の方が不利になるらしいです（※未証明）。例えば $N=5$ だと順位の期待値はプレイヤー $1$ から順に $\dfrac{327}{128}, \dfrac{327}{128}, \dfrac{390}{128}, \dfrac{420}{128}, \dfrac{456}{128}$ です。

解法について、解説にあるように最適戦略の証明は煩雑です。実験コードを書いて最適戦略を予想するのが contestant としては正攻法かと思います。特に、今回の場合は実験コードさえ正しく書くことが出来れば最適戦略の予想を立てるのは非常に簡単だと思います。

計算にあまり依存しない直感的な証明がもし出来たら教えてください。

ところで、ボーナスとして書いたように実は線形時間で解けるようで（テスターの rin さんに教えて頂きました）、びっくり。

余談：問題作成について

作問ツールを自作して遊んでいました：https://github.com/suisen-cp/cp-problem-maker

Rime など、有名なツールがあるので自作する意味はあまり無いと思います。

2024-12-26

評価点が等差数列で次数よりも多い場合の多点評価

yukicoder で出そうかと思いましたが Python を通すのが難しいうえに大したことないのでここで放流します。

問題

以下の問題を考えます。

問題

多項式 $\displaystyle f(x) = \sum _ {i = 0} ^ {n-1} f_i x ^ i$ と整数 $m, c, d$ が与えられる。各 $k=0,1,\ldots,m - 1$ に対して $f(c + kd) \bmod 998244353$ を求めよ。

本記事では $m \geq n$ の場合を考えます。また、$d \not\equiv 0 \pmod{998244353}$ を仮定します。

多点評価で $\Theta(m (\log m) ^ 2)$ や $\Theta(m (\log n) ^ 2)$ 時間で解けますが、少し工夫をすると $\Theta(n (\log n) ^ 2 + m \log m)$ 時間に落とせます。

ほとんど変わらないように見えますが、$n= 10 ^ 5,\ m = 4\times 10 ^ 6$ みたいな恣意的な状況を考えると価値があるかもしれないです。また、等差数列というと使いどころが無さそうですが、$d=1$ の場合はどこかで使えるかもしれません。

解法

$g(x) \coloneqq f(dx)$ とすると求めたいものは $k=0,1,\ldots,m - 1$ に対する $g(c/d + k)$ です。$g(0),g(1),\ldots,g(n-1)$ を多点評価で計算した後に Shift of sampling points of polynomials をすると $\Theta(n (\log n) ^ 2 + m \log m)$ 時間が達成されます。

2024-04-22

AtCoder Regular Contest 176 （Sponsored by Mynavi）D - Swap Permutation

問題

D - Swap Permutation

解法

問題を少し変更して $\displaystyle \sum _ {i = 0} ^ {N - 1} |P _ i - P _ {i + 1}|$ の総和を求める問題を考えます。ここで、$P _ 0 = P _ N$ とします (つまり円環上で隣接している項の差分の絶対値の和)。

元の $P$ における $P _ i, P _ j$ が最終的に (円環上で) 隣接するような操作の個数を $C _ {i, j}(M)$ とすると、円環 ver. の答えは $\displaystyle \sum _ {0\leq i\lt j\lt N} |P _ i - P _ j| C _ {i, j}(M)$ です。

$C _ {i, j}$ について、次の予想が立ちます。

$|j - i| \equiv 1 \pmod{N}$ なる全ての $(i,j)$ で $C _ {i, j}(M)$ は等しい
$|j - i| \not\equiv 1 \pmod{N}$ なる全ての $(i,j)$ で $C _ {i, j}(M)$ は等しい

この予想が正しいことは、$|j - i| \equiv 1 \pmod{N}$ なる $(i,j)$ に対する $C _ {i, j}(M)$ を $C _ 0(M)$ とし、$|j - i| \not\equiv 1 \pmod{N}$ なる $(i,j)$ に対する $C _ {i, j}(M)$ を $C _ 1(M)$ とすると次の漸化式が立つことから従います。

$$\begin{aligned} C _ 0 (0) &= 1, & C _ 0(M) &= \left(\binom{n}{2} - 2(n-3)\right) C _ 0(M - 1) + 4 C _ 1(M - 1) & \text{for\ } M\gt 0, \cr C _ 1 (0) &= 0, & C _ 1(M) &= 2(n-3) C _ 0(M - 1) +\left(\binom{n}{2} - 4\right) C _ 1(M - 1) & \text{for\ } M\gt 0. \end{aligned}$$

つまり $\begin{pmatrix} C _ 0(M) \cr C _ 1(M) \end{pmatrix} = \begin{pmatrix} \displaystyle\binom{n}{2} - 2(n-3) & 4 \cr 2(n-3) & \displaystyle\binom{n}{2} - 4 \end{pmatrix} ^ M \begin{pmatrix} 1 \cr 0 \end{pmatrix}$ です。

以上で円環 ver. の問題を解けたので、あとは端で隣接する部分の寄与を除けばよいです。

元の $P$ における $P _ i, P _ j$ が最終的に両端に位置するような操作の個数を $D _ {i, j}(M)$ とすると、円環 ver. の答えから $\displaystyle \sum _ {0\leq i\lt j\lt N} |P _ i - P _ j| D _ {i, j}(M)$ を引いた値が元の問題の答えです。

$D _ {i, j}$ について、次の予想が立ちます。

$i, j$ のうち端である (つまり $0$ または $N - 1$ である) ものの個数が等しい $(i, j)$ の間で $D _ {i, j}$ は等しい

この予想が正しいことは、$i, j$ のうち端であるものの個数が $k$ であるような $i, j$ に対する $D _ {i, j}(M)$ を $D _ {2 - k}(M)$ とすると次の漸化式が立つことから従います。

$$\begin{aligned} D _ 0 (0) &= 1, & D _ 0(M) &= \left(\binom{n}{2} - 2(n - 2)\right) D _ 0(M - 1) + D _ 1(M - 1)& \text{for\ } M\gt 0, \cr D _ 1 (0) &= 0, & D _ 1(M) &= 2(n-2) D _ 0(M - 1) +\left(\binom{n}{2} - (n - 2)\right) D _ 1(M - 1) + 4D _ 2 (M - 1)& \text{for\ } M\gt 0, \cr D _ 2 (0) &= 0, & D _ 2(M) &= (n-3) D _ 1(M - 1) +\left(\binom{n}{2} - 4\right) D _ 2(M - 1)& \text{for\ } M\gt 0, \cr \end{aligned}$$

つまり $\begin{pmatrix} D _ 0(M) \cr D _ 1(M) \cr D _ 2(M) \end{pmatrix} = \begin{pmatrix} \displaystyle \binom{n}{2} - 2(n - 2) & 1 & 0 \cr 2(n-2) & \displaystyle\binom{n}{2} - (n - 2) & 4 \cr 0 & n - 3 &\displaystyle \binom{n}{2} - 4\end{pmatrix} ^ M \begin{pmatrix} 1 \cr 0 \cr 0 \end{pmatrix}$ です。

以上より本問題を $O(N + \log M)$ 時間で解けました。

提出: Submission #52669440 - AtCoder Regular Contest 176

2024-03-09

yukicoder contest 420 開催記

前回のコンテストで重くし過ぎたことを反省してやや軽めにしようと思っていたんですが、結局後ろが大変になってしまいました。

言い訳をさせて頂くと、テスター作業を依頼する前に設定していた難易度は☆1.5 - 2.0 - 2.5 - 3.0 - 3.0 - 3.5 - 3.5 - 4.0でした。

A - Zero-Sum Submatrices

ギャグその①。

2022年に作っていた問題です。前回のF はこの問題からの派生です。

想定解の構築を直接思いつけなくても、解説の後半で説明している再帰的な構築はよく見る気がします。

B - Prime Sum

ギャグその②。

一番最初に考えた設定では構築ありで $X _ i \geq 1$ でした。この場合は全ての $i$ に対して $X _ i = 1$ とすれば条件を満たすんですが、流石に度が過ぎるかと思い $X _ i \geq 2$ にしました。

この問題のように、与えられたペアを表す辺を張ってできるグラフで考えると上手くいく問題というのはよく見ますが、私は初見で結構感動した覚えがあります。cp-unspoiler とかは結構お気に入りの問題で、競プロの説明に使ったこともあります。

C - Minimize Inversions of Deque

前回の B に引き続いて転倒数に関する問題。

操作を後ろから考えると良い性質が見える問題というのもよくあって、例えば前回の C もそうでした。

ABCのE, F辺りに置かれそうという印象です。

D - Decreasing Modulo Nim

結論がかなり面白くてお気に入りです。

一番最初に考えた設定は $m \to \infty$ としたものでした。ただ、これだと通常の Nim の勝敗判定と全く同じになってしまったので、もう一捻り加えました。

明らかに $x$ に関する制約が厄介なので、初手で先手が $x$ を $0$ にしてしまうことを考えようというのが解説の 1 行目の気持ちです。そこから先の考察は比較的素直だと思います。

$x$ という global な (?) 値が存在するので、山毎の Grundy 数を求めて～、という解法は棄却する必要があります。

E - Constrained Permutation

区間スケジューリングを題材に作りました。この問題も性質が綺麗でお気に入りです。

以下のコードに示した貪欲法で $k$ が条件を満たすかを判定できます。

# ranges: 閉区間のリスト
def check(k, ranges):
    n = len(ranges)
    # 左端の昇順にソート
    ranges.sort_by_left_bound()
    # 右端の最小値を管理する優先度付きキュー
    pq = MinPriorityQueue()
    j = 0
    for v = k+1, k+2, ..., k+n:
        while j < n and ranges[j].left <= v:
            pq.push(ranges[j].right)
            j += 1
        # 条件1
        if pq.empty():
            return False
        # 条件2
        if pq.pop().right < v:
            return False
    return True

上記のコードにおける条件1は左端の(多重)集合にのみ依存しており、この部分で False が返らないような条件を考えているのが解説の初手に対応します。条件2に関しては、直感的には $k$ が小さい方が有利そうであり、実際にその通りであることを解説で証明しています。

証明がやや難しいので、未証明で通した人が多そうです。

F - Trees on Graph Paper

出題方法にかなり悩んだ問題です。

初めは次数 1 の頂点がちょうど $K$ 個の良い全域木を数えたかったのですが、私が解けなかったので次数 1 の頂点の $x$ 座標の積の和という奇妙な設定になりました。DPの遷移が $x$ 座標に依存するようにしたのは Berlekamp–Massey 防止策です。

ナイーブな DP を考えると考えるべき情報が多く遷移を詰めるのが大変ですが、考察を進めると僅か 3 状態のシンプルなDPになります。

解説に余談として書いた良い全域木の個数とフィボナッチ数の関係が面白いです。OEISで解けるので出題は出来ませんが...

G - Generalized Hitting Set

解説に気合が入っているのでぜひ最後まで読んでほしい。

包除のような謎の係数 (この係数の正体は解説②で説明されます) が現れるのが面白いと思っています。「上位集合系のゼータ変換 → 各点積 → 下位集合系のゼータ変換」というアルゴリズムも個人的には違和感があって面白いと思っています。解説の最後に変種として紹介している問題の解法は更に不思議な感じになっています。

$n = 24$ という過激な制約は、各 $i\in\lbrace 0,1,\ldots,n\rbrace,\ T\subseteq\lbrace 1,2,\ldots,n\rbrace$ に対して $\lvert S _ j \cap T\rvert = i$ を満たす $j$ の個数を数える DP 解 (空間 $\Theta(n 2 ^ n)$ / 時間 $\Theta(n ^ 2 2 ^ n)$) を TL,ML の両方で落とそうとしたためです。

ところで、問題準備中に PyPy に関して謎の現象に遭遇しました。以下の2つのコードの違いは 40 行目あたりの del b の有無のみなんですが、実行時間が 800 ms 程度も変わっています。原因が分かる人がいたら教えてください。

H - Sum of Products of Interval Length

唯一解法から作った問題です。

いわゆる(?)同じものの連続に関する包除ですが、その勉強がてら作りました。

積の和典型で上手くDPすれば分割統治FFTで $\Theta(n (\log n) ^ 2)$ 時間で解けるようです。

2023-11-22

階乗 mod 素数

Many Factorials を準備したので宣伝を兼ねて。

$N! \bmod P$ ($P$ は固定された素数) をたくさんの非負整数 $N$ に対して評価する状況を考える。

$N$ の上限が小さい (例えば $N \leq 10 ^ 7$ が保証される) 場合

$N$ の上限を $M $ とする。

予め $N! \bmod P$ を全ての $N=0,1,\ldots,M $ に対して前計算しておくことで、各クエリを定数時間で処理できる。

$N$ の上限が大きい場合

本記事の本題。

方法① 埋め込み

$N \geq P$ ならば $N! \equiv 0 \bmod P$ なので、$N\lt P$ を仮定する。

適当なブロックサイズ $B$ を決めて $(iB)! \bmod P\ (i=0,1,\ldots,\lfloor (P-1) / B\rfloor$ を時間を掛けて計算し、その結果をソースコードに直接埋め込む。各クエリは前計算の結果として得られている $(\lfloor N/B\rfloor B)!$ からの差分だけを計算することで $O(B)$ 時間で処理できる。

なお、定数倍改善として、$\lfloor N/B\rfloor B$ と $(\lfloor N/B\rfloor + 1) B$ のうちより $N$ に近い方からの差分を計算するという方法が考えられる。$(\lfloor N/B\rfloor + 1) B \geq P$ となるケースに注意する必要があるが、この場合は $(P - 1)! \equiv -1 \pmod{P}$ (ウィルソンの定理 - Wikipedia) を用いて $(P - 1)!$ からの差分を計算するとよい。

この方法は手軽だが、次の点に注意する必要がある。

$P$ が実行時に与えられる場合は使えない
ソースコード長の制限により $B$ を小さく取れないことがある

方法② $(iB)! \bmod P$ の実行時計算

本節の内容は(現在は削除されている)min_25さんの記事で紹介されていた手法を元にしている。

$(iB)! \bmod P$ を実行時に計算することで方法①の弱点を克服する。

以下では Shift of Sampling Points of Polynomial (以下評価点シフトと呼ぶ) を道具として認める。詳細については Shift of Sampling Points of Polynomial | cp-library-cpp などを参照。

簡単のため $B = 2 ^ K$ とする。また $\displaystyle f _ i(x) \coloneqq \prod _ {j = 1} ^ {2 ^ i - 1} (2 ^ i x + j) = (2 ^ i x + 1) (2 ^ i x + 2) \cdots (2 ^ i x + 2 ^ i - 1)$ と定める。

$f _ K(0), f _ K(1), \ldots, f _ K(\lfloor P/2 ^ K\rfloor)$ を計算することが目標である。

さて、$f _ i$ と $f _ {i + 1}$ の間には次の関係が成り立つ。

$$\begin{aligned} f _ {i + 1} (x) &= \prod _ {j = 1} ^ {2 ^ {i + 1} - 1} (2 ^ {i + 1} x + j) \\ &= \left(\prod _ {j = 1} ^ {2 ^ i - 1} (2 ^ {i + 1} x + j)\right)\cdot (2 ^ {i + 1} x + 2 ^ i) \cdot \left(\prod _ {j = 1} ^ {2 ^ i - 1} (2 ^ {i + 1} x + 2 ^ i + j)\right) \\ &= \left(\prod _ {j = 1} ^ {2 ^ i - 1} (2 ^ i (2x) + j)\right)\cdot 2 ^ i (2x + 1) \cdot \left(\prod _ {j = 1} ^ {2 ^ i - 1} (2 ^ i (2x + 1) + j)\right) \\ &= f _ i(2x) \cdot f _ i(2x + 1) \cdot 2 ^ i (2x + 1). \end{aligned}$$

つまり $f _ i(0), \ldots, f _ i(2 ^ i - 1)$ が既知であると仮定すれば、次の手続きにより $f _ {i + 1}(0), \ldots, f _ {i + 1}(2 ^ {i + 1} - 1)$ を計算することができる。

評価点シフトを用いて $f _ i(2 ^ i), f _ i(2 ^ i + 1), \ldots, f _ i(2\cdot 2 ^ {i + 1} - 1)$ を計算する。
- 評価点シフトを用いるための前提条件として、$f _ i(0), f _ i(1), \ldots, f _ i(\deg f _ i)$ が既知でなければならないことに注意する。今回は $\deg f _ i = 2 ^ i - 1$ より条件を満たしていることを確認できる。
各 $j = 0, 1, \ldots, 2 ^ {i + 1} - 1$ に対する $f _ {i + 1}(j)$ を、$f _ {i + 1}(j) = f _ i(2j) \cdot f _ i(2j + 1) \cdot 2 ^ i (2j + 1)$ により得る。

1 は $O(i 2 ^ i)$ 時間で、2 は $O(2 ^ i)$ 時間で可能である。結局 $f _ 0(0) = 1$ から初めて上記の手続きを繰り返すことで $O(\sum _ {i = 0} ^ {K - 1} i 2 ^ i) = O(K 2 ^ K)$ 時間で $f _ K(0), \ldots, f _ K(2 ^ K - 1)$ を得ることができる。

$2 ^ K \leq \lfloor P/2 ^ K\rfloor$ の場合、最後に $f _ K(0), \ldots, f _ K(2 ^ K - 1)$ に対してもう一度評価点シフトを用いることで $f _ K(2 ^ K), f _ K(2 ^ K + 1), \ldots, f _ K(\lfloor P/2 ^ K\rfloor)$ を得ることができる。これは $O((P / 2 ^ K) \log P)$ 時間で可能である。

結局、$2 ^ K$ を $\sqrt{P}$ 付近に取れば、前計算は $O(\sqrt{P} \log P)$ 時間で行うことができる。

実用においては、$K$ をより小さく取って前計算に時間を掛け、$1$ 回のクエリ処理に掛かる時間を短くするとよい (実験結果を参照)。

方法③ $(iB)! \bmod P$ の実行時計算 + オフライン処理による高速化 (1)

クエリをオフラインで処理してよいと仮定する。

$(iB)! \bmod P$ を前計算しておけば、各クエリは $\displaystyle (\lfloor N/B\rfloor B)! \cdot N(N-1)\cdots(N-(N\bmod B)+1)$ として計算できる。$(\lfloor N/B\rfloor B)!$ は前計算の結果から既知なので、各 $N$ に対する $N(N-1)\cdots(N-(N\bmod B)+1)$ を高速に計算したい。

つまり、$\displaystyle f(a,b)\coloneqq \prod _ {i = 0} ^ {b - 1} (a - i)$ と定義すれば、$f(N, N \bmod B)$ が計算したいものである。

各クエリで $N \bmod B$ が全て等しい場合は比較的容易であり、その値を $R$ として、$\displaystyle \prod _ {i = 0} ^ {R - 1} (x - i)$ を $R$ 点ずつに分けて多点評価すると $O( (R + Q) (\log R) ^ 2)$ 時間となる ($Q $ はクエリの数)。

一般にはこのような性質は成り立たない。しかし、$0\leq i\leq b$ なる整数 $i$ に対して $f(a, b) = f(a, i) \cdot f(a - i, b - i)$ が成り立つことを用いて $N \bmod B$ を $2$ 冪の和に分解することで、$b$ の種類数を高々 $\lfloor \log _ 2 (B-1) \rfloor$ に減らすことができる。

具体的には、例えば $N = 49,\ N \bmod B = 13 = 2 ^ 0 + 2 ^ 2 + 2 ^ 3$ のとき $f(49,13) = f(49, 2 ^ 0) \cdot f(49 - 2 ^ 0, 2 ^ 2) \cdot f(49 - 2 ^ 0 - 2 ^ 2, 2 ^ 3)$ のように分解する。

つまり各 $t = 0, 1, \ldots, \lfloor \log _ 2 (B-1) \rfloor$ に対して $\displaystyle \prod _ {i = 0} ^ {2 ^ t - 1} (x - i)$ を高々 $Q$ 個の点で評価すればよく、計算量は $\displaystyle O\left( \sum _ {i = 0} ^ {\lfloor \log _ 2 (B-1)\rfloor - 1} (2 ^ i + Q) i ^ 2 \right) = O(Q (\log B) ^ 3 + B (\log B) ^ 2)$ となる。

$B$ を $\sqrt{P}$ 付近に取ると、前計算と併せて全体で $O(Q (\log P) ^ 3 + \sqrt{P} (\log P) ^ 2)$ 時間となる。

この方法でも、実用上は $B$ をより小さく取って多点評価の回数を減らした方が速い (実験結果を参照)。

方法④ $(iB)! \bmod P$ の実行時計算 + オフライン処理による高速化 (2)

方法③では多点評価を $O(\log B)$ 回に分けて行ったが、まとめて $O((Q + \sqrt{P}) (\log P) ^ 2)$ 時間で行うことができる (参考: yukicoder Paint and Fill 解法詳細解説 | Mathenachia)。

この方法では $B$ の大きさによる実行時間への影響は小さい (実験結果を参照)。

実験

$P = 998244353,\ Q = 5\times 10 ^ 5$ のランダムケースで $K = \log _ 2 B$ を動かして実行時間 (秒) を計測した。なお、③' は除算を用いない高速な多点評価を用いて③を高速化したものである。コードの詳細については factorial mod prime · GitHub を参照。

方法＼$K$	$7$	$8$	$9$	$10$	$11$	$12$	$13$	$14$	$15$
②	0.80	0.53	0.46	0.56	0.90	1.6	3.0	6.0	12
③	1.0	1.1	1.3	1.7	2.2	2.7	3.4	4.1	4.9
③'	0.90	0.78	0.83	1.0	1.3	1.6	2.0	2.5	3.4
④	1.6	1.4	1.3	1.3	1.3	1.4	1.6	1.7	2.1

$P$ が小さいため方法②が一番速いという結果になった。また、③や④はクエリをオンラインで処理できない一方で②はオンラインで処理ができるため、競技の文脈では (大抵の場合 $P \lt 2 ^ {31}$ なので) 方法②を使用するのが無難だと思われる。

実装

最も高速であった方法②で $K=9$ としたものの実装を以下に示す。

judge.yosupo.jp

2023-10-06

AtCoder Regular Contest 136 F - Flip Cells

未証明要素を多分に含む怪しい解法で通してしまった

問題

atcoder.jp

解法

ちょうど $n$ 回の操作で終了する確率を $f _ n$ とする。$f _ n$ を直接計算するのは難しいので、終了条件を無視して $n$ 回の操作を行った後に終了条件を満たしている確率 $g _ n$ を考える。また、終了条件を満たしている状態から終了条件を無視して $n$ 回の操作を行った後に再び終了条件を満たしている確率 $h _ n$ を考える。

このとき、$f,g,h$ の母関数 $F,G,H$ について $FH = G$ が成り立つ。

$H = 1$ (この $H$ は $h$ の母関数ではなく盤面の行数である) の場合を考える。$c _ 1$ 個の 1 がある状態から (終了条件を無視して) $n$ 回の操作を行うことで $c _ 2$ 個の 1 がある状態になる確率は、以下で定める行列 $T = (t _ {i, j}) _ {0\leq i\leq W,\ 0\leq j\leq W}$ に対して ${T ^ n} _ {c _ 2, c _ 1}$ と表せる。

$$t _ {i, j} = \begin{cases} j / W & \text{if } i = j - 1 \\ 1 - j / W & \text{if } i = j + 1 \\ 0 & \text{otherwise} \end{cases}$$

$H$ が一般の場合に話を戻すと、上記考察より $i$ 行目に操作した回数 $t _ i$ を固定して数えることで、$g _ n$ は次で表せる。なお、初期盤面で $i$ 行目に存在する 1 の数を $B _ i$ とした。

$$ g _ n = \dfrac{n!}{H ^ n} \sum _ {t _ 1 + \cdots + t _ H = n} \prod _ {i = 1} ^ H \dfrac{1}{t _ i !} {T ^ {t _ i}} _ {A _ i, B _ i}. $$

さて、Cayley–Hamilton の定理より、$T$ の特性多項式を $p(x) \coloneqq \det(xI - T) = \sum _ {k = 0} ^ {W + 1} p _ k x ^ k$ とすれば、任意の整数 $n \gt W$ および $0\leq i, j\leq W + 1$ に対して次が成り立つ。

$${T ^ n} _ {i, j} = - \sum _ {k = 0} ^ W {T ^ {n - (W + 1 - k)}} _ {i, j} \cdot p _ k.$$

これは、$i, j$ を固定して数列 $a ^ {(i, j)}$ を ${a ^ {(i, j)}} _ n\coloneqq {T ^ n} _ {i, j}$ と定めれば、$a ^ {(i, j)}$ が $W + 2$ 項間の線形漸化式を持つことを表している。

また、$a ^ {(i, j)}$ の母関数は、ある $W$ 次以下の $q ^ {(i, j)}(x)$ が存在して $\dfrac{q ^ {(i, j)}}{\mathrm{rev}(p)}$ と表せる。$\mathrm{rev}(p)$ は $p$ の係数列を反転したものであり、$\mathrm{rev}(p)(x) = x ^ {W+1} p(1/x)$ である。$q ^ {(i, j)}$ の計算については、$q ^ {(i, j)}(x) = \left(\mathrm{rev}(p)(x) \cdot \sum _ {n = 0} ^ W {T ^ n} _ {i, j} x ^ n\right) \bmod x ^ {W + 1}$ に従って行えばよい。

以上より、$g _ n$ は次のように表せる。

$$g _ n = \dfrac{n!}{H ^ n} \sum _ {t _ 1 + \cdots + t _ H = n} \prod _ {i = 1} ^ H \dfrac{1}{t _ i !} \lbrack x ^ {t _ i}\rbrack \dfrac{q ^ {(A _ i, B _ i)}}{\mathrm{rev}(p)}. \tag{1}$$

$h _ n$ についても全く同様に考えることで次のように表せることが分かる。

$$h _ n = \dfrac{n!}{H ^ n} \sum _ {t _ 1 + \cdots + t _ H = n} \prod _ {i = 1} ^ H \dfrac{1}{t _ i !} \lbrack x ^ {t _ i}\rbrack \dfrac{q ^ {(A _ i, A _ i)}}{\mathrm{rev}(p)}. \tag{2}$$

適当な整数 $D$ を決めて、式 $(1),(2)$ に基づいて $G, H$ を $\mathrm{mod}\ x ^ D$ で計算すると、$F \bmod x ^ D$ を計算することができる。

さて、$f _ n$ が $K + 1\ (K\leq \lfloor D/2\rfloor)$ 項間線形漸化式を持つと予想する。この予想が正しければ、Berlekamp–Massey のアルゴリズムによって $F(x) = \dfrac{P(x)}{Q(x)}$ なる $P, Q$ を計算できるので、求める期待値を $F'(1) = \dfrac{P'(1) Q(1) - P(1) Q'(1)}{Q(1) ^ 2}$ として計算できる (本当？収束などの条件を確認していないのでかなり怪しい)。

いくらか実験すると $K = HW$ が成り立ちそうだったので、$D = 2HW + \varepsilon$ 程度で定めると AC が取れる。

提出

Submission #46252219 - AtCoder Regular Contest 136

感想

やってることが何もかも怪し過ぎて駄目だろという感じ。

これは余談なんだけど、持っている Berlekamp–Massey が Library Checker で通っていたのにバグっていて、大惨事になってしまった。Hack Case がどういうものかは分かったので取り敢えず issue を投げておいた。

2023-09-25

AtCoder Regular Contest 118 F - Growth Rate

問題

atcoder.jp

解法

数列 $X$ を数える代わりに整数列 $D = (D _ 1, \ldots, D _ {N + 1})$ を $D _ 1 \coloneqq X _ 1,\ D _ i \coloneqq X _ i - A _ {i - 1} X _ {i - 1}\ (i \geq 2)$ と定めて $D$ を数える。

$D$ が次の条件をすべて満たすことが、$X$ が条件を満たすための必要十分条件である。

$\displaystyle \sum _ {i = 1} ^ {N + 1} D _ i \prod _ {j = i} ^ N A _ j \leq M $
$D _ 1\geq 1$
$D _ i \geq 0\ (i=2,3,\ldots,N+1)$

$D _ 1$ だけ範囲が異なるのが嫌なので改めて $D _ 1\gets D _ 1 - 1$ および $\displaystyle M\gets M - \prod _ {i = 1} ^ N A _ i$ とすれば、$D$ が次の条件をすべて満たすことが、$X$ が条件を満たすための必要十分条件である。

$\displaystyle \sum _ {i = 1} ^ {N + 1} D _ i \prod _ {j = i} ^ N A _ j \leq M $
$D _ 1\geq 0\ (i=1,2,\ldots,N+1)$

$\displaystyle P _ i\coloneqq\prod _ {j = i} ^ N A _ j$ と定めれば、これは次のように書き直すことができる。

$\displaystyle \sum _ {i = 1} ^ {N + 1} D _ i P _ i \leq M $
$D _ 1\geq 0\ (i=1,2,\ldots,N+1)$

$D$ を桁 DP の要領で数える。より具体的には $\displaystyle D _ i = \sum _ {j = 0} ^ {i - 1} d _ {i, j} P _ {j + 1}$ および任意の $j=1,2,\ldots,i-1$ に対して $0\leq d _ {i, j} \lt A _ j$ を満たすように $D _ i$ を桁 $(d _ {i, 0} \ldots, d _ {i, i - 1})$ へと分解して考える。そして、$j$ 桁目 $d _ {j + 1,j},d _ {j + 2,j},\ldots, d _ {N + 1, j}$ を同時に決めることを $j$ の降順に行っていく。以降、場合分けが煩雑になることを避けるため、$i\leq j$ なる $i, j$ に対して $d _ {i, j} = 0$ とする。

さて、いま、$j \gt t\ (t \geq 0)$ なる $j$ に対する $d _ {\ast, j}$ を既に決めたとする。残りの $j\leq t$ に対する $d _ {\ast, j}$ が満たすべき条件は次のように書ける。

$$\sum _ {i = 1} ^ {N + 1} \sum _ {j = 0} ^ t d _ {i, j} \dfrac{P _ {j + 1}}{P _ {t + 1}} \leq \left\lfloor \dfrac{M - \sum _ {i = 1} ^ {N + 1} \sum _ {j = t + 1} ^ N d _ {i, j} P _ {j + 1}}{P _ {t + 1}} \right\rfloor$$

$0\leq d _ {i, j} \lt A _ j$ の条件より $\sum _ {i = 1} ^ {N + 1} \sum _ {j = t + 1} ^ N d _ {i, j} P _ {j + 1}\lt (N+1) P _ {t + 1}$ であるから、ある整数 $x\ (0\leq x\lt N + 1)$ が存在して上式は次のように表せる。

$$\sum _ {i = 1} ^ {N + 1} \sum _ {j = 0} ^ t d _ {i, j} \dfrac{P _ {j + 1}}{P _ {t + 1}} \leq \left\lfloor \dfrac{M}{P _ {t + 1}} \right\rfloor - x$$

以降 $\left\lfloor \dfrac{M}{P _ j} \right\rfloor$ という形が良く現れるので、これを $M _ j$ と定める。以上より、次のような動的計画法を考えることができる。

$$\begin{aligned}\mathsf{dp}(t, x) \coloneqq{}& \text{全ての $i\gt j \leq t$ なる $i, j$ に対する $d _ {i, j}$ の決め方であって、} \\ & \text{$\displaystyle \sum _ {i = 1} ^ {N + 1} \sum _ {j = 0} ^ t d _ {i, j} \dfrac{P _ {j + 1}}{P _ {t + 1}} \leq M _ {t + 1} - x$ であるようなものの個数}\end{aligned}$$

このとき、答えは $\mathsf{dp}(N, 0)$ である。

まず、$\mathsf{dp}(0, x)$ の計算を考える。これは $\displaystyle \sum _ {i = 1} ^ {N + 1} d _ {i, 0} \leq M _ 1 - x$ なる $d _ {1,0},\ldots,d _ {N+1,0}\geq 0$ の決め方の個数なので、$\displaystyle \mathsf{dp}(0, x) = \binom{N + 1 + M _ 1 - x}{N + 1}$ である。

続いて $t\gt 0,\ 0\leq x\leq N$ に対する $\mathsf{dp}(t, x)$ の計算を考える。$x$ として $0\leq x\leq N$ を満たすものだけを考えれば十分なのは先述の通りである。

$M _ t = \dfrac{M _ {t + 1} - (M _ {t + 1} \bmod A _ t)}{A _ t}$ より $R _ t \coloneqq M _ {t + 1} \bmod A _ t$ と定めると $M _ {t + 1} - x = A _ t M _ t + R _ t - x$ である。

また $\displaystyle \sum _ {i = 1} ^ {N + 1} \sum _ {j = 0} ^ t d _ {i, j} \dfrac{P _ {j + 1}}{P _ {t + 1}} = \sum _ {i = t + 1} ^ {N + 1} d _ {i, t} + A _ t \sum _ {i = 1} ^ {N + 1} \sum _ {j = 0} ^ {t - 1} d _ {i, j} \dfrac{P _ {j + 1}}{P _ t}$ であるから、条件 $\displaystyle \sum _ {i = 1} ^ {N + 1} \sum _ {j = 0} ^ t d _ {i, j} \dfrac{P _ {j + 1}}{P _ {t + 1}} \leq M _ {t + 1} - x$ は次のように整理できる。

$$\sum _ {i = 1} ^ {N + 1} \sum _ {j = 0} ^ {t - 1} d _ {i, j} \dfrac{P _ {j + 1}}{P _ t} \leq M _ t - \left\lceil\dfrac{\left(\sum _ {i = 1} ^ {N + 1} d _ {i, t}\right) + x - R _ t}{A _ t}\right\rceil.$$

$\displaystyle s\coloneqq \sum _ {i = t + 1} ^ {N + 1} d _ {i, t}$ と定めるとさらに次のように表せる。

$$\sum _ {i = 1} ^ {N + 1} \sum _ {j = 0} ^ {t - 1} d _ {i, j} \dfrac{P _ {j + 1}}{P _ t} \leq M _ t - \left\lceil\dfrac{s + x - R _ t}{A _ t}\right\rceil.$$

従って、$\displaystyle \sum _ {i = t + 1} ^ {N + 1} d _ {i, t} = s,\ 0\leq d _ {i, t}\lt A _ t$ なる整数列 $(d _ {t + 1, t}, d _ {t + 2, t},\ldots,d _ {N + 1, t})$ の個数を $f(s)$ とすると、次が成り立つ。

$$\mathsf{dp}(t, x) = \sum _ {s = 0} ^ {(N-t+1)(A _ t - 1)} f(s) \cdot \mathsf{dp}(t - 1, \lceil (s + x - R _ t) / A _ t \rceil).$$

$0\leq x\leq N,\ 0\leq s\leq (N - t + 1)(A _ t - 1),\ 0\leq R _ t\leq A _ t - 1$ の下で、確かに再び $0\leq \lceil (s + x - R _ t) / A _ t \rceil\leq N$ が成り立っていることに注意する。

さて、$0\leq y\leq N$ なる整数 $y$ に対して $y = \lceil (s + x - R _ t) / A _ t \rceil$ を満たす $s$ の範囲は $(y A _ t + R _ t - x) - A _ t\lt s\leq (y A _ t + R _ t - x)$ である。

従って、$f(l,r)\coloneqq \sum _ {s = l + 1} ^ r f(s)$ と定めると次が成り立つ。

$$\mathsf{dp}(t, x) = \sum _ {y = 0} ^ {N} f((y A _ t + R _ t - x) - A _ t, y A _ t + R _ t - x) \cdot \mathsf{dp}(t - 1, y).$$

区間 $((y A _ t + R _ t - x) - A _ t, y A _ t + R _ t - x\rbrack$ の長さはちょうど $A _ t$ なので、$f((y A _ t + R _ t - x) - A _ t, y A _ t + R _ t - x)$ は、$0$ 以上 $A _ t$ 未満の整数からなる長さ $N - t + 2$ の数列であって、総和が $y A _ t + R _ t - x$ であるようなものの個数に一致する。

この数え上げは有名問題で、包除原理を用いることで次を得る。

$$\begin{aligned}& f((y A _ t + R _ t - x) - A _ t, y A _ t + R _ t - x) \\ &{}=\sum _ {i = 0} ^ {N - t + 2} (-1) ^ i \binom{N - t + 2}{i} \binom{(y A _ t + R _ t - x) - i A _ t + (N - t + 1)}{N - t + 1}.\end{aligned}$$

式の簡単のため $u\coloneqq N - t + 1$ と定めると、$\mathsf{dp}(t, x)$ は次のように表せる。

$$\begin{aligned} \mathsf{dp}(t, x) &{}= \sum _ {y = 0} ^ {N} \sum _ {i = 0} ^ {u + 1} (-1) ^ i \binom{u + 1}{i} \binom{(y A _ t + R _ t - x) - i A _ t + u}{u} \cdot \mathsf{dp}(t - 1, y)\\ &{}=\sum _ {y = 0} ^ {N} \mathsf{dp}(t - 1, y) \sum _ {i = 0} ^ {u + 1} (-1) ^ i \binom{u + 1}{i} \binom{(R _ t - x + (y - i) A _ t) + u}{u} .\end{aligned}$$

さて、$i\gt y$ のとき $R _ t + (y - i) A _ t \lt 0$ より $\displaystyle \binom{(R _ t - x + (y - i) A _ t) + u}{u} = 0$ である。また、$i\gt u + 1$ のとき $\displaystyle\binom{u + 1}{i} = 0$ である。従って、上式における内側の和で $i$ が動く範囲は $0$ 以上 $y$ 以下の範囲としてよい。

つまり、多項式 $a(z) = \displaystyle \sum _ {i = 0} ^ N (-1) ^ i \binom{u + 1}{i} z ^ i$ および $b(z) = \displaystyle \sum _ {i = 0} ^ N \binom{(R _ t - x + i A _ t) + u}{u} z ^ i$ について、$\lbrack z ^ y\rbrack (ab) = \displaystyle \sum _ {i = 0} ^ {u + 1} (-1) ^ i \binom{u + 1}{i} \binom{(R _ t - x + (y - i) A _ t) + u}{u}$ が成り立つ。

計算量を考える。$a(z), b(z)$ は各 $t,x$ に対してそれぞれ $O(N)$ 時間で計算できる。$b(z)$ の計算についてもう少し説明すると、これは $\displaystyle \binom{(R _ t - x + i A _ t) + u}{u} = \binom{(R _ t - (x - 1) + i A _ t) + u}{u}\cdot \dfrac{(R _ t - x + i A _ t) + u}{(R _ t - (x - 1) + i A _ t) + 1}$ を用いて SWAG で積をスライドさせながら求めることでならし $O(N)$ 時間が達成される。

$a(z)$ と $b(z)$ の積の計算は FFT を用いれば $O(N\log N)$ 時間である。これを全ての $t, x$ について行うので、全体 $O(N ^ 3 \log N)$ 時間となる。

本問題では $N$ は最大 $1000$ 程度にもなるので、このままでは実行時間制限に間に合わせることは難しい。

そこで、$A _ i \neq 1$ なる $i$ が高々 $\lfloor \log _ 2 M\rfloor$ 個しかないことに注目する。

$A _ t = 1$ の場合を考えると、任意の $x=0,1,\ldots,N$ について $\mathsf{dp}(t, x) = \mathsf{dp}(t - 1, x)$ が成り立つことが上記の議論から分かる。従って、$A _ t = 1$ の場合の遷移は $O(N)$ 時間で可能であるから、全体の計算時間は $O(N ^ 2 \log N \log M)$ となる。

これでも実行時間制限に間に合わせることは非常に厳しいが、$a(z)$ の FFT 結果をメモ化するなどの定数倍高速化を行うことで正答を得ることができる。

実装

atcoder.jp