(追記 2022/04/29) : 計算量を に改善できたので、追記しました。
問題
解法
包除原理の適用を考える。具体的には、
とおき、非負整数 に対して集合 を
で定め、
により答えを求める。
なので、 に対して および の値が分かれば
として計算することが出来る。そして、これは となる を全て決めてしまえば 以降変化することが無い。
以上を踏まえて、次のような DP を考える。
このテーブルを用れば、
として答えを求めることが出来る。
テーブルの計算を考える。初期化は容易であり、
とすればよい。更新は、 の降順に求めていくことにすれば、列 に を挿入する個数 で場合分けをし、以下のように計算できる。
ここで、 とおいた。二項係数および 、 の取得が でできる仮定すれば、調和級数の部分和の解析を用いることで、愚直に更新しても全体 でこのテーブルのすべての値を求めることが出来ることが分かる。
このままでも十分高速であるが、少しの工夫でさらに計算量を落とすことが出来る。 について の部分しか見なくてよいこと、 について の部分しか見なくてよいことから、べき乗等が で求まるという仮定の下で、テーブル更新の計算量は
となり を落とすことが出来る。また、以下に示すようにこの和は であるから、即ち である。
証明
より、示された。(証明終)
前計算に関して、二項係数に 、 に 、べき乗に だけかけるとすると、全体 でこの問題を解くことが出来た。
なお、 が入力として与えられるような場合で が非常に大きくなりうるときは、各 に対して を (ただし、 とした) だけかけて前計算するなどしてべき乗を高速に求められるようにすれば、全体 となる。なお、都度べき乗を計算しても である。
実装
更なる高速化について (2022/04/29 追記)
以下の dp において、各 に対して の部分だけを見ればよいということであった。
状態数は であるが、遷移に だけ掛かっていたためテーブル更新の計算量が全体で となっていた。ここでは、遷移の計算量を削減することで計算量を に落とす方法について述べる。即ち、元の問題は 時間で、入力で が与えられる場合の問題は、 の最大値を として 時間で解くことが出来る。
dp の更新式を変形をすると、次のようになる。
ここで と定義すれば、 は次のように計算できる。
を固定し、 とおく。各 に対する
が高速に求まればよいが、 と表すと、 求める和は以下のように書ける。
従って、多項式 および を以下のように定義すれば、
として計算される。 を固定すると は高速フーリエ変換などにより 時間で計算できるので、全ての に対して を計算するのは、 時間で可能である。従って、 全体を求めるのにかかる計算量は となる。
上記の解法のボトルネックは畳み込みの計算であり、定数倍は軽くない。 の形が特殊なことを利用すると、定数倍を多少改善できる。
として (記号が紛らわしいが、 は微分ではない)、 を固定すれば、 として計算される。従って、 次程度の多項式の畳み込みを 回以下だけ行うことで全ての を計算することが出来る。これは、 次程度の多項式の畳み込みを 回行うよりも定数倍が良い。
なお、 としてよい理由は、 ならば が成り立つためである。
実装
での畳み込みということもあって遅いですね。