うまく変数が消えていく理由
以前話題にして、河下希さんに解決していただいた『「根 \(x_{1} ,x_{2},\dots,x_{n}\) と係数 \(a_{n-1}, \dots, a_{1}, a_{0}\) の関係」について』の件ですが、別解が作れましたので公開します(以下常体)。
元の \(n\) 次方程式の解を \(\alpha, \beta, \gamma, \delta, \epsilon, \zeta,\dots\) とし、その基本対称式を
\begin{align*}
s_{1} &= \alpha + \beta + \gamma + \delta + \epsilon + \dotsb \\
s_{2} &= \alpha\beta + \alpha\gamma + \alpha\delta + \dotsb \\
s_{3} &= \alpha\beta\gamma + \alpha\beta\delta + \alpha\beta\epsilon + \dotsb \\
s_{4} &= \alpha\beta\gamma\delta + \alpha\beta\gamma\epsilon + \dotsb \\
&\vdots
\end{align*}
とする。上式の右辺から左辺を引いたものを順に \(r_{1}, r_{2}, \dotsc\) とする(※ 「退職後は素人数学者」さんの \(r_{k}\) とは \((-1)^{k-1}\) 倍の違いがある)。\begin{align*}
r_{1} &= \alpha + \beta + \gamma + \delta + \epsilon + \dots – s_{1} \\
r_{2} &= \alpha\beta + \alpha\gamma + \alpha\delta + \dots – s_{2} \\
r_{3} &= \alpha\beta\gamma + \alpha\beta\delta + \alpha\beta\epsilon +
\dots – s_{3} \\
r_{4} &= \alpha\beta\gamma\delta + \alpha\beta\gamma\epsilon + \dots –
s_{4} \\
&\vdots
\end{align*}
ここで、\(s_{1}, s_{2}, \dotsc\) は元の \(n\) 次方程式の解と係数の関係から決まる具体的な数値(\(7\) や \(\dfrac{3}{2}\) など)とし、\(r_{1}, r_{2},\dotsc\) は \(\alpha, \beta, \dotsc\) を不定元とする多項式と見なすことにする(つまり、\(s_{k}\) の方は \(\alpha, \beta, \dotsc\) を不定元とする多項式とは見ない)。
「退職後は素人数学者」さんの手順では添字が大きい方の解から消去を進めていったが、ここでは \(\alpha\), \(\beta\), \(\gamma\) の順に消去を行う。つまり、
- \(r_{k}\; (k \geqq 1)\) を \(\alpha\) の多項式と見て、\(r_{2}\) 以降を \(r_{1}\) で割った余りを改めて \(r_{2}, r_{3}, \dotsc\) とおく。
- 新たな \(r_{k} \;(k \geqq 2)\) を \(\beta\) の多項式と見て、\(r_{3}\) 以降を \(r_{2}\) で割った余りを改めて \(r_{3}, r_{4}, \dotsc\) とおく。
- 新たな \(r_{k} \;(k \geqq 3)\) を \(\gamma\) の多項式と見て、\(r_{4}\) 以降を \(r_{3}\) で割った余りを改めて \(r_{4}, r_{5},\dotsc\) とおく。
ここまで進んだ時に、残った \(r_{4}, r_{5}, \dotsc\) から \(\alpha\), \(\beta\), \(\gamma\) が消えて、\(\delta\) 以降のみの多項式となっていることを示す。
まず、元々の \(r_{k}\) を次の形に書いておく。
\begin{equation}
\label{eq:1}
r_{k} = (\alpha+\beta+\gamma)\boxed{???} + (\alpha\beta + \beta\gamma + \gamma\alpha)\boxed{???} + (\alpha\beta\gamma)\boxed{???} + \boxed{~~~~???~~~~}
\end{equation}
ここで、\(\boxed{???}\) は \(\alpha\), \(\beta\), \(\gamma\) を含まない、残りの \(\delta\) 以降の文字(と定数 \(s_{k}\))のみからなる式を表すとする。\(k=1,2,3\) に対しては次のようになる。
\begin{align}
\label{eq:2}
r_{1} &= (\alpha+\beta+\gamma) + \delta+ \epsilon + \dots – s_{1} \\
\label{eq:3}
r_{2} &= (\alpha+\beta+\gamma)(\delta+\epsilon + \dotsb) +
(\alpha\beta+\beta\gamma+\gamma\alpha) + \delta\epsilon
+ \dots – s_{2} \\
\label{eq:4}
r_{3} &= (\alpha+\beta+\gamma)(\delta\epsilon + \dotsb) +
(\alpha\beta+\beta\gamma+\gamma\alpha)(\delta + \epsilon + \dotsb)
+ (\alpha\beta\gamma) + \delta\epsilon\zeta + \dots – s_{3}
\end{align}
この3つは、\(r_{1}\), \(r_{2}\), \(r_{3}\) が \(0\) のとき、次のように変形できる。
\begin{align}
\label{eq:5}
\alpha+\beta+\gamma &= – (\delta+\epsilon+ \dotsb) + s_{1} \\
\label{eq:6}
\alpha\beta+\beta\gamma+\gamma\alpha &= – (\alpha+\beta+\gamma)
(\delta+\epsilon + \dotsb) – (\delta\epsilon + \dotsb) + s_{2} \\
\label{eq:7}
\alpha\beta\gamma &= – (\alpha+\beta+\gamma)(\delta\epsilon + \dotsb)
– (\alpha\beta+\beta\gamma+\gamma\alpha)(\delta + \epsilon + \dotsb) –
(\delta\epsilon\zeta + \dotsb) + s_{3}
\end{align}
まず、\(r_{k} \; (k\geqq2)\) に対し上述の第一の余り算を実行したときに、\eqref{eq:1}の各部分がどうなるかを考えてみる。
- \eqref{eq:1}の \((\alpha+\beta+\gamma)\boxed{???}\) の部分に対しては、この余り算は、\eqref{eq:5}を使って \(\alpha+\beta+\gamma\) を消去する計算と同じことをしている。よって、\eqref{eq:1}の \((\alpha+\beta+\gamma)\boxed{???}\) の部分は \(\alpha\), \(\beta\), \(\gamma\) を含まない形に置き換わる。
- 前項で置き換わった部分は、第二以降の余り算では変化せずそのまま残り続ける(これは、以下の議論を読み進めれば自ずとわかる)。
- \eqref{eq:1}の \((\alpha\beta + \beta\gamma + \gamma\alpha)\) の部分は、すべての \(k\) に対して共通の式に置き換わる(\(\boxed{???}\) の部分はもちろん \(k\) によって異なる)。これは、\eqref{eq:3}, \eqref{eq:4}も含めてなりたつ。
- 同様に、\eqref{eq:1}の \((\alpha\beta\gamma)\) の部分もすべての \(k\) に対して共通の式に置き換わる。これは、\eqref{eq:4}も含めてなりたつ。
- \eqref{eq:1}の残りの \(\boxed{~~~~???~~~~}\) の部分は影響を受けない。
続いて、今得られた \(r_{k}\) たちを使って、\(r_{2}\) による第二の余り算を実行した時に、\eqref{eq:1}で元々 \((\alpha\beta + \beta\gamma + \gamma\alpha)\boxed{???}\) だった部分とそれ以降の部分がどうなるかを考える。
第一の余り算の結果、\(r_{2}\) には \(\beta^{2}\) の項が生じているが、この項は元々\eqref{eq:3}で \(\alpha\beta\) だった項(のみ)から生じている(これは \(r_{2}\) のみの特殊事情。\(r_{3}\) 以降は \(\alpha\beta\gamma\) を含む項を持つので、そこからも \(\beta^{2}\) の項が生じる)。また、\(r_{2}\) には \(\beta\) について \(3\) 次以上の項は生じない。
ここで、上述の
\eqref{eq:1}の \((\alpha\beta + \beta\gamma + \gamma\alpha)\) の部分は、すべての \(k\) に対して共通の式に置き換わる
が\eqref{eq:3}も含めてなりたっていたことに注意すれば、今度はこういうことになる。
- 元々\eqref{eq:1}で \(\underbrace{(\alpha\beta+\beta\gamma+\gamma\alpha)\boxed{???}}_{\text{\(\beta^{2}\) の項は \(\alpha\beta\)のみから生じ、\(\beta\) の \(3\) 次以上の項は生じない}}\) だった部分に対しては、第二の余り算は、その元の式から\eqref{eq:6}を使って \(\alpha\beta+\beta\gamma+\gamma\alpha\) を消去する計算と同じことをしている(消去するとき、\eqref{eq:6}右辺の \((\alpha+\beta+\gamma)\) は第一の余り算によって\eqref{eq:5}の右辺に置き換わった形になっていると考える)。よって、元々\eqref{eq:1}で \((\alpha\beta+\beta\gamma+\gamma\alpha)\boxed{???}\) だった部分は \(\alpha\), \(\beta\), \(\gamma\) を含まない形に置き換わる。
- 前項で置き換わった部分は、第三の余り算では変化せずそのまま残る。
- 元々\eqref{eq:1}で \((\alpha\beta\gamma)\) だった部分は、すべての \(k\) に対して共通の式に置き換わる。
- \eqref{eq:1}の残りの \(\boxed{~~~~???~~~~}\) の部分は影響を受けない。
最後に、今得られた \(r_{k}\) たちを使って、\(r_{3}\) による第三の余り算を実行した時に、\eqref{eq:1}で元々 \((\alpha\beta\gamma)\boxed{???}\) だった部分とそれ以降の部分がどうなるかを考える。
第二までの余り算の結果、\(r_{3}\) には \(\gamma^{3}\) の項が生じているが、この項は元々\eqref{eq:4}で \(\alpha\beta\gamma\) だった項のみから生じている。そして、\(r_{3}\) には \(\gamma\) の \(4\) 次以上の項は生じない。
よって、第二の余り算と同様に
- 元々\eqref{eq:1}で \(\underbrace{(\alpha\beta\gamma)\boxed{???}}_{\text{\(\gamma^{3}\) の項が \(\alpha\beta\gamma\) から生じる。\(\gamma\) の \(4\) 次以上の項は生じない}}\) だった部分については、第三の余り算は、その元の式から\eqref{eq:7}を使って \(\alpha\beta\gamma\) を消去する計算と同じである。よって、元々\eqref{eq:1}で \((\alpha\beta\gamma)\boxed{???}\) だった部分は \(\alpha\), \(\beta\), \(\gamma\) を含まない形に置き換わる。
- \eqref{eq:1}の残りの \(\boxed{~~~~???~~~~}\) の部分は影響を受けない。
となる。
以上から、第一〜第三の余り算で得られた \(r_{k} \; (k \geqq 4)\) では、
- 元々\eqref{eq:1}で \((\alpha+\beta+\gamma)\boxed{???}\) だった部分は、\(\alpha\), \(\beta\), \(\gamma\) を含まない形に置き換わっている。
- 元々\eqref{eq:1}で \((\alpha\beta+\beta\gamma+\gamma\alpha)\boxed{???}\) だった部分は、\(\alpha\), \(\beta\), \(\gamma\) を含まない形に置き換わっている。
- 元々\eqref{eq:1}で \((\alpha\beta\gamma)\boxed{???}\)だった部分は、\(\alpha\), \(\beta\), \(\gamma\) を含まない形に置き換わっている。
- \eqref{eq:1}の残りの \(\boxed{~~~~???~~~~}\) の部分は元々 \(\alpha\), \(\beta\), \(\gamma\) を含んでおらず、変化しなかった。
ので、\(\alpha\), \(\beta\), \(\gamma\) はどこにも残っていない。
以上で題意は証明された。厳密に言えば、余り算を実行する以上、各余り算での「割る式」がゼロ多項式にならないことを確かめる必要があるが、それはもうやればできるだけの話なので省略する。\(\square\)
この証明では、「余りを求めて、元の式を余りで置きかえる」という操作が線型性を持っている、ということがポイントで、\eqref{eq:1}の変化の仕方を各パーツごとに考えることができるのでこういう議論が可能だったわけです。
【補足】上の手順では、\(\alpha+\beta+\gamma\)→\(\alpha\beta + \beta\gamma + \gamma\alpha\)→\(\alpha\beta\gamma\) の順に消去を行っていますが、この順序を逆にしても同じ結果になります。つまり、
- \(r_{k} \; (k \geqq 4)\) から\eqref{eq:7}を使って \(\alpha\beta\gamma\) を消去
- その結果の \(r_{k} \; (k \geqq 4)\) から\eqref{eq:6}を使って \(\alpha\beta + \beta\gamma + \gamma\alpha\) を消去
- その結果の \(r_{k} \; (k \geqq 4)\) から\eqref{eq:5}を使って \(\alpha+\beta+\gamma\) を消去
としてもいいわけです。しかも、この順だと、二番目以降の手順で「\eqref{eq:6}や\eqref{eq:5}の右辺に現れる〜〜〜も置き換え済みと考える」ということをしなくてもすみ、そういう意味ではシンプルになります。
しかし、実際にこの手順で計算を行おうとすると、あらかじめすべての \(r_{k} \; (k \geqq 4)\) を\eqref{eq:1}の形に書き直しておく必要が生じます。おまけに、ここではわかりやすく説明するための例として「\(\alpha\), \(\beta\), \(\gamma\) の3文字の消去」しか考えていないわけですが、実際の計算では「\(\alpha\) の消去」「\(\alpha\), \(\beta\) の消去」「\(\alpha\), \(\beta\), \(\gamma\) の消去」…と逐次計算を進行させなくてはならないないところ、上の逆順の手順はこの反復計算にはまったく向いていません。
そういう欠点を持たないのが「まず \(\alpha\) の(1変数)多項式と見て \(r_{1}\) で割る」「次に \(\beta\) の(1変数)多項式と見て \(r_{2}\) で割る」…という「退職後は素人数学者」さんのアルゴリズムで、\eqref{eq:1}の形にわざわざ書き換えなくても、単なる1変数多項式の余り算という簡単な計算の繰り返しだけで必要な結果がすべて得られるのが強みです。つまり、概念上は上の逆順の手順がすっきりしてわかりやすいけれども、それを実際の計算手順として実装する上では「退職後は素人数学者」さんのアルゴリズムが大変にうまくできている、というわけです。
解の対称式の求値
この考察の過程で、今更になって気づいたことがあります。「退職後は素人数学者」さんのやり方で解 \(\alpha, \beta, \dotsc\) の多項式の次数を低減していくと、対称式の場合にすべての文字が消去されて具体的な値が求められるメカニズムが、実は私にはこれまできちんとわかっていませんでした。自分の理解を整理・確認するために、証明の形でちゃんと書いてみます。
以下では、\(\alpha\) の多項式として \(r_{1}\) で \(r_{k} \; (k \geqq 2)\) を割った余りを \(r’_{k}\) とし(余りを \(r_{k}\) と置き直すことはせず、別の記号 \(r’_{k}\) で表す。当然、導関数ではない)、\(\beta\) の多項式として \(r’_{2}\) で \(r’_{k} \; (k \geqq 3)\) を割った余りを \(r”_{k}\) とし…と繰り返して \(r’_{k}, r”_{k}, r”’_{k}, \dotsc\) を定めておく。前節での考察から、次のことがなりたつ。
- \(r’_{k} \; (k \geqq 2)\) は \(\alpha\) を含まず、\(\beta, \gamma, \dotsc\) のみを変数とする多項式である。
- \(r”_{k} \; (k \geqq 3)\) は \(\alpha\), \(\beta\) を含まず、\(\gamma, \delta, \dotsc\) のみを変数とする多項式である。
- \(r”’_{k} \; (k \geqq 4)\) は \(\alpha\), \(\beta\), \(\gamma\) を含まず、\(\delta, \epsilon, \dotsc\) のみを変数とする多項式である。以下同様。
解の多項式の対称式 \(P\) があるとき、対称式の基本定理より \(P\) は解の基本対称式の多項式として書ける。するとさらに、(解の基本対称式が \(r_{k}+s_{k}\) と書けることから)\(P\) は \(r_{k}\; (k=1,2,\dots,n)\) の多項式としても書ける。
\[ P = \phi(r_{1}, r_{2}, \dots, r_{n}) \qquad \text{\(\phi\) は何らかの \(n\) 変数多項式} \]
まず \(\alpha\) の多項式として \(\phi(r_{1}, \dots, r_{n})\) を \(r_{1}\) で割った余りを求めると、\(\phi(0, r’_{2}, \dotsc, r’_{n})\) となる(単なる \(\alpha\) の消去と同じ)。この値が \(P\) と等しい。
続いて、今の余りを \(\beta\) の多項式として \(r’_{2}\) で割った余りは
\[ \phi(0,0,r”_{3}, \dotsc, r”_{n}) \bmod r’_{2} \]
だが、ここで \(r”_{k} \; (k=3, \dots, n)\) が \(\beta\) を含まなかったことから、最後の「\(\bmod\; r’_{2}\)」はあってもなくても同じで、
\[ \phi(0,0,r”_{3}, \dotsc, r”_{n}) \]
となる。この値も \(P\) と等しい。
さらに、今の結果を \(\gamma\) の多項式として \(r”_{3}\) で割った余りは
\[ \phi(0,0,0,r”’_{4}, \dotsc, r”’_{n}) \bmod r”_{3} \]
だが、これも前段落と同様な理由で
\[ \phi(0,0,0,r”’_{4}, \dotsc, r”’_{n}) \]
そのものと等しい。この値も \(P\) と等しい。
この手続きを繰り返していくと、最後には
\[ \phi(0,0,\dots,0) \]
となって、変数がすべて消去されることがわかる。つまり、この時点で \(P\) の具体的な値が求まることになる。\(\square\)
こうやって途中過程を明確にしてみた結果、実はこれまでの私は、対称式の場合になぜ第二の余り算で \(\beta\) の \(1\) 次の項が消えるのか、なぜ第三の余り算で \(\gamma\) の \(2\) 次、\(1\) 次の項が消えるのか…の理由があやふやだった、ということに気づいたというわけです。「退職後は素人数学者」さんの元々の文書で言えば、「2. \(x_1, x_2 ,\dots ,x_n\) からなる多項式の次数低減」の
\(P\) と(1.6)の \(r_{2}\) を \(x_2\) の多項式と見て、\(P\) の \(r_2\) による剰余を改めて \(P\) とすれば次式となる。
\[ P=3(a_{1} +x_{1}^{2} )(a_{2} +x_{1} )-a_{2}^{3} \qquad (2.2) \]
\(P\) と(1.7)の \(r_3\) を \(x_1\) の多項式と見て、\(P\) の \(r_3\) による剰余を改めて \(P\) とすれば次式となる。
\[ P=-3a_{0} +3a_{1} a_{2} -a_{2}^{3} \qquad (2.3) \]
の部分で、式(2.2)で \(x_{2}\) の \(1\) 次の項がなぜ残らず \(x_{2}\) が完全に消去されるのか、式(2.3)で \(x_{1}\) の \(2\) 次、\(1\) 次の項がなぜ残らず \(x_{1}\) が完全に消去されるのか、「この実例ではそうなっている」以上の確たる理由がこれまでちゃんとわかっていなかったのです。
その時の私の頭にあった漠然とした考えを言語化してみると、こんな感じだったものと思われます。第一段落は正しいのですが、その後の「\(r_{2}\) も \(x_{1}, \dots, x_{n-1}\) のみを含み」がただの思い込みで、まさしく私が提示していた疑問そのものだったはずなのに、そのことが自分でもちゃんと掴めていないというヘマをやってしまっていました。
\(P\) も \(r_{1}\) も対称式だから、\(x_{n}\) の多項式として \(P\) を \(r_{1}\) で割った余りは \(x_{1}, \dots, x_{n-1}\) のみを含み、それらについて対称になっている。
それを \(P\) と置き直して \(x_{n-1}\) の多項式として \(r_{2}\) で割るなら、\(r_{2}\) も \(x_{1}, \dots, x_{n-1}\) のみを含み、それらについて対称だから、余りは \(x_{1}, \dots, x_{n-2}\) のみを含み、それらについて対称になっている。
以下同様に繰り返せば、最後に \(r_{n}\) で割ったとき、余りは \(x_{\triangle}\) をひとつも含まない。
ついでの話
ここではまたダッシュをつけずに単に \(r_{1}, r_{2}, \dots\) のように書く記法に戻します。\(r_{1}, r_{2}, \dotsc\) を求める際、「退職後は素人数学者」さんによる手順に限定せず「後の処理で利用する際に、\(r_{1}, r_{2}, \dotsc\) と同等の役割を果たす式が得られればよい」という考え方で臨むなら、もうちょっと直接的にそのような \(r_{1}, r_{2}, \dotsc\) の存在を示せることもわかりました。
例えば \(r_{4}\) の役割を果たす式だったら、
\(\delta, \epsilon, \dotsc\) のみからなる \(4\) 次式で、値が \(0\) となるべきもの
が得られればよいわけですが、元の方程式の左辺 \(f(x)\) は \((x-\delta)(x-\epsilon) \dotsm\) で割り切れるのですから、実際に余り算を実行すれば(つまり、\(\delta, \epsilon, \dotsc\) を文字としたまま、\(f(x)\) を \(x^{n-3}-(\delta+\epsilon+\dotsb)x^{n-4}+ \dotsb\) で割る)、その余りが所期の \(r_{4}\) になります。
実際に、\(n=4\) の場合の計算結果を、「退職後は素人数学者」さんが送ってくださいました。
まず、\(x^{4} +a_{3} x^{3} +a_{2} x^{2} +a_{1} x+a_{0}\) を \(x-x_{1}\) で割ると
\begin{align*}
\text{商}:& x^{3} + (x_{1} +a_{3})x^{2} + (x_{1}^{2} +a_{3} x_{1} + a_{2})x + x_{1}^{3} +a_{3} x_{1}^{2} + a_{2} x_{1} + a_{1} \\
\text{余り}:& x_{1}^{4} +a_{3} x_{1}^{3} + a_{2} x_{1}^{2} + a_{1} x_{1} + a_{0} \implies r_{4} \text{ が得られる。}
\end{align*}上記の商を \(x-x_{2}\) で割ると
\begin{align*}
\text{商}:& x^{2} + (x_{1} +x_{2} +a_{3})x + x_{1}^{2} + x_{1} x_{2} + x_{2}^{2} + a_{3} (x_{1} +x_{2}) + a_{2} \\
\text{余り}:& x_{1}^{3} + x_{1}^{2} x_{2} + x_{1} x_{2}^{2} +x_{2}^{3} + a_{3} (x_{1}^{2} + x_{1} x_{2} + x_{2}^{2}) + a_{2}(x_{1} +x_{2}) + a_{1} \implies r_{3} \text{ が得られる。}
\end{align*}上記の商を \(x-x_{3}\) で割ると
\begin{align*}
\text{商}:& x+x_{1} +x_{2} +x_{3} +a_{3} \\
\text{余り}:& x_{1}^{2} + x_{1} x_{2} +x_{1} x_{3} + x_{2}^{2} + x_{2} x_{3} + x_{3}^{2} + a_{3} (x_{1} + x_{2} + x_{3}) + a_{2} \implies r_{2} \text{ が得られる。}
\end{align*}上記の商を \(x-x_{4}\) で割ると
\begin{align*}
\text{商}:& 1 \\
\text{余り}:& x_{1} +x_{2} +x_{3} +x_{4} + a_{3} \implies r_{1} \text{ が得られる。}
\end{align*}
実は私はこの手続きに関しては、いい所まで考察を進めていながら実際の手順はもっとはるかに遠回りなものしか考えついておらず、上の「順次 \(x-x_{1}, x-x_{2}, \dotsc\) で割っていくだけ」という簡潔な手順は「退職後は素人数学者」さんから計算結果を送って頂くまで気づかなかったいうマヌケな体たらくでした(笑)。「退職後は素人数学者」さん、改めてどうもありがとうございました。
コメントを残す