Miksei funktiota \(e^{-x^2}\) voi integroida? (Osa 2/2)
Milo Orlich
milo.orlich@alumni.aalto.fi
Tämä on artikkelin [3] jatko. Tässä osassa todistetaan Liouvillen lause. Tätä lausetta ja Lausetta 29 lukuun ottamatta artikkelin ensimmäisen osan tuloksia ja määritelmiä ei toisteta.
Jatkossa käytetään seuraavaa notaatiota.
Määritelmä 1. Jos laajennusta \(\mathbb K(\alpha)\) halutaan laajentaa lisää alkiolla \(\beta\), niin merkinnän \(\mathbb K(\alpha)(\beta)\) sijaan kirjoitetaan \(\mathbb K(\alpha,\beta)\). Ja samoin jos on monta alkiota \(\alpha_1,\dots,\alpha_n\), kirjoitetaan \(\mathbb K(\alpha_1,\dots,\alpha_n)\).
Toistetaan Liouvillen lauseen (eli artikkelin ensimmäisen osan Lauseen 29) väite:
Lause 2 (Liouville). Olkoot \(\mathbb K\) derivaatan suhteen suljettu kunta meromorfisia funktioita ja \(\alpha\in\mathbb K\). On olemassa kunnan \(\mathbb K\) alkeislaajennus \(\mathbb L\) ja sellainen \(y\in\mathbb L\), että \(y'=\alpha\), jos ja vain jos on olemassa sellaiset \(u_1,\dots,u_n,v\in\mathbb K\) ja \(c_1,\dots,c_n\in\mathbb C\), että
\[\alpha=\sum_{i=1}^nc_i\frac{u_i'}{u_i}+v'. \tag{1}\]
Liouvillen lauseen muoto on “jotain \(\Leftrightarrow\) jotain”, joten pitää todistaa, että implikaatio pätee molempiin suuntiin. Aloitetaan yksinkertaisemmasta implikaatiosta.
Todistus. Oletetaan, että on olemassa sellaiset \(u_1,\dots,u_n,v\in\mathbb K\) ja \(c_1,\dots,c_n\in\mathbb C\), että yhtälö (1) pätee. Jos on olemassa sellaiset \(i_0\in\{1,\dots,n\}\) ja \(a\in\mathbb K\), että
\[\frac{u_{i_0}'}{u_{i_0}}=a',\]
niin määritellään \(\bar v:=v+c_{i_0}a\). Jos tämä tapahtuu uudelleen, niin määritellään \(\bar v\) kunnan \(\mathbb K\) alkioiden derivaattoja vastaavien yhtälön (1) termien summaksi. Voidaan siis olettaa, että jokaisella indeksillä \(i\) ei ole olemassa sellaista \(a\in\mathbb K\), että \(u_i'/u_i=a'\). Lisäksi voidaan olettaa, että välissä \(I\), jossa \(v\) ja kaikki funktiot \(u_j\) on määritelty, pätee \(u_i(x)\ne0\) jokaisella alkiolla \(x\in I\) ja indeksillä \(i\in\{1,\dots,n\}\), tai muuten otetaan osaväli \(J\subsetneq I\).
Määritellään nyt \(a_i:=\log u_i\) jokaisella \(i\in\{1,\dots,n\}\). Voidaan olettaa, että \(a_i\notin\mathbb K(a_1,\dots,a_{i-1})\), tai muuten \(a_i\) yksinkertaisesti ohitetaan. Sitten \(\mathbb L:=\mathbb K(a_1,\dots,a_n)\) on kunnan \(\mathbb K\) alkeislaajennus. Koska kaikki funktiot \(a_i\) sekä \(v\) kuuluvat kuntaan \(\mathbb L\), saadaan myös
\[y:=\sum_{i=1}^nc_ia_i+v\in\mathbb L.\]
Derivoimalla tämä saadaan
\[y'=\sum_{i=1}^nc_ia_i'+v'=\sum_{i=1}^nc_i\frac{u_i'}{u_i}+v'=\alpha.\]
Huomautus 3. Jos etsitään integraalifunktiota kunnan \(\mathbb K\) ulkopuolelta, ainoa mahdollisuus saada se on lisäämällä äärettömän monta logaritmifunktiota! Esimerkiksi rationaalifunktiolla \(\frac1x\) ei ole integraalifunktiota kunnassa \(\mathbb C(x)\), mutta kyllä on laajennuksessa \(\mathbb C(x)(\ln x)=\mathbb C(x,\ln x)\).
Liouvillen lauseen implikaation “\(\Rightarrow\)” todistus tulee olemaan melko pitkä ja tehdään eri tapauksissa. Ensin kerätään paljon apulauseita seuraavassa luvussa. Liouvillen lauseen implikaation “\(\Rightarrow\)” todistus alkaa sivulla . Todistus jatkuu eri tavalla riippuen siitä, onko kyseessä oleva funktio transkendenttinen eksponenttifunktio (niin kuin kirjoituksen otsikossa) vai algebrallinen.
Todistuksen perusainekset
Tehtävä 4. Tarkista, että seuraava yhtälö pitää paikkansa:
\[\frac{(f_1f_2\cdots f_n)'}{f_1f_2\cdots f_n}=\frac{f_1'}{f_1}+\cdots+\frac{f_n'}{f_n}. \tag{2}\]
Tulemme käyttämään sitä ja erikoistapausta
\[\frac{(fg)'}{fg}=\frac{f'}{f}+\frac{g'}g \tag{3}\]
pari kertaa jatkossa.
Meromorfisen funktion poolit
Määritelmä 5. Olkoot \(f\) ja \(g\) holomorfisia funktioita jossain kompleksitason avoimessa osajoukossa \(U\). Meromorfisen funktion \(\frac{f(x)}{g(x)}\) poolit (eli navat) ovat funktion \(g\) nollakohdat.
Huomautus 6. Ainoa poolien sovellus, jota käytämme jatkossa, on siinä tapauksessa, että kyseessä oleva meromorfinen funktio on rationaalifunktio eli kahden polynomin osamäärä \(\frac{P(x)}{Q(x)}\). Oletetaan, että \(P\) ja \(Q\) ovat keskenään jaottomat, ja jaetaan nimittäjä tekijöihin:
\[\frac{P(x)}{Q(x)}=\frac{P(x)}{\omega(x-z_1)^{a_1}(x-z_2)^{a_2}\cdots(x-z_n)^{a_n}}.\]
Tässä \(z_1,\dots,z_n\) ovat eri kompleksilukuja, \(\omega\in\mathbb C\) ja \(a_1,\dots,a_n\) ovat positiivisia kokonaislukuja. Tietysti \(P(z_i)\ne0\) kaikilla \(i\). Sanotaan, että \(z_i\) on funktion \(\frac{P(x)}{Q(x)}\) \(a_i\)-kertainen pooli, toisin sanoen poolin \(z_i\) kertaluku on \(a_i\). Huomaamme nyt, että rationaalifunktion derivaatta on sekin rationaalifunktio, ja sen poolien kertaluvut ovat välttämättä \(>1\): jos siis kirjoitetaan
\[\frac{P(x)}{Q(x)}=\frac{f(x)}{(x-z_i)^{a_i}},\]
jossa rationaalifunktio \(f(x)\) sisältää kaikki muut termit \((x-z_j)^{a_j}\), niin
\[\begin{aligned} \frac d{dx}\frac{P(x)}{Q(x)}&=\frac{(x-z_i)^{a_i}f'(x)-a_i(x-z_i)^{a_i-1}f(x)}{(x-z_i)^{2a_i}}\\ &=\frac{(x-z_i)f'(x)-a_if(x)}{(x-z_i)^{a_i+1}}, \end{aligned}\]
eikä \(z_i\) ole viimeisen osoittajan nollakohta.
Transkendenttisuudesta
Lemma 7. Olkoon \(\alpha\) transkendenttinen alkio ja olkoot \(P\) ja \(Q\) kaksi eri polynomia. Tällöin \(P(\alpha)\ne Q(\alpha)\).
Todistus. Jos \(P(\alpha)=Q(\alpha)\), niin \(\alpha\) on polynomin \(P-Q\) juuri. Transkendenttisuuden takia tämä tarkoittaa, että \(P-Q\) on nollapolynomi, eli \(P=Q\).
Lemma 8. Olkoon \(g(x)\in\mathbb C(x)\) rationaalifunktio, joka ei ole vakio. Tällöin funktio \(e^{g(x)}\) on transkendenttinen kunnan \(\mathbb C(x)\) suhteen.
Todistus. Oletetaan, että \(e^g\) on algebrallinen kunnan \(\mathbb K:=\mathbb C(x)\) suhteen. Silloin on olemassa sen minimipolynomi
\[P=X^n+f_{n-1}X^{n-1}+\dots+f_1X+f_0\in\mathbb K[X].\]
Derivoidaan yhtälö \(P(e^g)=0\) eli
\[e^{ng}+f_{n-1}e^{(n-1)g}+\dots+f_1e^g+f_0=0\]
saaden
\[\begin{aligned} ng'e^{ng}+\big(f_{n-1}'+(n-1)f_{n-1}g'\big)e^{(n-1)g}+&\\ \dots+(f_1'+g'f_1)e^g+&f_0'=0. \end{aligned}\]
On siis olemassa toinen \(n\)-asteinen polynomi, jonka arvo funktiolle \(e^g\) on nolla. Tämä on välttämättä polynomin \(P\) kerrannainen, ja korkeimman ja pienimmän asteen kertoimet ovat verrannolliset:
\[ng'=\frac{f_0'}{f_0}. \tag{4}\]
Kirjoitetaan rationaalifunktio \(f_0\in\mathbb C(x)\) osoittajan ja nimittäjän tulona lineaarisia, pareittain erillisiä tekijöitä:
\[f_0=\prod_{i=1}^m(x-z_i)^{\alpha_i},\quad m\in\mathbb N,\ z_i\in\mathbb C(x),\ \alpha_i\in\mathbb Z\setminus\{0\}.\]
Sen derivaatta on
\[\begin{aligned} f_0' =& \big[\alpha_1(x-z_1)^{\alpha_1-1}(x-z_2)^{\alpha_2}\cdots(x-z_m)^{\alpha_m}\big]+\cdots\\ & +\big[\alpha_m(x-z_1)^{\alpha_1}\cdots(x-z_{m-1})^{\alpha_{m-1}}(x-z_m)^{\alpha_m-1}\big]\\ = & \sum_{i=1}^m\alpha_i\frac{f_0}{x-z_i}= f_0\sum_{i=1}^m\frac{\alpha_i}{x-z_i}. \end{aligned}\]
Tämän ja yhtälön (4) avulla saamme, että
\[ng'=\sum_{i=1}^m\frac{\alpha_i}{x-z_i}.\]
Huomaamme nyt, että oikealla puolella olevan funktion poolien kertaluku on \(1\), kun taas \(ng'\) on rationaalifunktion derivaatta, jonka poolien kertaluku on aina suurempi kuin \(1\) (ks. Huom 6). Tämä on ristiriita.
Osamurtokehitelmä
Seuraava apulause on se, jota käytetään eniten Liouvillen lauseen todistuksessa. Siinä tapauksessa, että kyseessä oleva funktio on transkendenttinen (niin kuin artikkelin otsikossa), käytetään pelkästään seuraavaa lausetta.
Lause 9. Olkoot \(\mathbb K\) kunta ja \(f\in\mathbb K(X)\) rationaalifunktio, jonka nimittäjä ei ole vakio. Tällöin on olemassa
luonnollinen luku \(N\in\mathbb Z_{>0}\),
\(N\) pareittain erillistä jaotonta polynomia \(V_1,\dots,V_N\in\mathbb K[X]\), joiden korkeimman asteen termin kerroin on \(1\),
\(N\) luonnollista lukua \(m_1,\dots,m_N\in\mathbb Z_{>0}\),
jokaisilla \(i\in\{1,\dots,N\}\) ja \(k\in\{1,\dots,m_i\}\), polynomi \(S_{k,i}\in\mathbb K[X]\), jolle \(\deg S_{k,i}<\deg V_i\),
polynomi \(S_0\in\mathbb K[X]\)
siten, että
\[f=S_0+\sum_{i=1}^N\sum_{k=1}^{m_i}\frac{S_{k,i}}{V_i^k}.\]
Todistus. Kirjoitetaan \(f=P/Q\), missä \(P,Q\in\mathbb K[X]\) ovat keskenään jaottomat ja \(\deg Q\ge1\). Olkoon
\[Q=V_1^{\nu_1}V_2^{\nu_2}\cdots V_N^{\nu_N}\]
alkutekijähajotelma (eli \(V_i\ne V_j\), ja kaikki \(V_i\):t ovat jaottomat). Jos \(N=1\), niin funktio on jo yhtälön (5) muodossa. Jos \(N>1\), polynomit \(V_1^{\nu_1}\) ja
\[\tilde Q:=V_2^{\nu_2}\cdots V_N^{\nu_N}\]
ovat keskenään jaottomat. Bézout’n yhtälön (ks. artikkelin osa 1) mukaan on olemassa \(S,T\in\mathbb K[X]\) siten, että \(SV_1^{\nu_1}+T\tilde Q=1\). Nyt voidaan kirjoittaa
\[f=\frac PQ=\frac{P(SV_1^{\nu_1}+T\tilde Q)}{V_1^{\nu_1}\tilde Q}=\frac{PS}{\tilde Q}+\frac{PT}{V_1^{\nu_1}},\]
missä jälkimmäisen yhteenlaskettavan nimittäjä on jaottoman polynomin potenssi. Jos \(N-1>1\), toistetaan sama prosessi, jolloin saadaan
\[f=\frac{*}{\tilde{\tilde Q}}+\frac{*}{V_2^{\nu_2}}+\frac{PT}{V_1^{\nu_1}},\]
missä \(\tilde{\tilde Q}=V_3^{\nu_3}\cdots V_N^{\nu_N}\) ja pikku tähdet esittävät sopivia polynomeja. Äärellisen monen askelen jälkeen saadaan
\[f=\frac{R_1}{V_1^{\nu_1}}+\dots+\frac{R_N}{V_N^{\nu_N}}=\sum_{i=1}^N\frac{R_i}{V_i^{\nu_i}} \tag{5}\]
joillain polynomeilla \(R_1,\dots,R_N\in\mathbb K[X]\). Mikäli \(\deg R_i>\deg V_i\) tietyllä indeksillä \(i\), Eukleideen algoritmin avulla saadaan sellaiset \(Q_i\) ja \(S_i\), että \(R_i=Q_iV_i+S_i\) ja \(\deg S_i<\deg V_i\). Silloin summan (5) \(i\):s yhteenlaskettava voidaan kirjoittaa muotoon
\[\frac{R_i}{V_i^{\nu_i}}=\frac{Q_iV_i+S_i}{V_i^{\nu_i}}=\frac{Q_i}{V_i^{\nu_i-1}}+\frac{S_i}{V_i^{\nu_i}}.\]
Mikäli \(\deg(Q_i)>\deg(V_i)\), sama prosessi toistetaan, kunnes
\[\frac{R_i}{V_i^{\lambda_i}}=S_{0,i}+\sum_{k=1}^{m_i}\frac{S_{k,i}}{V_i^k}, \tag{6}\]
missä \(\deg S_{k,i}<\deg V_i\) jokaisella \(k\in\{1,\dots,m_i\}\).
Lopuksi, mikäli polynomin \(V_i\) korkeimman asteen termin kerroin on \(a\ne1\), voidaan määritellä \(\bar V_i:=\frac{V_i}a\) ja \(\bar S_{k,i}:=\frac{S_{k,i}}{a^k}\). Tällöin polynomin \(\bar V_i\) korkeimman asteen termin kerroin onkin \(1\), ja \(\frac{S_{k,i}}{V_i^k}=\frac{\bar S_{k,i}}{\bar V_i^k}\).
Esimerkki 10. Edellistä lausetta käytetään jatkossa “teoreettisena” tuloksena, emmekä ole kiinnostuneita erityisistä rationaalifunktioista. Voi olla kuitenkin hyödyllistä käydä todistus läpi ymmärtääksesi, miten se toimii. Esimerkiksi siinä tapausessa, että annettu rationaalifunktio on \(\frac PQ=\frac{x^3}{x+1}\), niin \(N=1\) ja ainoa nimittäjän jaoton tekijä on \(V_1=x+1\). Voit tarkistaa, että lauseen todistus tuottaa osamurtokehitelmän
\[\begin{aligned} \frac{x^3}{x+1}&=\frac{(x^2-1+1)(x+1)}{x+1}-\frac1{x+1}\\ &=x^2-x+1-\frac1{x+1}. \end{aligned}\]
Tämä onkin helppo rationaalifunktio. Voit kokeilla itse vaikeampia esimerkkejä.
Polynomin juuret
Alkio \(r\) on polynomin \(P\) juuri, jos \(P(r)=0\). Toisin sanoen \(r\) on polynomiyhtälön \(P(x)=0\) ratkaisu. Algebran pääongelma on löytää tällaisia juuria. Jos kerroinjoukko on liian pieni, on vaikeaa löytää niitä, joten joukkoa laajennetaan:
Polynomilla \(X+1\) ei ole juurta joukossa \(\mathbb N\), mutta sillä on juuri \(-1\) joukossa \(\mathbb Z\).
Polynomilla \(2X-1\) ei ole juurta joukossa \(\mathbb Z\), mutta sillä on juuri \(\frac12\) joukossa \(\mathbb Q\).
Polynomilla \(X^2-2\) ei ole juurta joukossa \(\mathbb Q\), mutta sillä on juuri \(\sqrt2\) joukossa \(\mathbb R\).
Polynomilla \(X^2+1\) ei ole juurta joukossa \(\mathbb R\), mutta sillä on juuri \(i\) joukossa \(\mathbb C\).
Kuten näimme, \(\mathbb Q\subset\mathbb R\subset\mathbb C\) on ketju kuntalaajennuksia. Juuri tämän takia kuntalaajennuksia tutkitaan: haluamme laajentaa kuntaa niin, että juuria löytyy. Huomaa, ettei tarvitse ottaa kuntaa \(\mathbb R\) juuren löytämiseksi polynomille \(X^2-2\in\mathbb Q[X]\): laajennus \(\mathbb Q(\sqrt2)\) riittää.
Lause 11 (algebran peruslause). Jokaisella epävakiolla polynomilla \(P\in\mathbb C[X]\) on jokin juuri joukossa \(\mathbb C\).
Itse asiassa tätä lausetta voi käyttää todistamaan, että \(m\)-asteisella kompleksikertoimisella polynomilla on täsmälleen \(m\) juurta, jos lasketaan kertalukuja. Toisin sanoen, \(m\)-asteinen polynomi \(P\in\mathbb C[X]\) voidaan kirjoittaa tulona lineaarisia termejä
\[P(X)=(X-z_1)(X-z_2)\cdots(X-z_m),\]
missä jotkut juuret \(z_i\in\mathbb C\) voivat toistua. (Vaikka edellistä lausetta kutsutaan “peruslauseeksi”, se ei ole mikään triviaali tulos.) Tämä seuraa edellisestä lauseesta ja siitä, että \(r\) on polynomin \(P\) juuri jos ja vain jos \(X-r\) jakaa polynomin \(P\), eli \(P=(X-r)Q\) jollakin polynomilla \(Q\). (Ks. kirjan [2] Lause 22.9.)
Määritelmä 12. Olkoot \(P\) polynomi ja \(r\) sen juuri. Juuren \(r\) kertaluku on korkein \(n\), jolle \((X-r)^n\) jakaa polynomin \(P\), eli korkein \(n\), jolle voidaan kirjoittaa
\[P=(X-r)^nQ,\]
jossa \(Q(r)\ne0\).
Lemma 13. Polynomille \(P\in\mathbb C[X]\) seuraavat ehdot ovat yhtäpitävät:
kaikkien \(P\):n juurien kertaluvut ovat \(=1\),
\(P\) ja \(P'\) ovat keskenään jaottomat.
Todistus. Oletetaan, että polynomilla \(P\) on juuri \(r\), jonka kertaluku on \(n>1\). Tällöin \(P(X)=(X-r)^nQ(X)\) jollain sopivalla \(Q\), jolle pätee \(Q(r)\ne0\). Tällöin
\[P'(X)=n(X-r)^{n-1}Q(X)+(X-r)^nQ'(X),\]
joten \(P'(r)=0\). Tämä tarkoittaa, että \(X-r\) jakaa myös polynomin \(P'\). Jos sen sijaan \(n=1\), niin \(P'(r)\ne0\), eli \(r\) ei ole derivaatan juuri. Mutta koska polynomin \(P\) voi jakaa lineaarisiin tekijöihin, niin jos kaikkien juurien kertaluvut ovat \(=1\), niin \(P\) ja \(P'\) ovat keskenään jaottomat.
Olkoon \(m\in\mathbb Z_{>0}\). Kirjoittamalla jatkossa \(\mathbb C^m_w\) tarkoitamme, että karteesiselle tulolle \(\mathbb C^m=\mathbb C\times\cdots\times\mathbb C\) otetaan koordinaatit \((w_1,\dots,w_m)\). Seuraavakin lause on melko kuuluisa.
Lause 14 (Implisiittisen funktion lause). Olkoot \(m,n\in\mathbb Z_{>0}\) ja \(\mathcal A\) tulon \(\mathbb C^{n+m}=\mathbb C_z^n\times\mathbb C_w^m\) avoin joukko. Olkoon \(F=(F_1,\dots,F_n)\colon \mathcal A\to\mathbb C^n\) holomorfinen funktio. Olkoon \((z^0,w^0)=(z_1^0,\dots,z_n^0,w_1^0,\dots,w_m^0)\in\mathcal A\) sellainen piste, että \(F(z^0,w^0)=0\) ja Jacobin matriisi siinä pisteessä, eli
\[\left(\begin{matrix} \frac{\partial F_1(z^0,w^0)}{\partial z_1} & \cdots & \frac{\partial F_n(z^0,w^0)}{\partial z_1}\\ \vdots & \ddots & \vdots\\ \frac{\partial F_1(z^0,w^0)}{\partial z_n} & \cdots & \frac{\partial F_n(z^0,w^0)}{\partial z_n} \end{matrix}\right),\]
on kääntyvä. Tällöin on olemassa pisteen \(z^0\in\mathbb C^n\) avoin ympäristö \(U\), pisteen \(w^0\in\mathbb C^m\) avoin ympäristö \(V\) ja holomorfinen funktio \(h\colon V\to U\) siten, että
\(U\times V\subseteq\mathcal A\),
\(F(h(w),w)=0\) kaikilla \(w\in V\),
\(h(w^0)=z^0\).
Lause 15. Olkoon \(\mathbb K\) kunta meromorfisia funktioita reaalivälissä \(I\) ja olkoon \(P\in\mathbb K[X]\) \(m\)-asteinen jaoton polynomi. Tällöin jollekin osavälille \(J\subseteq I\) on olemassa sellaiset pareittain erilliset meromorfiset funktiot
\[f_1,\dots,f_m\colon J\to\mathbb C,\]
että \(P(f_i)=0\) jokaisella \(i=1,\dots,m\).
Todistus. Olkoon
\[Q(x)=x^m+c_{m-1}x^{m-1}+\dots+c_1x+c_0\in\mathbb C[x]\]
sellainen polynomi, jolla on \(m\) parittain erillistä juurta \(z_1,\dots,z_m\in\mathbb C\). Lemmasta 13 seuraa, että polynomeilla \(Q\) ja
\[Q'(x)=\sum_{i=1}^mic_ix^{i-1}\]
ei ole yhteisiä tekijöitä, joten \(Q'(z_i)\ne0\) kaikilla \(i\). Määritellään holomorfinen funktio
\[\begin{aligned} F\colon\mathbb C^{m+1}&\to\mathbb C,\\ (x,a_0,\dots,a_{m-1})&\mapsto x^m+a_{m-1}x^{m-1}+\dots+a_1x+a_0. \end{aligned}\]
Haluamme nyt käyttää Lausetta 14, ja päätelläksemme Jacobin matriisin kääntyvyyden riittää huomata, että
\[\frac{\partial F}{\partial x}(z_i,c_0,\dots,c_{m-1})=Q'(z_i)\ne0\]
jokaisella \(i\in\{1,\dots,m\}\). Käytämme Lausetta 14 \(m\) kertaa, yhden kerran jokaisella \(z_i\). On olemassa pisteen \((c_0,\dots,c_{m-1})\) avoin ympäristö \(V\subseteq\mathbb C^m\), pisteiden \(z_i\) avoimet ympäristöt \(U_i\subseteq\mathbb C\) ja \(m\) holomorfista funktiota \(h_i\colon V\to U_i\) niin, että
jokaisella \((a_0,\dots,a_{m-1})\in V\)
\[F\big(h_i(a_0,\dots,a_{m-1}),a_0,\dots,a_{m-1}\big)=0,\]
eli \(h_i(a_0,\dots,a_{m-1})\) on polynomin \(x^m+a_{m-1}x^{m-1}+\dots+a_0\) juuri;
\(h_i(c_0,\dots,c_{m-1})=z_i\) jokaisella \(i\in\{1,\dots,m\}\).
Olkoon nyt
\[P(X)=\sum_{i=0}^mg_iX^i\in\mathbb K[X]\]
polynomi kuten lauseen väitteessä. Voimme olettaa, että kaikki funktiot \(g_i\) ovat määritellyt välissä \(I\), tai muuten otetaan sellainen osaväli. Voimme myös olettaa, että funktio \(g_m\) ei ole koskaan nolla välissä \(I\). Toisin sanoen, voimme jakaa funktiolla \(g_m\), tai itse asiassa olettaa alusta alkaen, että polynomin \(P\) korkeimman asteen termin kerroin on \(g_m=1\).
Jokaisella reaaliluvulla \(t\in I\) määritellään polynomi
\[P_t(x):=\sum_{i=0}^mg_i(t)x^i\in\mathbb C[x].\]
Etsimme sellaisen \(t_0\in I\), että polynomilla \(P_{t_0}\) on \(m\) parittain erillistä juurta. Koska \(P\) on jaoton, \(P\) ja \(P'\) ovat keskenään jaottomat. Bézout’n lauseen mukaan (ks. artikkelin osa 1) on olemassa sellaiset \(S,T\in\mathbb K[X]\), että
\[SP+TP'=1. \tag{7}\]
Voimme olettaa, että polynomien \(S\) ja \(T\) kaikki kertoimet — jotka ovat kunnan \(\mathbb K\) alkioita, eli funktioita — ovat määritellyt välissä \(I\), tai muuten otetaan osaväli. Jokaisella \(t\in I\) voimme siis määritellä polynomit \(P'_t\), \(S_t\) ja \(T_t\) samalla tavalla kuin polynomin \(P_t\). Yhtälöstä (7) saamme yhtälön
\[S_tP_t+T_tP'_t=1,\]
joka pätee renkaassa \(\mathbb C[x]\). Tästä seuraa, että \(P_t\) ja \(P_t'\) ovat keskenään jaottomat, ja Lemman 13 nojalla tämä tarkoittaa, että polynomilla \(P_t\) on \(m\) erillistä juurta. Tämä pitää paikkansa jokaisella reaaliluvulla \(t\) välissä \(I\), tai osavälissä \(J\), jos sitä tarvitaan. Sellaiset polynomit \(P_t\) ovat niin kuin polynomi \(Q\) todistuksen alussa. Olkoon siis \(t_0\in J\) ja olkoot \(z_1,\dots,z_m\) polynomin \(P_{t_0}\) juuret. Voimme käyttää funktioita \(h_1,\dots,h_m\) saadaksemme väitteen funktiot
\[f_i(t)=h_i\big(g_0(t),\dots,g_{m-1}(t)\big)\]
pisteen \(t_0\) ympäristössä. Huomaa, että funktiot \(f_i\) ovat holomorfisia välin \(J\) kompleksiympäristössä.
Symmetriset polynomit
Määritelmä 16. Funktiota \(\sigma\colon A\to B\) kutsutaan bijektioksi,* jos \(\sigma\) on sekä injektio että surjektio, eli*
jos \(a\ne a'\), niin \(\sigma(a)\ne\sigma(a')\),
jokaisella alkiolla \(b\in B\) on olemassa sellainen \(a\in A\), että \(\sigma(a)=b\).
Jos \(A=B\), niin bijektiota \(\sigma\colon A\to A\) kutsutaan permutaatioksi.
Huomautus 17. Joukon \(\{1,2,\dots,n\}\) permutaatio on siis bijektio \(\sigma\colon\{1,2,\dots,n\}\to\{1,2,\dots,n\}\). Toisin sanoen \(\sigma\) on “järjestyksen sekoittaminen”. Joukon \(\{1,2\}\) kaksi mahdollista permutaatiota ovat \(\sigma_1\) ja \(\sigma_2\), missä
\[\sigma_1(1)=1,\ \sigma_1(2)=2\quad\text{ja}\quad\sigma_2(1)=2,\ \sigma_2(2)=1.\]
Joukon \(\{1,2,3\}\) mahdolliset permutaatiot ovat funktiot \(\sigma_1,\dots,\sigma_6\), joiden arvot \(\sigma_i(1)\), \(\sigma_i(2)\) ja \(\sigma_i(3)\) ovat
\[1,2,3,\quad2,1,3,\quad3,2,1,\quad1,3,2,\quad2,3,1\quad \text{ja}\quad 3,1,2.\]
Määritelmä 18. Polynomia \(P\in\mathbb K[x_1,\dots,x_n]\) kutsutaan symmetriseksi polynomiksi, jos
\[P(x_1,\dots,x_n)=P(x_{\sigma(1)},\dots,x_{\sigma(n)})\]
millä tahansa indeksien permutaatiolla \(\sigma\).
Jos kirjoitetaan \(x\) ja \(y\) \(x_1\):n ja \(x_2\):n sijaan, esimerkiksi renkaassa \(\mathbb K[x,y]\) polynomit \(x^2+y^2\) ja \(xy\) ovat symmetriset, mutteivät polynomit \(x^2+y\) ja \(x^3y\).
Jokaisella luonnollisella luvulla \(n\) renkaassa \(\mathbb K[x_1,\dots,x_n]\) on olemassa tärkeitä symmetrisiä polynomeja, nimittäin niin kutsutut symmetriset peruspolynomit:
\[\begin{aligned} s_1 & := x_1+x_2+\dots+x_n,\\ s_2 & := x_1x_2+x_1x_3+\dots+x_{n-1}x_n,\\ &\ \vdots\\ s_n & := x_1x_2\cdots x_n. \end{aligned}\]
Nämä ovat symmetristen polynomien “atomit”, sillä jokainen symmetrinen polynomi voidaan esittää niiden polynomina seuraavan kuuluisan lauseen mukaan.
Lause 19 (Newton). Olkoot \(R\) rengas ja \(S\in R[x_1,\dots,x_n]\) symmetrinen polynomi. On olemassa yksikäsitteinen polynomi \(Q\in R[y_1,\dots,y_n]\) siten, että
\[S(x_1,\dots,x_n)=Q(s_1,\dots,s_n).\]
Esimerkki 20. Renkaassa \(R[x,y]\) symmetriset peruspolynomit ovat \(x+y\) ja \(xy\). Esimerkiksi \(x^2+y^2\) on symmetrinen ja
\[x^2+y^2=(x+y)^2-2(xy).\]
Eli lauseen vastaava polynomi \(Q\in R[y_1,y_2]\) on \(y_1^2-2y_2\).
Lause 21. Olkoot \(\mathbb K\) kunta, \(m\in\mathbb N\) ja \(P\in\mathbb K[x]\) \(m\)-asteinen polynomi, jolla on pareittain erilliset juuret \(z_1,\dots,z_m\) jossakin sopivassa kunnan \(\mathbb K\) laajennuksessa. Jos \(S\in\mathbb K[x_1,\dots,x_m]\) on symmetrinen polynomi, niin \(S(z_1,\dots,z_m)\in\mathbb K\).
Todistus. Lauseen 19 avulla voi kirjoittaa
\[S(x_1,\dots,x_m)=Q(s_1,\dots,s_m)\]
sopivalla polynomilla \(Q\in\mathbb K[y_1,\dots,y_m]\). Eksplisiittisesti
\[\begin{aligned} P(X) & = (X-z_1)(X-z_2)\cdots(X-z_m)\\ & = X^m-a_1X^{m-1}+a_2X^{m-2}-\dots\pm a_m \end{aligned}\]
joillain \(a_1,\dots,a_m\in\mathbb K\). Huomaa, että \(a_i=s_i(z_1,\dots,z_m)\) jokaisella \(i\in\{1,\dots,m\}\). Joten \(S(z_1,\dots,z_m)=Q(a_1,\dots,a_m)\), ja tämä on kunnan \(\mathbb K\) alkio.
Algebralliset alkiot, joilla on sama minimipolynomi
Olkoot \(\mathbb K\) kunta ja \(\mathbb L\) sen laajennus. Olkoot \(f,g\in\mathbb L\setminus\mathbb K\) kaksi algebrallista alkiota, joilla on sama minimipolynomi \(P\) kunnan \(\mathbb K\) suhteen. Tämän pykälän päätulos on Lause 24: siinä tapauksessa, että \(\mathbb K\) on kunta, jossa voidaan ottaa derivaatta, niin voidaan sijoittaa \(f\) ja \(f'\) alkioiden \(g\) ja \(g'\) paikalle tietyllä tavalla.
Tehtävä 22. Oletetaan, että algebralliset alkiot \(f\) ja \(g\) ovat niin kuin edellä, ja olkoon \(P\) niiden minimipolynomi kunnan \(\mathbb K\) suhteen. Olkoon \(n:=\deg(P)-1\). Silloin kunnan \(\mathbb K(f)\) alkio on muotoa \(a=\sum_{i=0}^na_if^i\) joillain \(a_i\in\mathbb K\). Määritellään nyt funktio
\[\pi\colon\mathbb K(f)\longrightarrow\mathbb K(g),\qquad\sum_{i=0}^na_if^i \longmapsto\sum_{i=0}^na_ig^i,\]
joka sijoittaa alkion \(g\) alkion \(f\) paikalle. Osoita, että
\[\pi(a+b)=\pi(a)+\pi(b)\quad\text{ja}\quad\pi(ab)=\pi(a)\pi(b)\]
jokaisella \(a,b\in\mathbb K(f)\). (Toisin sanoen tämä funktio \(\pi\) on kuntien välinen isomorfismi.)
Lemma 23. Samalla notaatiolla \(\pi(f')=g'\).
Todistus. Samalla tavalla kuin artikkelin ensimmäisen osan Lemman 27 todistuksessa voi osoittaa, että
\[f'=-\frac{\sum_{i=0}^na_i'f^i}{\sum_{i=1}^nia_if^{i-1}}\qquad\text{ja}\qquad g'=-\frac{\sum_{i=0}^na_i'g^i}{\sum_{i=1}^nia_ig^{i-1}}.\]
Edellisen tehtävän nojalla,
\[\pi(f')=-\frac{\sum_{i=0}^ma_i'\pi(f)^i}{\sum_{i=1}^mia_i\pi(f)^{i-1}}.\]
Tämä on yhtä kuin \(g'\), koska \(\pi(f)=g\).
Lause 24. Olkoot \(\mathbb K\) kunta meromorfisia funktioita ja \(f,g\) kaksi algebrallista alkiota kunnan \(\mathbb K\) suhteen. Oletetaan, että alkioilla \(f\) ja \(g\) on sama minimipolynomi \(P\in\mathbb K[X]\). Olkoon \(Q\in\mathbb K[Y,Z]\) kahden muuttujan polynomi, ja oletetaan, että \(Q(f,f')\in\mathbb K\). Tällöin
\[Q(f,f')=Q(g,g').\]
Todistus. Koska funktion \(\pi\) rajoittuma kuntaan \(\mathbb K\) on identiteetti,
\[Q(f,f')=\pi(Q(f,f')).\]
Edellisen tehtävän nojalla
\[\pi(Q(f,f'))=Q(\pi(f),\pi(f')).\]
Lopuksi tiedetään, että \(\pi(f)=g\) suoraan määritelmästä ja \(\pi(f')=g'\) edellisestä lemmasta.
Tätä pykälää voi varmaan lähestyä helpommin, jos niin sanotun tekijärenkaan käsite ja ensimmäinen homomorfismin lause ovat tutut. (Ks. kirjan [2] pykälät 16 ja 20.) Tästä näkökulmasta olisi ilmeistä, että \(\mathbb K(f)\) ja \(\mathbb K(g)\) ovat “likimain sama asia”.
Implikaation “\(\Rightarrow\)” todistuksen alku
Oletetaan, että on olemassa alkeislaajennus \(\mathbb L\) niin kuin lauseen väitteessä. Eli \(\mathbb L=\mathbb K(f_1,\dots,f_N)\) joillakin alkeisfunktioilla \(f_1,\dots,f_N\). Todistus tehdään induktiolla \(N\):n suhteen. Jos \(N=0\), niin \(\mathbb L=\mathbb K\), ja on olemassa funktion \(\alpha\) integraalifunktio \(y\in\mathbb L\). Siis \(v:=y\) kelpaa. Kun \(N>0\), kirjoitetaan
\[\mathbb K(f_1,\dots,f_N)=\mathbb K(f_1)\big(f_2,\dots,f_N\big)\]
ja oletetaan, että väite pitää paikkansa kunnalle \(\mathbb K(f_1)\), eli on olemassa sellaiset \(t_1,\dots,t_n,w\in\mathbb K(f_1)\) ja \(d_1,\dots,d_n\in\mathbb C\), että
\[\alpha=\sum_{i=1}^nd_i\frac{t_i'}{t_i}+w'. \tag{8}\]
Jatkossa etsimme funktioita \(u_1,\dots,u_n,v\) funktioiden \(t_1,\dots,t_n,w\) kautta ja kompleksilukuja \(c_1,\dots,c_n\) kompleksilukujen \(d_1,\dots,d_n\) kautta.
Riippuen siitä, onko \(f_1\) transkendenttinen (eksponentti- tai logaritmifunktio) vai algebrallinen alkio kunnan \(\mathbb K\) suhteen, todistus sujuu eri tavalla. Tässä kirjoituksessa käymme läpi ne tapaukset, että \(f_1\) on transkendenttinen eksponenttifunktio tai algebrallinen, ja transkendenttisen logaritmifunktion tapaus jätetään tehtäväksi.
Implikaation “\(\Rightarrow\)” todistuksen jatko: jos \(f_1\) on transkendenttinen
Koska \(f_1\) on transkendenttinen alkio, jokainen yhtälössä (8) oleva funktio \(t_i\in\mathbb K(f_1)\) voidaan esittää osamääränä
\[t_i=\frac{P_i(f_1)}{Q_i(f_1)}\]
sopivilla keskenään jaottomilla polynomeilla \(P_i,Q_i\in\mathbb K[X]\). Koska
\[\frac{(\frac ab)'}{\frac ab}=\frac{a'}a-\frac{b'}b,\]
identiteetistä (8) tulee
\[\alpha=\sum_{i=1}^nd_i\frac{(P_i(f_1))'}{P_i(f_1)}-\sum_{i=1}^nd_i\frac{(Q_i(f_1))'}{Q_i(f_1)}+w'. \tag{9}\]
Olkoot \(R_1,\dots,R_N\) kaikkien polynomien \(P_i\) ja \(Q_i\) kaikki jaottomat tekijät, toistaen mahdollisesti monta kertaa ne, jotka esiintyvät eri polynomeissa ja korkealla potenssilla. (Eli voi olla, että \(R_i=R_j\), vaikka \(i\ne j\).) Huomaa, että \(N\ge n\). Identiteetin (2) nojalla voidaan kirjoittaa (9) muodossa
\[\alpha=\sum_{i=1}^Ne_i\frac{(R_i(f_1))'}{R_i(f_1)}+w'\]
joillain sopivilla kompleksiluvuilla \(e_i\). Olkoon \(u_i\in\mathbb K\) polynomin \(R_i\) korkeimman asteen termin kerroin, joten voimme kirjoittaa \(R_i=u_iM_i\), missä polynomin \(M_i\) vastaava kerroin on \(1\). Identiteetin (3) avulla
\[\alpha=\sum_{i=1}^Ne_i\frac{u_i'}{u_i}+\sum_{i=1}^Ne_i\frac{(M_i(f_1))'}{M_i(f_1)}+w'.\]
Voi olla, että jälkimmäisessä summassa \(M_i=M_j\) vaikka \(i\ne j\). Kirjoitetaan sitten yhteen ne polynomit \(M_i\), jotka toistuvat niin, että
\[\alpha=\sum_{i=1}^Ne_i\frac{u_i'}{u_i}+\sum_{i=1}^{\widetilde N}\varepsilon_i\frac{(M_i(f_1))'}{M_i(f_1)}+w' \tag{10}\]
sopivilla uusilla kertoimilla \(\varepsilon_i\) ja luonnollisella luvulla \(\widetilde N\le N\).
Loppusilaukseksi, koska \(w\) on kunnan \(\mathbb K(f_1)\) alkio, on olemassa sellainen \(g\in\mathbb K(X)\), että \(w=g(f_1)\). Sovelletaan tälle funktiolle \(g\) Lausetta 9 saaden
\[w=S_0(f_1)+\sum_{i=1}^{\overline N}\sum_{k=1}^{m_i}\frac{S_{k,i}(f_1)}{V_i^k(f_1)}.\]
Yhtälöstä (10) tulee siis
\[\begin{align*} \alpha=& \sum_{i=1}^Ne_i\frac{u_i'}{u_i} +\sum_{i=1}^{\widetilde N}\varepsilon_i\frac{(M_i(f_1))'}{M_i(f_1)}+(S_0(f_1))' \tag{11} \\ +&\sum_{i=1}^{\overline N}\sum_{k=1}^{m_i}\frac{(S_{k,i}(f_1))'}{V_i^k(f_1)} -\sum_{i=1}^{\overline N}\sum_{k=1}^{m_i}k\frac{S_{k,i}(f_1)(V_i(f_1))'}{V_i^{k+1}(f_1)}.\nonumber \end{align*}\]
Jos \(f_1\) on eksponenttifunktio
Olkoon \(f_1\) transkendenttinen eksponenttifunktio kunnan \(\mathbb K\) suhteen.
Lemma 25. Olkoon
\[P(X)=a_mX^m+\dots+a_0=\sum_{i=0}^ma_iX^i,\quad(a_m\ne0)\]
\(m\)-asteinen polynomi renkaassa \(\mathbb K[X]\). Tällöin polynomille
\[\widetilde P(X):=\sum_{i=0}^m(ia_ib'+a_i')X^i\in\mathbb K[X]\]
pätee \((P(f_1))'=\widetilde P(f_1)\).
Todistus. Koska \(f_1\) on eksponenttifunktio kunnan \(\mathbb K\) suhteen, on olemassa sellainen \(b\in\mathbb K\), että \(f_1'=b'f_1\). Silloin
\[\begin{aligned} (P(f_1))' &= \sum_{i=0}^ma_i'f_1^i+\sum_{i=1}^mia_if_1'f_1^{i-1}\\ & = a_0'+\sum_{i=1}^ma_i'f_1^i+\sum_{i=1}^mia_i\frac{f_1'}{f_1}f_1^i\\ & = a_0'+\sum_{i=1}^m(a_i'+ia_ib')f_1^i\\ & = \sum_{i=0}^m(a_i'+ia_ib')f_1^i=\widetilde P(f_1). \end{aligned}\]
Lemma 26. Käyttäen samaa notaatiota kuin edellä \(ma_mb'+a_m'\ne0\), eli
\[\deg\widetilde P=\deg P=m.\]
Todistus. Jos päinvaistoin olisi \(ma_mb'+a_m'=0\), niin
\[\begin{aligned} (a_mf_1^m)'&=a_m'f_1^m+ma_mf_1'f_1^{m-1}\\ &=a_m'f_1^m+ma_mb'f_1^m\\ &=(a_m'+ma_mb')f_1^m=0. \end{aligned}\]
Eli \(a_mf_1^m\) olisi vakiofunktio, toisin sanoen kompleksiluku. Tämä on ristiriita, koska \(a_m\ne0\) ja \(f_1\) on transkendenttinen.
Lemma 27. Jos \(a_m\) on vakiofunktio ja \(P\) jakaa polynomin \(\widetilde P\), niin \(P\) on monomi.
Todistus. Koska asteet ovat yhtä suuret, \(P\) jakaa polynomin \(\widetilde P\) jos ja vain jos on olemassa sellainen \(k\in\mathbb K\), että \(kP=\widetilde P\). Korkeimman asteen (eli \(m\)) termeille tämä tarkoittaa
\[ka_m=ma_mb'+a_m'=ma_mb',\]
missä toinen yhtälö pätee, koska \(a_m\) on vakio. Koska \(a_m\ne0\) seuraa, että \(k=mb'\). Tällöin \(a_i'mb'=ia_ib'+a_i'\), eli \(a_i'-a_i(m-i)b'=0\) kaikille \(i\in\{0,\dots,m-1\}\). Mutta sitten jokaisella indeksillä \(i\)
\[\begin{aligned} \bigg(\frac{a_i}{f_1^{m-i}}\bigg)'&=\frac{a_i'f_1^{m-i}-a_i(m-i)f_1^{m-i}b'}{(f_1^{m-i})^2}\\ &=\frac{a_i'-a_i(m-i)b'}{f_1^{m-i}}=0, \end{aligned}\]
eli \(a_i/f_1^{m-1}\) on jokin vakio \(c_i\in\mathbb C\). Yhtälöstä \(a_i=c_if_1^{m-1}\) ja siitä, että \(f_1\) on transkendenttinen, seuraa, että \(a_i=c_i=0\) jokaisella \(i\in\{0,\dots,m-1\}\). Toisin sanoen \(P\) on monomi \(a_mX^m\).
Sovelletaan nyt edelliset huomautukset yhtälöön (11). Jokaisella \(i\in\{1,\dots,n\}\) on olemassa polynomit \(\widetilde M_i,\widetilde V_i\in\mathbb K[X]\) niin, että
\[(M_i(f_1))'=\widetilde M_i(f_1)\quad\text{ja}\quad(V_i(f_1))'=\widetilde V_i(f_1).\]
Samalla tavalla on olemassa polynomit \(\widetilde S_0\) ja \(\widetilde S_{k,i}\). Yhtälöstä (11) tulee sitten
\[\begin{align} \alpha= &\sum_{i=1}^Ne_i\frac{u_i'}{u_i}+\sum_{i=1}^{\widetilde N}\varepsilon_i\frac{\widetilde M_i(f_1)}{M_i(f_1)}+\widetilde S_0(f_1) \tag{12} \\ &+\sum_{i=1}^{\overline N}\sum_{k=1}^{m_i}\frac{\widetilde S_{k,i}(f_1)}{V_i^k(f_1)}-\sum_{i=1}^{\overline N}\sum_{k=1}^{m_i}k\frac{S_{k,i}(f_1)\widetilde V_i(f_1)}{V_i^{k+1}(f_1)}.\nonumber \end{align}\]
Muistetaan, että jos \(i\ne j\), niin \(M_i\ne M_j\) ja \(V_i\ne V_j\). Olkoot \(M_{i_1},\dots,M_{i_s}\) ne polynomit joukosta \(\{M_i\}\), jotka eivät ole yhtä kuin mikään polynomi \(V_j\). Kun määritellään
\[L:=V_1^{m_1+1}\cdots V_{\overline N}^{m_{\overline N}+1}M_{i_1}\cdots M_{i_s},\]
niin \(L(f_1)\) on suurin yhteinen nimittäjä identiteetissä (12). Se osamäärä, jonka nimittäjä on korkein alkion \(V_1(f_1)\) potenssi, löytyy viimeisestä (tupla)summasta indeksiarvoilla \(i=1\) ja \(k=m_1\). Voidaan siis kirjoittaa
\[\begin{gathered} \frac{\mathcal P(f_1)}{V_1^{m_1}(f_1)V_2^{m_2+1}(f_1)\cdots V_{\overline N}^{m_{\overline N}+1}(f_1)M_{i_1}(f_1)\cdots M_{i_s}(f_1)} \\ =-m_1\frac{S_{m_1,1}(f_1)\widetilde V_1(f_1)}{V_1^{m_1+1}(f_1)} \end{gathered}\]
jollain sopivalla polynomilla \(\mathcal P\in\mathbb K[X]\). Kerrotaan molemmat puolet alkiolla \(-\frac1{m_1}L(f_1)\), jolloin saadaan
\[\begin{aligned} -\frac1{m_1}\mathcal P(f_1)V_1(f_1)&=S_{m_1,1}(f_1)\widetilde V_1(f_1)\\ &\qquad\cdot V_2^{m_2+1}(f_1)\cdots V_{\overline N}^{m_{\overline N}+1}(f_1)\\ &\qquad\cdot M_{i_1}(f_1)\cdots M_{i_s}(f_1). \end{aligned}\]
Koska \(f_1\) on transkendenttinen, Lemmasta 7 seuraa, että
\[-\frac1{m_1}\mathcal PV_1=S_{m_1,1}\widetilde V_1 V_2^{m_2+1}\cdots V_{\overline N}^{m_{\overline N}+1}M_{i_1}\cdots M_{i_s}.\]
Jaoton polynomi \(V_1\) on selvästi vasemman puolen tekijä. Ainoa tapa, jolla \(V_1\) voi jakaa oikean puolen, on että \(V_1\) jakaa polynomin \(\widetilde V_1\). Koska polynomin \(V_1\) korkeimman asteen termin kerroin on \(1\), Lemman 27 nojalla saadaan, että \(V_1\) on itse asiassa monomi ja välttämättä monomi \(X\).
Jos sama prosessi tehdään muille polynomeille \(V_i\), ja koska \(V_i\ne V_1\), huomaamme, ettei \(V_i\) esiinny yhtälössä (12). Samanlaisella tavalla voi päätellä, että \(M_1=X\), eivätkä muut polynomit \(M_i\) esiinny. Lopuksi Lauseesta 9 seuraa, että \(\deg S_{k,1}<\deg V_1=1\) jokaisella \(k\in\{1,\dots,m_1\}\), joten \(S_{k,1}=S_{k,1}(f_1)=\sigma_k\) jollakin \(\sigma_k\in\mathbb K\). Yhtälöstä (12) tulee sitten
\[\begin{aligned} \alpha & = \sum_{i=1}^Ne_i\frac{u_i'}{u_i}+\varepsilon_1\frac{f_1'}{f_1}+\widetilde S_0(f_1)+\sum_{k=1}^{m_1}\frac{\sigma_k'}{f_1^k}-\sum_{k=1}^{m_1}k\frac{\sigma_kf_1'}{f_1^{k+1}}\\ & = \sum_{i=1}^Ne_i\frac{u_i'}{u_i}+\varepsilon_1b'+\sum_{k=1}^{m_1}\frac{\sigma_k'-kb'\sigma_k}{f_1^k}+\widetilde S_0(f_1). \end{aligned}\]
Jos yksikin termeistä \(\sigma_k'-kb'\sigma_k\) olisi epänolla, niin kertomalla molemmat puolet alkiolla \(f_1^{m_1}\) saisimme epänollan polynomin, jolle \(f_1\) on juuri. Tämä on ristiriita, koska \(f_1\) on transkendenttinen, joten kaikki nuo termit ovat nollia ja
\[\alpha=\sum_{i=1}^Ne_i\frac{u_i'}{u_i}+\varepsilon_1b'+\widetilde S_0(f_1).\]
Polynomin \(\widetilde S_0\) määritelmästä ja Lemmasta 26 seuraa, että \(\deg(\widetilde S_0)=0\), eli \(S_0=S_0(f_1)=s_0\in\mathbb K\). Voi siis kirjoittaa
\[\alpha=\sum_{i=1}^Ne_i\frac{u_i'}{u_i}+\varepsilon_1b'+s_0',\]
ja määrittelemällä \(v:=\varepsilon_1b+s_0\) saamme yhtälön (1).
Jos \(f_1\) on logaritmifunktio
Tehtävä 28. Tee todistus itse seuraten suunnilleen samaa strategiaa kuin eksponenttifunktion tapauksessa.
Vihje: Lemmat 25, 26 ja 27 pitää muokata. Esimerkiksi uusi polynomi \(\widetilde P\) on
\[\widetilde P(X):=a_m'X^m+\sum_{i=0}^{m-1}\Big(a_i'+(i+1)a_{i+1}\frac{b'}b\Big)X^i.\]
Huomaa, että
jos \(a_m\) on vakio, niin \(\deg(\widetilde P)<\deg(P)\),
jos \(a_m\) ei ole vakio, niin \(\deg(\widetilde P)=\deg(P)\).
Implikaation “\(\Rightarrow\)” todistuksen jatko: jos \(f_1\) on algebrallinen
Aloitetaan taas yhtälöstä (8) eli
\[\alpha=\sum_{i=1}^nd_i\frac{t_i'}{t_i}+w',\]
missä \(t_1,\dots,t_n,w\in\mathbb K(f_1)\). Koska nyt oletetaan, että \(f_1\) on algebrallinen, on olemassa sellaiset polynomit \(P_1,\dots,P_n,Q\in\mathbb K[X]\), että \(t_i=P_i(f_1)\) ja \(w=Q(f_1)\) jokaisella \(i\in\{1,\dots,n\}\). Koska \(\mathbb K(f_1)\) on kunta, on olemassa polynomit \(R_1,\dots,R_n\in\mathbb K[X]\) niin, että
\[\frac1{P_i(f_1)}=R_i(f_1). \tag{13}\]
Yhtälöstä (8) tulee
\[\alpha=\sum_{i=1}^nd_i(P_i(f_1))'R_i(f_1)+(Q(f_1))'. \tag{14}\]
Olkoon \(M\in\mathbb K[X]\) alkion \(f_1\) minimipolynomi kunnan \(\mathbb K\) suhteen, ja olkoon \(m:=\deg(M)\). Lemman 15 avulla polynomilla \(M\) on \(m\) pareittan erillistä meromorfista juurta \(z_1,\dots,z_m\), ja yksi niistä on \(f_1\). Jollekin sopivalle polynomille \(\mathcal T\in\mathbb K[X,Y]\) yhtälön (14) oikea puoli on yhtä kuin \(\mathcal T(f_1,f_1')\). Koska \(z_1,\dots,z_m\) ovat saman jaottoman polynomin juuret, voimme käyttää Lausetta 24 saaden
\[\alpha=\sum_{i=1}^nd_i(P_i(z_k))'R_i(z_k)+(Q(z_k))'\]
jokaisella \(k\in\{1,\dots,m\}\). Jos otetaan summa kaikkien indeksien \(k\in\{1,\dots,m\}\) suhteen, saamme
\[m\alpha=\sum_{k=1}^m\bigg(\sum_{i=1}^nd_i(P_i(z_k))'R_i(z_k)+(Q(z_k))'\bigg).\]
Tästä ja yhtälöstä (13) seuraa, että
\[\alpha=\frac1m\sum_{i=1}^n\sum_{k=1}^md_i\frac{(P_i(z_k))'}{P_i(z_k)}+\frac1m\bigg(\sum_{k=1}^mQ(z_k)\bigg)'.\]
Sovelletaan yhtälöä (2) ensimmäisessä termissä esiintyvään summaan saaden
\[\begin{aligned} \alpha&=\frac1m\sum_{i=1}^nd_i\frac{\big(P_i(z_1)P_i(z_2)\cdots P_i(z_m)\big)'}{P_i(z_1)P_i(z_2)\cdots P_i(z_m)}\\ &\quad+\frac1m\bigg(\sum_{k=1}^mQ(z_k)\bigg)'. \end{aligned}\]
Jokaisella \(i\in\{1,\dots,n\}\) määritellään polynomi
\[S_i(X_1,\dots,X_m):=P_i(X_1)\cdots P_i(X_m)\]
renkaassa \(\mathbb K[X_1,\dots,X_m]\). Polynomi \(S_i\) on symmetrinen, joten siihen voidaan soveltaa Lausetta 21, kun määritellään
\[u_i:=S_i(z_1,\dots,z_m)=P_i(z_1)\cdots P_i(z_m),\]
jolloin saadaan, että \(u_i\) on kunnan \(\mathbb K\) alkio. Samalla tavalla voimme ottaa toisen symmetrisen polynomin
\[S(X_1,\dots,X_m):=\sum_{k=1}^mQ(X_k),\]
jolloin \(v:=\frac1mS(z_1,\dots,z_k)=\frac1m\sum_{k=1}^mQ(z_k)\) on kunnan \(\mathbb K\) alkio. Eli voimme kirjoittaa
\[\alpha=\frac1m\sum_{i=1}^nd_i\frac{u_i'}{u_i}+v',\]
ja saamme yhtälön (1), kun määritellään \(c_i:=d_i/m\).
Seurauksen todistus
Todistetaan lopuksi artikkelin ensimmäisen osan Lause 30 eli seuraava lause.
Lause 29. Olkoot \(f,g\in\mathbb C(x)\), missä \(f\) ei ole nolla eikä \(g\) ole vakio, määritellyt jossakin reaalivälissä \(J\). Tällöin funktiolla
\[\begin{aligned} J&\longrightarrow\mathbb C,\\ x&\longmapsto f(x)e^{g(x)} \end{aligned}\]
on alkeisintegraalifunktio, jos ja vain jos on olemassa sellainen rationaalifunktio \(a\in\mathbb C(x)\), että
\[f=a'+ag'. \tag{15}\]
Todistus. \((\Leftarrow)\) Oletetaan, että jokin rationaalifunktio \(a\in\mathbb C(x)\) toteuttaa \(f=a'+ag'\). Määritellään
\[h(x):=a(x)e^{g(x)},\qquad\mathbb K:=\mathbb C(x).\]
Koska \(e^g\) on eksponenttifunktio kunnan \(\mathbb K\) suhteen, \(\mathbb K(e^g)\) on kunnan \(\mathbb C(x)\) alkeislaajennus. Joten \(h\), joka on tämän laajennuksen alkio, on alkeisfunktio. Lopuksi otetaan derivaatta:
\[h'=a'e^g+ag'e^g=(a'+ag')e^g=fe^g.\]
\((\Rightarrow)\) Olkoot \(f\) epänolla ja \(g\) epävakio. Olkoon \(\mathbb L\) kunnan \(\mathbb C(x)\) sellainen alkeislaajennus, johon kuuluu funktion \(fe^g\) integraalifunktio \(y\). Silloin kuntaan \(\mathbb L\) kuuluu myös \(y'=fe^g\) sekä \(e^g\), joten \(\mathbb L\) on kunnan \(\mathbb C(x)(e^g)\) alkeislaajennus. Olkoon
\[\alpha:=fe^g,\qquad\mathbb K:=\mathbb C(x)(e^g).\]
Liouvillen lauseen mukaan on olemassa sellaiset \(t_1,\dots,t_n,w\in\mathbb K\) ja \(d_1,\dots,d_n\in\mathbb C\), että
\[\alpha=\sum_{i=1}^nd_i\frac{t_i'}{t_i}+w'.\]
Tämän voi kirjoittaa eri tavalla Lauseen 9 nojalla, ja niin kuin Liouvillen lauseen todistuksessa saamme yhtälön
\[\begin{align*} \alpha&= \sum_{i=1}^Ne_i\frac{u_i'}{u_i}+\sum_{i=1}^{\widetilde N}\varepsilon_i\frac{(M_i(f_1))'}{M_i(f_1)}+(S_0(f_1))' \tag{16} \\ &+\sum_{i=1}^{\overline N}\sum_{k=1}^{m_i}\frac{(S_{k,i}(f_1))'}{V_i^k(f_1)}-\sum_{i=1}^{\overline N}\sum_{k=1}^{m_i}k\frac{S_{k,i}(f_1)(V_i(f_1))'}{V_i^{k+1}(f_1)}.\nonumber \end{align*}\]
Lauseen 8 mukaan, \(e^g\) on transkendenttinen kunnan \(\mathbb C(x)\) suhteen, joten voimme käyttää samaa strategiaa kuin Liouvillen lauseen todistuksen osassa, joka koskee transkendenttisia eksponenttifunktioita. Lisäksi kirjoitetaan \(\alpha\) eli \(fe^g\) renkaan \(\mathbb C(x)[X]\) jonakin polynomina pistessä \(e^g\), eli
\[\alpha=fe^g=P(e^g),\qquad P(X):=fX.\]
Samalla tavalla kuin yllä mainitussa todistuksen osassa yhtälöstä (16) tulee
\[P(e^g)=\sum_{i=1}^Nc_i\frac{u_i'}{u_i}+(S_0(e^g))'+\varepsilon_1g'. \tag{17}\]
Koska vasemmalla puolella oleva polynomi on ensimmäistä astetta, niin pitää myöskin olla polynomin \(S_0'\). Ja transkendenttisen eksponenttifunktion tapauksen huomausten mukaan pätee myös \(\deg(S_0)=1\), joten
\[S_0(X)=s_1X+s_0\]
joillakin sopivilla \(s_1,s_0\in\mathbb C(x)\). Niinpä yhtälöstä (17) tulee
\[\begin{aligned} fe^g & = \sum_{i=1}^Nc_i\frac{u_i'}{u_i}+(s_1e^g+s_0)'+\varepsilon_1g'\\ & = \sum_{i=1}^Nc_i\frac{u_i'}{u_i}+s_1'e^g+s_1g'e^g+s_0'+\varepsilon_1g'. \end{aligned}\]
Kirjoittamalla eri tavalla saamme
\[(f-s_1'-s_1g')e^g=\sum_{i=1}^Nc_i\frac{u_i'}{u_i}+s_0'+\varepsilon_1g',\]
missä oikea puoli ei sisällä funktiota \(e^g\). Jos funktion \(e^g\) kerroin vasemmalla puolella olisi epänolla, saisimme ristiriidan transkendentisuuden kanssa, joten \(f-s_1'-s_1g'=0\) eli \[f=s_1'+s_1g'.\] Koska \(s_1\in\mathbb C(x)\), saamme halutun yhtälön (15).
Viimeisiä kommenteja
Niin kuin sanottu ensimmäisessä osassa on tämä kirjoitus artikkelin [1] inspiroima, paitsi että tässä teemme kaiken tavallisen derivaatan “perus”tapauksessa. Periaatteessa on mahdollista analysoida mikä vaan derivaatta seuraavan määritelmän mukaan.
Määritelmä 30. Differentiaalikunta on kunta \(\mathbb K\), jossa määritellään sellainen funktio \(D\colon\mathbb K\to\mathbb K\), jota kutsutaan derivaataksi, että jokaisilla alkioilla \(a,b\in\mathbb K\) pätee
\[D(a+b)=D(a)+D(b)\quad\text{ja}\quad D(ab)=D(a)b+aD(b).\]
Esimerkiksi tavallinen derivaatta on derivaatta edellisen määritelmän mukaan. Jos \(D\) on derivaatta, niin on \(-D\) myöskin. Tämän kirjoituksen tulokset pitävät paikkansa yleisemmässä tapauksessa, että kyseessä on yleinen derivaatta. Matematiikan osa-alue, joka käsittelee tällaisia käsitteitä ja tuloksia on differentiaalialgebra (engl. differential algebra).
Viitteet
[1] C. De Lellis. Il teorema di Liouville ovvero perché “non esiste” la primitiva di \(e^{x^2}\). La Matematica nella Società e nella Cultura. Rivista dell’Unione Matematica Italiana 7.1 (2014): 55–97.
[2] J. Häsä, J. Rämö. Johdatus abstraktiin algebraan. Gaudeamus (2015).
[3] M. Orlich. Miksei funktiota \(e^{-x^2}\) voi integroida? (Osa 1/2). Solmu 2/2025.