pdf  Solmu 3/2023


Kiehtovaa matematiikkaa, Cauchyn funktionaaliyhtälö

Lasse Pantsar

Additiivisuus ja lineaarisuus

Määritelmä 1: Funktio \(f \colon \mathbb{R} \rightarrow \mathbb{R}\) on additiivinen, jos se toteuttaa Cauchyn funktionaaliyhtälön \[f ( x + y )= f ( x )+ f ( y ) \tag{1}\]

kaikilla \(x \in \mathbb{R}\) ja kaikilla \(y \in \mathbb{R}\).

Helposti voidaan todistaa

Lause 1: Jos funktio \(f\colon \mathbb{R} \rightarrow \mathbb{R}\) on additiivinen, on

\[f(qx )= qf(x) \tag{2}\]

kaikilla \(q \in \mathbb{Q}\) ja kaikilla \(x \in \mathbb{R}\).

Jokaisella additiivisella funktiolla \(f\) on siis omi­nai­­suus \((2)\), mutta toteutuuko yhtälö \(f(rx) = rf(x)\) kaikille additiivisille funktioille \(f\) ja kaikille reaa­li­luvuille \(r\) ja \(x\)? Tämän selvittämiseksi otetaan käyt­­­töön line­aarisen funktion käsite.

Määritelmä 2: Funktio \(f\colon \mathbb{R} \rightarrow \mathbb{R}\) on lineaarinen, jos on olemassa \(c \in \mathbb{R}\) siten, että

\[f(x)= cx \tag{3}\]

kaikilla \(x \in \mathbb{R}\).

Nyt voidaan todistaa:

Lause 2: Funktio \(f\colon \mathbb{R} \rightarrow \mathbb{R}\) on lineaarinen, jos ja vain jos

\[f (rx) = rf(x) \tag{4}\]

kaikilla \(r \in \mathbb{R}\) ja kaikilla \(x \in \mathbb{R}\).

Termi lineaarinen tulee siitä, että tällaisen funktion kuvaaja on origon kautta kulkeva suora.

Määritelmästä seuraa välittömästi

Lause 3: Jokainen lineaarinen funktio \(f\colon \mathbb{R} \rightarrow \mathbb{R}\) on additiivinen.

Mutta onko jokainen additiivinen funktio line­aa­ri­­­nen? Jäljempänä osoitetaan, et­tä ei ole. Mutta sitä ennen tutustutaan vähän tällaisen addi­­tii­vi­sen ei-lineaarisen funktion omi­nai­suuksiin.

Additiivisen ei-lineaarisen funktion ominaisuuksia

Lause 4: Jos funktio \(f\colon \mathbb{R} \rightarrow \mathbb{R}\) on additiivinen ja ei-lineaarinen, sen kuvaaja on tiheä koko tasossa.

Lause “kuvaaja on tiheä koko tasossa” tarkoittaa, et­­tä tason \(\mathbb{R}^{2}\) jokaiselle pisteelle \((a, b)\) ja jokaiselle posi­tiiviselle reaaliluvulle \(r\) on olemassa \(x \in \mathbb{R}\) siten, että funktion \(f\) ku­vaa­jan pis­teen \((x, f(x))\) etäi­­­­syys pisteestä \((a,b)\) \[d = \sqrt{(x - a)^{2} + ( f(x) - b )^{2}}\] on pienempi kuin \(r\).

Lauseen 4 todistus: Valitaan mielivaltainen tason piste \((a, b)\) ja mielivaltainen positiivinen reaali­luku \(r\) ja oletetaan, että funktio \(f\) on additiivinen eli sillä on ominaisuus \((1)\), mutta se ei ole line­aa­ri­nen eli sillä ei ole ominaisuutta \((3)\).

Pistettä \((a, b)\) lähellä olevan funktion \(f\) kuvaajan pisteen \((x, f(x))\) löytämiseksi todetaan aluksi, et­tä kai­kille rationaaliluvuille \(q_{1}\) ja \(q_{2}\) ja kaikille re­aa­­li­­luvuille \(x_{1}\) ja \(x_{2}\) on tason piste \[P_{q_{1}x_{1}q_{2}x_{2}} = ( q_{1}x_{1} + q_{2}x_{2},q_{1}f( x_{1} ) + q_{2}f( x_{2})) \tag{5}\]

funktion \(f\) kuvaajan piste, sillä lauseen 1 ja mää­ri­­tel­män 1 mukaan

\[\begin{align*} &(q_{1}x_{1} + q_{2}x_{2}, q_{1}f(x_{1}) + q_{2}f(x_{2}))\\ &\phantom{mm}= ( q_{1}x_{1} + q_{2}x_{2}, f(q_{1}x_{1}) + f(q_{2}x_{2}))\\ &\phantom{mm}= ( q_{1}x_{1} + q_{2}x_{2}, f(q_{1}x_{1} + q_{2}x_{2})). \end{align*}\]

Pitää siis löytää reaaliluvut \(x_{1}\) ja \(x_{2}\) sekä ratio­naa­li­luvut \(q_{1}\) ja \(q_{2}\) siten, että pisteen\(\ P_{q_{1}x_{1}q_{2}x_{2}}\) \(x\)-koor­di­naatti \(q_{1}x_{1} + q_{2}x_{2}\) on lähellä\(\ a\):ta ja \(y\)-koor­­dinaatti \(q_{1}f( x_{1} ) + q_{2}f( x_{2} )\) lähellä \(b\):tä.

Valitaan ensin mielivaltainen \(x_{1} \in \mathbb{R}\backslash\{ 0 \}\). Koska \(f\) ei ole lineaarinen, on määritelmän 2 mukaan jo­kai­selle \(c \in \mathbb{R}\) ole­mas­sa \(x \in \mathbb{R}\) siten, että \(f(x) \neq cx\). Koska \(x_{1} \neq 0\), voidaan valita \(c = f( x_{1} )/x_{1}\), jolloin on olemassa \(x_{2} \in \mathbb{R}\) si­ten, että

\[f( x_{2} ) \neq \frac{f( x_{1} )}{x_{1}}x_{2},\]

jolloin

\[x_{1}f(x_{2}) - x_{2}f(x_{1}) \neq 0. \tag{6}\]

Reaaliluvut \(x_{1}\) ja \(x_{2}\) on nyt valittu. Pitää vielä löy­tää rationaaliluvut \(q_{1}\) ja \(q_{2}\), joille pisteen\(\ P_{q_{1}x_{1}q_{2}x_{2}}\) \(x\)-koor­di­naatti \(q_{1}x_{1}\ + q_{2}x_{2}\) on lähellä \(a\):ta ja \(y\)-koordinaatti \(q_{1}f( x_{1} ) + q_{2}f( x_{2} )\) lähellä \(b\):tä. Täs­sä tarkoi­tuksessa etsitään ensin reaali­luvut \(x\) ja \(y\), joille

\[\left\{ \begin{array}{@{}l} xx_{1} + yx_{2} = a,\\[4pt] xf( x_{1} ) + yf( x_{2} ) = b. \end{array} \right. \tag{7}\]

Koska (6):n mukaan \(x_{1}f( x_{2} ) - x_{2}f( x_{1} ) \neq 0\), on tällä yhtälöparilla ratkaisu

\[\left\{ \begin{array}{@{}l} x = \dfrac{af( x_{2} ) - bx_{2}}{x_{1}f( x_{2} ) - x_{2}f( x_{1} )},\\[6pt] y = \dfrac{bx_{1} - af( x_{1} )}{x_{1}f( x_{2} ) - x_{2}f( x_{1} )}. \end{array} \right.\]

Näin saadut \(x\) ja \(y\) eivät kuitenkaan ole vält­tämättä ra­tio­naalilukuja, joten sijoittamalla yhtälöön \((5)\) pis­­­teen \(P_{q_{1}x_{1}q_{2}x_{2}}\) koordinaatteihin \(q_{1}\):n paikalle \(x\) ja \(q_{2}\):n paikalle \(y\) ei aina saada funktion \(f\) ku­vaa­jan pis­tettä. Mutta nyt riit­­tää­kin löytää rationaaliluku \(q_{1}\) niin läheltä \(x\):ää ja ra­tio­naaliluku \(q_{2}\) niin läheltä \(y\):tä, että pisteen \(P_{q_{1}x_{1}q_{2}x_{2}}\) etäisyys pisteestä \((a, b)\) on pienempi kuin alussa valittu mielivaltainen posi­tiivinen reaaliluku \(r\).

Rationaalilukujen joukko on tiheä reaalilukujen joukossa, eli jokaisen reaa­li­lu­vun jokaisessa avoi­mes­sa ympäristössä on ainakin yksi rationaa­li­lu­ku. Tämä tarkoittaa, että olipa \(\delta\) mikä tahansa positiivinen re­aali­lu­ku, niin on olemassa ra­tio­naa­li­luku \(q_{1}\) siten, että \(\left| q_{1} - x \right| < \delta\), ja kun edellä oli valittu \(x_{1} \neq 0\), niin

\[\left| q_{1} - x \right|\left| x_{1} \right| < \delta\left| x_{1} \right|. \tag{8}\]

Tällöin on myös

\[\left| q_{1} - x \right|\left| f( x_{1} ) \right| \leq \delta\left| f( x_{1} ) \right|. \tag{9}\]

Samoin on olemassa ra­tio­naa­li­luku \(q_{2}\) siten, että \(\ \left| q_{2} - y \right| < \delta\), jolloin

\[\left| q_{2} - y \right|\left| x_{2} \right| \leq \delta\left| x_{2} \right| \tag{10}\]

ja

\[\left| q_{2} - y \right|\left| f( x_{2} ) \right| \leq \delta\left| f( x_{2} ) \right|. \tag{11}\]

Kolmioepäyhtälönä tunnetun reaalilukujen omi­nai­suuden mukaan kaikilla\(\ a \in \mathbb{R}\ \)ja kaikilla \(b \in \mathbb{R}\) on \(|a + b| \leq |a| + |b|\).

Yhtä­lö­pa­rin \((7)\) ensimmäistä yhtälöä, kolmio­epä­yh­tälöä ja epäyhtälöitä \((8)\) ja \((10)\ \)käyttäen saa­daan

\[\begin{align*} \left| q_{1}x_{1} + q_{2}x_{2} - a \right| &= \left| q_{1}x_{1} + q_{2}x_{2} - xx_{1} - yx_{2} \right|\\ &\leq \left| q_{1} - x \right|\left| x_{1} \right| + \left| q_{2} - y \right|\left| x_{2} \right|\\ &< \delta\left| x_{1} \right| + \delta\left| x_{2} \right| = \delta( \left| x_{1} \right| + \left| x_{2} \right|). \end{align*}\]

Yhtälöparin \((7)\) toista yhtälöä, kol­mio­epäyhtälöä ja epäyhtälöitä \((9)\) ja \((11)\) käyttäen saa­daan

\[\begin{align*} &\left| q_{1}f( x_{1}) + q_{2}f( x_{2}) - b \right|\\ &\phantom{mm}= \left| q_{1}f( x_{1} ) + q_{2}f( x_{2} ) - xf( x_{1} ) - yf( x_{2} ) \right|\\ &\phantom{mm}\leq \left| q_{1} - x \right|\left| f( x_{1} ) \right| + \left| q_{2} - y \right|\left| f( x_{2} ) \right|\\ &\phantom{mm}\leq \delta\left| f( x_{1} ) \right| + \delta\left| f( x_{2} ) \right| = \delta( \left| f( x_{1} ) \right| + \left| f( x_{2} ) \right|). \end{align*}\]

Näin valituilla luvuilla \(q_{1}\), \(x_{1}\),\(\ q_{2}\) ja \(x_{2}\) on piste

\[P_{q_{1}x_{1}q_{2}x_{2}} = ( q_{1}x_{1} + q_{2}x_{2},q_{1}f( x_{1} ) + q_{2}f( x_{2} ) )\]

funktion \(f\) kuvaajan piste. Sen ja pis­teen \((a,b)\) vä­­linen etäisyys

\[\begin{gather*} \sqrt{( q_{1}x_{1} + q_{2}x_{2} - a )^{2} + ( q_{1}f( x_{1} ) + q_{2}f( x_{2} ) - b )^{2}}\\[2pt] < \delta\sqrt{( \left| x_{1} \right| + \left| x_{2} \right| )^{2} + ( \left| f( x_{1} ) \right| + \left| f( x_{2} ) \right| )^{2}} \end{gather*}\]

on pienempi kuin edellä valittu pis­teen \((a, b)\) avoimen ympäristön mielivaltainen säde \(r > 0\), jos

\[\ \delta \leq \frac{r}{\sqrt{( \left| x_{1} \right| + \left| x_{2} \right| )^{2} + ( \left| f( x_{1} ) \right| + \left| f( x_{2} ) \right| )^{2}}}.\]

Lause 4 on näin todistettu. \(\Box\)

On siis osoitettu, että jos funktio on additiivinen, sen kuvaaja on joko origon kautta kulkeva suora tai pistejoukko, joka on tiheä koko tasossa.

Mielenkiintoista on erityisesti se, että tason jokaisen pisteen jokaisesta avoimesta ympäristöstä ei löy­dy ai­no­as­taan yh­tä, vaan itse asiassa äärettömän monta funktion \(f\) ku­vaa­jan pistettä, mikä voidaan to­dis­taa vas­ta­ole­tus­ta käyttäen.

Lauseesta 4 seuraa heti, että jos yhdelläkin tason pisteellä on avoin ympäristö, johon ei kuulu yh­tään addi­tiivisen funktion \(f\) kuvaajan pistettä, niin \(f\) on lineaarinen. Näin ollen esim. yhdelläkin avoimella vä­lillä yl­hääl­tä (tai alhaalta) rajoitettu additiivinen funktio on lineaarinen. Tästä taas seuraa, että addi­tii­vinen funktio on lineaarinen, jos se on yh­des­sä­kin pisteessä \(x_{0} \in \mathbb{R}\) jatkuva.

Additiivisen ei-lineaarisen funktion olemassaolo

Nyt tiedetään, millaisia additiiviset ei-lineaariset funktiot ovat. Mutta onko sellaisia ole­mas­sa?

Yksi ns. valinta-aksiooman seurauksista on

Lause 5: On olemassa reaalilukujen joukon osajoukko \(\mathcal{B}\) siten, että jokainen reaaliluku \(x\) voi­daan esittää yksikäsitteisellä tavalla äärellisen monen joukkoon \(\mathcal{B}\) kuuluvan luvun \(x_1, \ldots, x_n\) ra­tio­­naa­li­luku­ker­toi­mi­se­na li­ne­aa­ri­­kom­bi­naa­tio­na, siis muodossa

\[x = q_{1}x_{1}+\cdots+q_{n}x_{n},\]

missä \(\left\{ q_{1}, \ldots, q_{n} \right\} \subseteq \mathbb{Q}\), \(\left\{ x_{1}, \ldots, x_{n} \right\} \subseteq \mathcal{B}\).

Joukkoa \(\mathcal{B}\) kutsutaan reaalilukujen Hamelin kan­naksi saksalaisen matemaatikon Georg Karl Wilhelm Hamelin (12.9.1877­–­4.10.1954) mukaan.

Lauseen todistus menee niin syvälle joukko-opin perusteisiin, että se joudutaan tässä yhteydessä si­vuut­tamaan.

Kiusallista, mutta samalla erittäin viehättävää on se, että tätä joukkoa \(\mathcal{B}\) ei voida konstruoida, joten ei tiedetä, millainen esim. luvun 1 esitys on. Sen verran kuitenkin tiedetään, että luku 0 ei kuulu kantaan, sillä jos se kuuluisi ja esim. luvun 1 esitys kannan \(\mathcal{B}\) lukuja käyttäen olisi

\[1 = q_{1}x_{1} + \cdots + q_{n}x_{n},\]

niin olisi myös

\[1 = q_{1}x_{1} + \cdots + q_{n}x_{n} + c \cdot 0\]

jokaiselle reaaliluvulle \(c\) ja eri esityksiä olisi siis äärettömän monta.

Tiedetään myös, että kannassa \(\mathcal{B}\) on vähintään kaksi lukua, sillä jos siinä olisi vain yksi luku \(x_{1}\), olisi jokainen reaaliluku muotoa \(qx_{1}\), mis­sä \(q\) on rationaaliluku. Olisi siis oltava esim. \(1 = q_{1}x_{1}\) jollekin rationaaliluvulle \(q_{1}\) ja \(\sqrt{2} = q_{2}x_{1}\) jollekin rationaaliluvulle \(q_{2}\), mistä seuraisi, että

\[\sqrt{2} = \frac{\sqrt{2}}{1} = \frac{q_{2}x_{1}}{q_{1}x_{1}} = \frac{q_{2}}{q_{1}}\]

olisi rationaaliluku.

Itse asiassa kanta \(\mathcal{B}\) on ylinumeroituvasti ääretön lukujoukko ja sen mahtavuus (kardinaliteetti) on sa­ma kuin reaalilukujen joukon \(\mathbb{R}\), eli on ole­mas­sa bijektio \(g\colon\mathcal{B} \rightarrow \mathbb{R}\).

Oletetaan tästä alkaen, että \(x\):n esityksestä jätetään aina pois kaikki termit, joissa on kertoimena 0. Toi­sin sa­noen, oletetaan, että jos \(x \neq 0\) ja \(x = q_{1}x_{1} + \cdots + q_{n}x_{n}\), niin \(\left\{ q_{1},\ldots, q_{n} \right\} \subseteq \mathbb{Q}\backslash\{ 0 \}\).

Jos taas \(x = 0\) ja \(x = q_{1}x_{1} + \cdots + q_{n}x_{n}\), niin esityksen yksikäsitteisyyden vuoksi \(q_{1}x_{1} + \cdots + q_{n}x_{n} = 0\) toteutuu vain, jos \(q_{1} = \cdots = q_{n} = 0\), sillä \(0\):lla on myös esitys \(0 = 0x_{1} + \cdots + 0x_{n}\).

Hamelin kantaa käyttäen voidaan nyt todistaa

Lause 6: On olemassa funktio \(f \colon \mathbb{R} \rightarrow \mathbb{R}\), joka on additiivinen mutta ei lineaarinen.

Todistus: Valitaan ensin mielivaltainen funktio \(h\colon \mathcal{B} \rightarrow \mathbb{R}\) ja sen jälkeen funktio \(f \colon \mathbb{R} \rightarrow \mathbb{R}\) seuraavasti

\[f(x) = \left\{ \begin{array}{@{}l@{}l} 0,& \text{ jos } x = 0,\\ q_{1}h(x_{1}) + \cdots + q_{n}h(x_{n}),& \text{ jos } x \neq 0, \end{array} \right. \tag{12}\]

missä \(x = q_{1}x_{1} + \cdots + q_{n}x_{n}\), \(\left\{ q_{1}, \ldots, q_{n} \right\} \subseteq \mathbb{Q} \backslash \{ 0 \}\) ja \(\left\{ x_{1}, \ldots, x_{n} \right\} \subseteq \mathcal{B}\).

Koska \(x\):n esitys \(x = q_{1}x_{1} + \cdots + q_{n}x_{n}\) on yksi­käsitteinen, on myös \(f(x)\):n arvo yksikäsitteinen ja \(f\) on näin ollen funktio.

Näin määritellylle funktiolle \(f\) pätee

\[f(x) = h(x) \tag{13}\]

jokaiselle \(x \in \mathcal{B}\). Jos nimittäin \(x \in \mathcal{B}\), niin \(x \neq 0\) ja koska \(x\):n yksikäsitteinen esitys kannan \(\mathcal{B}\) lukujen li­ne­aari­kom­­binaationa on \(1x\), niin \(f(x) = f(1x) = 1h(x) = h(x)\).

Melko suoraviivaisesti edeten voidaan todistaa, että \(f\) on additiivinen.

Todistetaan nyt, että niiden funktioiden joukossa, joilla on ominaisuus (12), on ei-lineaarinen funktio.

Kuten edellä osoitettiin, on kannassa \(\mathcal{B}\) vähintään kaksi lukua, olkoot ne \(x_{1}\) ja \(x_{2}\). Jotta \(f\) olisi line­aa­ri­nen, olisi määritelmän 2 mukaan oltava olemassa \(c \in \mathbb{R}\) siten, että \(f(x) = cx\) kaikilla \(x \in \mathbb{R}\).

Siis \(f( x_{1} ) = cx_{1}\) ja \(f( x_{2} ) = cx_{2}\) jolloin

\[c = \frac{f( x_{1} )}{x_{1}} = \frac{f( x_{2} )}{x_{2}},\]

sillä kannan \(\mathcal{B}\) lukuina \(x_{1} \neq 0\) ja \(x_{2} \neq 0\). Tällöin on yhtälön (13) mukaan

\[\frac{h( x_{1} )}{x_{1}} = \frac{f( x_{1} )}{x_{1}} = \frac{f( x_{2} )}{x_{2}} = \frac{h( x_{2} )}{x_{2}}.\]

Tämä tarkoittaa, että \(f\) on lineaarinen vain, jos

\[h( x_{2} ) = \frac{h( x_{1} )}{x_{1}}x_{2},\]

joten jos valitaan

\[h( x_{2} ) \neq \frac{h( x_{1} )}{x_{1}}x_{2},\]

saadaan ei-lineaarinen funktio \(f\), jolla on ominaisuus (12) ja joka on näin ollen additiivinen. \(\Box\)

Tästä voidaan päätellä kaksi mielenkiintoista asiaa.

Ensiksi se, että pienikin \(h( x_{2} )\):n poikkeama luvusta \(x_{2}\frac{h( x_{1} )}{x_{1}}\) aiheuttaa sen, että \(f\) muuttuu line­aa­ri­sesta ei-lineaariseksi. Koska \(f\) on additiivinen, tämä tarkoittaa lauseen 4 mukaan, että funktion \(f\) ku­vaa­ja hajoaa origon kautta kulkevasta suorasta pistejoukoksi, joka on tiheä koko tasossa.

Toiseksi se, että kun on vain yksi \(h(x_{2})\):n arvo, jolla \(f\) on lineaarinen, ja äärettömän monta, joilla ei ole, lineaarisuus on harvinaista additiivisten funktioiden joukossa. Jopa niin harvinaista, että umpi­mäh­­kään va­lit­tu additiivinen funktio on lineaarinen toden­nä­köi­syy­dellä 0.

Siitä, millaisia additiiviset ei-lineaariset funktiot ovat, saa jonkinlaisen käsityksen, jos alkaa piir­tää sel­lai­sen kuvaajaa. Tällöinhän on piirrettävä jo­kai­selle pystysuoralle suoralle yksi kuvaajan pis­te ja jokai­seen sen avoimeen ympäristöön ää­ret­tömän monta kuvaajan pistettä.

Ei siis ole ihme, jos addi­tii­vi­si­a ei-li­ne­aa­ris­ia funktioita kutsutaan joskus “hir­viö­funk­ti­oiksi” (“monster functions”).

Tästä kirjoituksesta on yksityiskohtaisempi versio Matematiikkalehti Solmun Oppimateriaalit-sivulla:
https://matematiikkalehtisolmu.fi/oppimateriaalit.html

Lähteet

  1. Augustin-Louis Cauchy:
    https://en.wikipedia.org/wiki/Augustin-Louis_Cauchy [25.11.2023]

  2. Lauseen 4 todistuksen periaate:
    https://en.wikipedia.org/wiki/Cauchy%27s_functional_equation [25.11.2023]

  3. Georg Karl Wilhelm Hamel:
    https://en.wikipedia.org/wiki/Georg_Hamel [25.11.2023]

  4. Hamelin kannan olemassaolo ja kardinaliteetti:
    http://thales.doa.fmph.uniba.sk/sleziak/texty/rozne/pozn/tm/hamel.pdf ­[25.11.2023]

  5. Additiivisen ei-lineaarisen funktion muo­dos­ta­misen periaate:
    https://en.wikipedia.org/wiki/Cauchy%27s_functional_equation [25.11.2023]