Kiehtovaa matematiikkaa, Cauchyn funktionaaliyhtälö
Lasse Pantsar
Additiivisuus ja lineaarisuus
Määritelmä 1: Funktio \(f \colon \mathbb{R} \rightarrow \mathbb{R}\) on additiivinen, jos se toteuttaa Cauchyn funktionaaliyhtälön \[f ( x + y )= f ( x )+ f ( y ) \tag{1}\]
kaikilla \(x \in \mathbb{R}\) ja kaikilla \(y \in \mathbb{R}\).
Helposti voidaan todistaa
Lause 1: Jos funktio \(f\colon \mathbb{R} \rightarrow \mathbb{R}\) on additiivinen, on
\[f(qx )= qf(x) \tag{2}\]
kaikilla \(q \in \mathbb{Q}\) ja kaikilla \(x \in \mathbb{R}\).
Jokaisella additiivisella funktiolla \(f\) on siis ominaisuus \((2)\), mutta toteutuuko yhtälö \(f(rx) = rf(x)\) kaikille additiivisille funktioille \(f\) ja kaikille reaaliluvuille \(r\) ja \(x\)? Tämän selvittämiseksi otetaan käyttöön lineaarisen funktion käsite.
Määritelmä 2: Funktio \(f\colon \mathbb{R} \rightarrow \mathbb{R}\) on lineaarinen, jos on olemassa \(c \in \mathbb{R}\) siten, että
\[f(x)= cx \tag{3}\]
kaikilla \(x \in \mathbb{R}\).
Nyt voidaan todistaa:
Lause 2: Funktio \(f\colon \mathbb{R} \rightarrow \mathbb{R}\) on lineaarinen, jos ja vain jos
\[f (rx) = rf(x) \tag{4}\]
kaikilla \(r \in \mathbb{R}\) ja kaikilla \(x \in \mathbb{R}\).
Termi lineaarinen tulee siitä, että tällaisen funktion kuvaaja on origon kautta kulkeva suora.
Määritelmästä seuraa välittömästi
Lause 3: Jokainen lineaarinen funktio \(f\colon \mathbb{R} \rightarrow \mathbb{R}\) on additiivinen.
Mutta onko jokainen additiivinen funktio lineaarinen? Jäljempänä osoitetaan, että ei ole. Mutta sitä ennen tutustutaan vähän tällaisen additiivisen ei-lineaarisen funktion ominaisuuksiin.
Additiivisen ei-lineaarisen funktion ominaisuuksia
Lause 4: Jos funktio \(f\colon \mathbb{R} \rightarrow \mathbb{R}\) on additiivinen ja ei-lineaarinen, sen kuvaaja on tiheä koko tasossa.
Lause “kuvaaja on tiheä koko tasossa” tarkoittaa, että tason \(\mathbb{R}^{2}\) jokaiselle pisteelle \((a, b)\) ja jokaiselle positiiviselle reaaliluvulle \(r\) on olemassa \(x \in \mathbb{R}\) siten, että funktion \(f\) kuvaajan pisteen \((x, f(x))\) etäisyys pisteestä \((a,b)\) \[d = \sqrt{(x - a)^{2} + ( f(x) - b )^{2}}\] on pienempi kuin \(r\).
Lauseen 4 todistus: Valitaan mielivaltainen tason piste \((a, b)\) ja mielivaltainen positiivinen reaaliluku \(r\) ja oletetaan, että funktio \(f\) on additiivinen eli sillä on ominaisuus \((1)\), mutta se ei ole lineaarinen eli sillä ei ole ominaisuutta \((3)\).
Pistettä \((a, b)\) lähellä olevan funktion \(f\) kuvaajan pisteen \((x, f(x))\) löytämiseksi todetaan aluksi, että kaikille rationaaliluvuille \(q_{1}\) ja \(q_{2}\) ja kaikille reaaliluvuille \(x_{1}\) ja \(x_{2}\) on tason piste \[P_{q_{1}x_{1}q_{2}x_{2}} = ( q_{1}x_{1} + q_{2}x_{2},q_{1}f( x_{1} ) + q_{2}f( x_{2})) \tag{5}\]
funktion \(f\) kuvaajan piste, sillä lauseen 1 ja määritelmän 1 mukaan
\[\begin{align*} &(q_{1}x_{1} + q_{2}x_{2}, q_{1}f(x_{1}) + q_{2}f(x_{2}))\\ &\phantom{mm}= ( q_{1}x_{1} + q_{2}x_{2}, f(q_{1}x_{1}) + f(q_{2}x_{2}))\\ &\phantom{mm}= ( q_{1}x_{1} + q_{2}x_{2}, f(q_{1}x_{1} + q_{2}x_{2})). \end{align*}\]
Pitää siis löytää reaaliluvut \(x_{1}\) ja \(x_{2}\) sekä rationaaliluvut \(q_{1}\) ja \(q_{2}\) siten, että pisteen\(\ P_{q_{1}x_{1}q_{2}x_{2}}\) \(x\)-koordinaatti \(q_{1}x_{1} + q_{2}x_{2}\) on lähellä\(\ a\):ta ja \(y\)-koordinaatti \(q_{1}f( x_{1} ) + q_{2}f( x_{2} )\) lähellä \(b\):tä.
Valitaan ensin mielivaltainen \(x_{1} \in \mathbb{R}\backslash\{ 0 \}\). Koska \(f\) ei ole lineaarinen, on määritelmän 2 mukaan jokaiselle \(c \in \mathbb{R}\) olemassa \(x \in \mathbb{R}\) siten, että \(f(x) \neq cx\). Koska \(x_{1} \neq 0\), voidaan valita \(c = f( x_{1} )/x_{1}\), jolloin on olemassa \(x_{2} \in \mathbb{R}\) siten, että
\[f( x_{2} ) \neq \frac{f( x_{1} )}{x_{1}}x_{2},\]
jolloin
\[x_{1}f(x_{2}) - x_{2}f(x_{1}) \neq 0. \tag{6}\]
Reaaliluvut \(x_{1}\) ja \(x_{2}\) on nyt valittu. Pitää vielä löytää rationaaliluvut \(q_{1}\) ja \(q_{2}\), joille pisteen\(\ P_{q_{1}x_{1}q_{2}x_{2}}\) \(x\)-koordinaatti \(q_{1}x_{1}\ + q_{2}x_{2}\) on lähellä \(a\):ta ja \(y\)-koordinaatti \(q_{1}f( x_{1} ) + q_{2}f( x_{2} )\) lähellä \(b\):tä. Tässä tarkoituksessa etsitään ensin reaaliluvut \(x\) ja \(y\), joille
\[\left\{ \begin{array}{@{}l} xx_{1} + yx_{2} = a,\\[4pt] xf( x_{1} ) + yf( x_{2} ) = b. \end{array} \right. \tag{7}\]
Koska (6):n mukaan \(x_{1}f( x_{2} ) - x_{2}f( x_{1} ) \neq 0\), on tällä yhtälöparilla ratkaisu
\[\left\{ \begin{array}{@{}l} x = \dfrac{af( x_{2} ) - bx_{2}}{x_{1}f( x_{2} ) - x_{2}f( x_{1} )},\\[6pt] y = \dfrac{bx_{1} - af( x_{1} )}{x_{1}f( x_{2} ) - x_{2}f( x_{1} )}. \end{array} \right.\]
Näin saadut \(x\) ja \(y\) eivät kuitenkaan ole välttämättä rationaalilukuja, joten sijoittamalla yhtälöön \((5)\) pisteen \(P_{q_{1}x_{1}q_{2}x_{2}}\) koordinaatteihin \(q_{1}\):n paikalle \(x\) ja \(q_{2}\):n paikalle \(y\) ei aina saada funktion \(f\) kuvaajan pistettä. Mutta nyt riittääkin löytää rationaaliluku \(q_{1}\) niin läheltä \(x\):ää ja rationaaliluku \(q_{2}\) niin läheltä \(y\):tä, että pisteen \(P_{q_{1}x_{1}q_{2}x_{2}}\) etäisyys pisteestä \((a, b)\) on pienempi kuin alussa valittu mielivaltainen positiivinen reaaliluku \(r\).
Rationaalilukujen joukko on tiheä reaalilukujen joukossa, eli jokaisen reaaliluvun jokaisessa avoimessa ympäristössä on ainakin yksi rationaaliluku. Tämä tarkoittaa, että olipa \(\delta\) mikä tahansa positiivinen reaaliluku, niin on olemassa rationaaliluku \(q_{1}\) siten, että \(\left| q_{1} - x \right| < \delta\), ja kun edellä oli valittu \(x_{1} \neq 0\), niin
\[\left| q_{1} - x \right|\left| x_{1} \right| < \delta\left| x_{1} \right|. \tag{8}\]
Tällöin on myös
\[\left| q_{1} - x \right|\left| f( x_{1} ) \right| \leq \delta\left| f( x_{1} ) \right|. \tag{9}\]
Samoin on olemassa rationaaliluku \(q_{2}\) siten, että \(\ \left| q_{2} - y \right| < \delta\), jolloin
\[\left| q_{2} - y \right|\left| x_{2} \right| \leq \delta\left| x_{2} \right| \tag{10}\]
ja
\[\left| q_{2} - y \right|\left| f( x_{2} ) \right| \leq \delta\left| f( x_{2} ) \right|. \tag{11}\]
Kolmioepäyhtälönä tunnetun reaalilukujen ominaisuuden mukaan kaikilla\(\ a \in \mathbb{R}\ \)ja kaikilla \(b \in \mathbb{R}\) on \(|a + b| \leq |a| + |b|\).
Yhtälöparin \((7)\) ensimmäistä yhtälöä, kolmioepäyhtälöä ja epäyhtälöitä \((8)\) ja \((10)\ \)käyttäen saadaan
\[\begin{align*} \left| q_{1}x_{1} + q_{2}x_{2} - a \right| &= \left| q_{1}x_{1} + q_{2}x_{2} - xx_{1} - yx_{2} \right|\\ &\leq \left| q_{1} - x \right|\left| x_{1} \right| + \left| q_{2} - y \right|\left| x_{2} \right|\\ &< \delta\left| x_{1} \right| + \delta\left| x_{2} \right| = \delta( \left| x_{1} \right| + \left| x_{2} \right|). \end{align*}\]
Yhtälöparin \((7)\) toista yhtälöä, kolmioepäyhtälöä ja epäyhtälöitä \((9)\) ja \((11)\) käyttäen saadaan
\[\begin{align*} &\left| q_{1}f( x_{1}) + q_{2}f( x_{2}) - b \right|\\ &\phantom{mm}= \left| q_{1}f( x_{1} ) + q_{2}f( x_{2} ) - xf( x_{1} ) - yf( x_{2} ) \right|\\ &\phantom{mm}\leq \left| q_{1} - x \right|\left| f( x_{1} ) \right| + \left| q_{2} - y \right|\left| f( x_{2} ) \right|\\ &\phantom{mm}\leq \delta\left| f( x_{1} ) \right| + \delta\left| f( x_{2} ) \right| = \delta( \left| f( x_{1} ) \right| + \left| f( x_{2} ) \right|). \end{align*}\]
Näin valituilla luvuilla \(q_{1}\), \(x_{1}\),\(\ q_{2}\) ja \(x_{2}\) on piste
\[P_{q_{1}x_{1}q_{2}x_{2}} = ( q_{1}x_{1} + q_{2}x_{2},q_{1}f( x_{1} ) + q_{2}f( x_{2} ) )\]
funktion \(f\) kuvaajan piste. Sen ja pisteen \((a,b)\) välinen etäisyys
\[\begin{gather*} \sqrt{( q_{1}x_{1} + q_{2}x_{2} - a )^{2} + ( q_{1}f( x_{1} ) + q_{2}f( x_{2} ) - b )^{2}}\\[2pt] < \delta\sqrt{( \left| x_{1} \right| + \left| x_{2} \right| )^{2} + ( \left| f( x_{1} ) \right| + \left| f( x_{2} ) \right| )^{2}} \end{gather*}\]
on pienempi kuin edellä valittu pisteen \((a, b)\) avoimen ympäristön mielivaltainen säde \(r > 0\), jos
\[\ \delta \leq \frac{r}{\sqrt{( \left| x_{1} \right| + \left| x_{2} \right| )^{2} + ( \left| f( x_{1} ) \right| + \left| f( x_{2} ) \right| )^{2}}}.\]
Lause 4 on näin todistettu. \(\Box\)
On siis osoitettu, että jos funktio on additiivinen, sen kuvaaja on joko origon kautta kulkeva suora tai pistejoukko, joka on tiheä koko tasossa.
Mielenkiintoista on erityisesti se, että tason jokaisen pisteen jokaisesta avoimesta ympäristöstä ei löydy ainoastaan yhtä, vaan itse asiassa äärettömän monta funktion \(f\) kuvaajan pistettä, mikä voidaan todistaa vastaoletusta käyttäen.
Lauseesta 4 seuraa heti, että jos yhdelläkin tason pisteellä on avoin ympäristö, johon ei kuulu yhtään additiivisen funktion \(f\) kuvaajan pistettä, niin \(f\) on lineaarinen. Näin ollen esim. yhdelläkin avoimella välillä ylhäältä (tai alhaalta) rajoitettu additiivinen funktio on lineaarinen. Tästä taas seuraa, että additiivinen funktio on lineaarinen, jos se on yhdessäkin pisteessä \(x_{0} \in \mathbb{R}\) jatkuva.
Additiivisen ei-lineaarisen funktion olemassaolo
Nyt tiedetään, millaisia additiiviset ei-lineaariset funktiot ovat. Mutta onko sellaisia olemassa?
Yksi ns. valinta-aksiooman seurauksista on
Lause 5: On olemassa reaalilukujen joukon osajoukko \(\mathcal{B}\) siten, että jokainen reaaliluku \(x\) voidaan esittää yksikäsitteisellä tavalla äärellisen monen joukkoon \(\mathcal{B}\) kuuluvan luvun \(x_1, \ldots, x_n\) rationaalilukukertoimisena lineaarikombinaationa, siis muodossa
\[x = q_{1}x_{1}+\cdots+q_{n}x_{n},\]
missä \(\left\{ q_{1}, \ldots, q_{n} \right\} \subseteq \mathbb{Q}\), \(\left\{ x_{1}, \ldots, x_{n} \right\} \subseteq \mathcal{B}\).
Joukkoa \(\mathcal{B}\) kutsutaan reaalilukujen Hamelin kannaksi saksalaisen matemaatikon Georg Karl Wilhelm Hamelin (12.9.1877–4.10.1954) mukaan.
Lauseen todistus menee niin syvälle joukko-opin perusteisiin, että se joudutaan tässä yhteydessä sivuuttamaan.
Kiusallista, mutta samalla erittäin viehättävää on se, että tätä joukkoa \(\mathcal{B}\) ei voida konstruoida, joten ei tiedetä, millainen esim. luvun 1 esitys on. Sen verran kuitenkin tiedetään, että luku 0 ei kuulu kantaan, sillä jos se kuuluisi ja esim. luvun 1 esitys kannan \(\mathcal{B}\) lukuja käyttäen olisi
\[1 = q_{1}x_{1} + \cdots + q_{n}x_{n},\]
niin olisi myös
\[1 = q_{1}x_{1} + \cdots + q_{n}x_{n} + c \cdot 0\]
jokaiselle reaaliluvulle \(c\) ja eri esityksiä olisi siis äärettömän monta.
Tiedetään myös, että kannassa \(\mathcal{B}\) on vähintään kaksi lukua, sillä jos siinä olisi vain yksi luku \(x_{1}\), olisi jokainen reaaliluku muotoa \(qx_{1}\), missä \(q\) on rationaaliluku. Olisi siis oltava esim. \(1 = q_{1}x_{1}\) jollekin rationaaliluvulle \(q_{1}\) ja \(\sqrt{2} = q_{2}x_{1}\) jollekin rationaaliluvulle \(q_{2}\), mistä seuraisi, että
\[\sqrt{2} = \frac{\sqrt{2}}{1} = \frac{q_{2}x_{1}}{q_{1}x_{1}} = \frac{q_{2}}{q_{1}}\]
olisi rationaaliluku.
Itse asiassa kanta \(\mathcal{B}\) on ylinumeroituvasti ääretön lukujoukko ja sen mahtavuus (kardinaliteetti) on sama kuin reaalilukujen joukon \(\mathbb{R}\), eli on olemassa bijektio \(g\colon\mathcal{B} \rightarrow \mathbb{R}\).
Oletetaan tästä alkaen, että \(x\):n esityksestä jätetään aina pois kaikki termit, joissa on kertoimena 0. Toisin sanoen, oletetaan, että jos \(x \neq 0\) ja \(x = q_{1}x_{1} + \cdots + q_{n}x_{n}\), niin \(\left\{ q_{1},\ldots, q_{n} \right\} \subseteq \mathbb{Q}\backslash\{ 0 \}\).
Jos taas \(x = 0\) ja \(x = q_{1}x_{1} + \cdots + q_{n}x_{n}\), niin esityksen yksikäsitteisyyden vuoksi \(q_{1}x_{1} + \cdots + q_{n}x_{n} = 0\) toteutuu vain, jos \(q_{1} = \cdots = q_{n} = 0\), sillä \(0\):lla on myös esitys \(0 = 0x_{1} + \cdots + 0x_{n}\).
Hamelin kantaa käyttäen voidaan nyt todistaa
Lause 6: On olemassa funktio \(f \colon \mathbb{R} \rightarrow \mathbb{R}\), joka on additiivinen mutta ei lineaarinen.
Todistus: Valitaan ensin mielivaltainen funktio \(h\colon \mathcal{B} \rightarrow \mathbb{R}\) ja sen jälkeen funktio \(f \colon \mathbb{R} \rightarrow \mathbb{R}\) seuraavasti
\[f(x) = \left\{ \begin{array}{@{}l@{}l} 0,& \text{ jos } x = 0,\\ q_{1}h(x_{1}) + \cdots + q_{n}h(x_{n}),& \text{ jos } x \neq 0, \end{array} \right. \tag{12}\]
missä \(x = q_{1}x_{1} + \cdots + q_{n}x_{n}\), \(\left\{ q_{1}, \ldots, q_{n} \right\} \subseteq \mathbb{Q} \backslash \{ 0 \}\) ja \(\left\{ x_{1}, \ldots, x_{n} \right\} \subseteq \mathcal{B}\).
Koska \(x\):n esitys \(x = q_{1}x_{1} + \cdots + q_{n}x_{n}\) on yksikäsitteinen, on myös \(f(x)\):n arvo yksikäsitteinen ja \(f\) on näin ollen funktio.
Näin määritellylle funktiolle \(f\) pätee
\[f(x) = h(x) \tag{13}\]
jokaiselle \(x \in \mathcal{B}\). Jos nimittäin \(x \in \mathcal{B}\), niin \(x \neq 0\) ja koska \(x\):n yksikäsitteinen esitys kannan \(\mathcal{B}\) lukujen lineaarikombinaationa on \(1x\), niin \(f(x) = f(1x) = 1h(x) = h(x)\).
Melko suoraviivaisesti edeten voidaan todistaa, että \(f\) on additiivinen.
Todistetaan nyt, että niiden funktioiden joukossa, joilla on ominaisuus (12), on ei-lineaarinen funktio.
Kuten edellä osoitettiin, on kannassa \(\mathcal{B}\) vähintään kaksi lukua, olkoot ne \(x_{1}\) ja \(x_{2}\). Jotta \(f\) olisi lineaarinen, olisi määritelmän 2 mukaan oltava olemassa \(c \in \mathbb{R}\) siten, että \(f(x) = cx\) kaikilla \(x \in \mathbb{R}\).
Siis \(f( x_{1} ) = cx_{1}\) ja \(f( x_{2} ) = cx_{2}\) jolloin
\[c = \frac{f( x_{1} )}{x_{1}} = \frac{f( x_{2} )}{x_{2}},\]
sillä kannan \(\mathcal{B}\) lukuina \(x_{1} \neq 0\) ja \(x_{2} \neq 0\). Tällöin on yhtälön (13) mukaan
\[\frac{h( x_{1} )}{x_{1}} = \frac{f( x_{1} )}{x_{1}} = \frac{f( x_{2} )}{x_{2}} = \frac{h( x_{2} )}{x_{2}}.\]
Tämä tarkoittaa, että \(f\) on lineaarinen vain, jos
\[h( x_{2} ) = \frac{h( x_{1} )}{x_{1}}x_{2},\]
joten jos valitaan
\[h( x_{2} ) \neq \frac{h( x_{1} )}{x_{1}}x_{2},\]
saadaan ei-lineaarinen funktio \(f\), jolla on ominaisuus (12) ja joka on näin ollen additiivinen. \(\Box\)
Tästä voidaan päätellä kaksi mielenkiintoista asiaa.
Ensiksi se, että pienikin \(h( x_{2} )\):n poikkeama luvusta \(x_{2}\frac{h( x_{1} )}{x_{1}}\) aiheuttaa sen, että \(f\) muuttuu lineaarisesta ei-lineaariseksi. Koska \(f\) on additiivinen, tämä tarkoittaa lauseen 4 mukaan, että funktion \(f\) kuvaaja hajoaa origon kautta kulkevasta suorasta pistejoukoksi, joka on tiheä koko tasossa.
Toiseksi se, että kun on vain yksi \(h(x_{2})\):n arvo, jolla \(f\) on lineaarinen, ja äärettömän monta, joilla ei ole, lineaarisuus on harvinaista additiivisten funktioiden joukossa. Jopa niin harvinaista, että umpimähkään valittu additiivinen funktio on lineaarinen todennäköisyydellä 0.
Siitä, millaisia additiiviset ei-lineaariset funktiot ovat, saa jonkinlaisen käsityksen, jos alkaa piirtää sellaisen kuvaajaa. Tällöinhän on piirrettävä jokaiselle pystysuoralle suoralle yksi kuvaajan piste ja jokaiseen sen avoimeen ympäristöön äärettömän monta kuvaajan pistettä.
Ei siis ole ihme, jos additiivisia ei-lineaarisia funktioita kutsutaan joskus “hirviöfunktioiksi” (“monster functions”).
Tästä kirjoituksesta on yksityiskohtaisempi versio Matematiikkalehti Solmun Oppimateriaalit-sivulla:
https://matematiikkalehtisolmu.fi/oppimateriaalit.html
Lähteet
Augustin-Louis Cauchy:
https://en.wikipedia.org/wiki/Augustin-Louis_Cauchy [25.11.2023]Lauseen 4 todistuksen periaate:
https://en.wikipedia.org/wiki/Cauchy%27s_functional_equation [25.11.2023]Georg Karl Wilhelm Hamel:
https://en.wikipedia.org/wiki/Georg_Hamel [25.11.2023]Hamelin kannan olemassaolo ja kardinaliteetti:
http://thales.doa.fmph.uniba.sk/sleziak/texty/rozne/pozn/tm/hamel.pdf [25.11.2023]Additiivisen ei-lineaarisen funktion muodostamisen periaate:
https://en.wikipedia.org/wiki/Cauchy%27s_functional_equation [25.11.2023]