Analyysin peruslause

1. Johdanto

Derivoiminen ja integroiminen ovat matemaattisen analyysin perustyökaluja, joilla on karkeasti sanottuna vastakkaiset vaikutukset. Geometrisesti derivoiminen kuvaa tangentin asettamista ja integroiminen pinta-alan laskemista. Palautamme aluksi mieleen integraalilaskennan kaksi peruskäsitettä. Sanomme, että funktio F on f:n integraalifunktio, jos F'(x)=f(x) kaikilla $x\in[a,b]$. Tässä mielessä siis integroiminen on derivoimisen käänteisoperaatio: funktio on derivaattansa integraalifunktio. Sen sijaan määrätty integraali kertoo funktion kuvaajan ja koordinaattiakselin väliin jäävän alueen pinta-alan. Määrätyn integraalin laskemisella on siis erittäin geometrinen merkitys. Analyysin peruslause, joka on mahdollisesti yksi kauneimmista ja hyödyllisimmistä matemaatisista lauseista, liittää derivaatan, integraalifunktion ja määrätyn integraalin käsitetteet toisiinsa.

Kuva 1: Funktion kuvaajan ja koordinaattiakselin väliin jäävä pinta-ala.

Ajatellaan esimerkiksi suoraviivaisesti etenevää liikettä. Jos liikkuja lähtee nollapisteestä ja hetkella t>0 sen sijainti reaaliakselilla on f(t), niin silloin derivaatta f'(t) on liikkujan nopeus hetkellä t ja toinen derivaatta f''(t) on liikkujan kiihtyvyys hetkellä t. Jos nopeus v on vakio, niin liikkujan sijainti hetkellä t0 saadaan tutulla kaavalla

\begin{equation*}s=vt_0.\end{equation*}

Se että nopeus on vakio tarkoittaa, että f'(t)=v kaikilla t>0 ja huomaamme, että yllä oleva tuttu kaava voidaankin esittää määrätyn integraalin avulla

\begin{equation*}f(t_0)=s=vt_0=\int_0^{t_0}f'(t)\,dt.\end{equation*}

Liikkujan sijainnin laskeminen muuttuu hankalammaksi jos nopeus vaihtelee ajan mukana. Oletetaan vaikka, että nopeus hetkellä t on 2t. Missä liikkuja on nyt hetkellä t0? Käyttämällä edellä ollutta merkintää, oletus tarkoittaa, että f'(t)=2t. Analyysin peruslauseen mukaan

\begin{equation*}f(t_0)=f(t_0)-f(0)
=\int_0^{t_0}f'(t)\,dt
=\int_0^{t_0}2t\,dt
=t_0^2.
\end{equation*}

Tämän kirjoituksen tarkoituksena on pohtia analyysin peruslauseen väitteitä ja oletuksia. Emme niinkään pyri aina esittämään matemaattisesti tarkkoja todistuksia vaan valottamaan asiaa esimerkkien ja todistusluonnosten avulla.

2. Klassinen analyysin peruslause

Analyysin peruslauseessa on kaksi osaa.

Ensimmäisen osan klassinen muotoilu. Ensimmäinen osa kertoo sen, että jos f on jatkuva funktio välillä [a,b] ja

 \begin{displaymath}
F(x)=\int_a^x f(t)\,dt,
\qquad a\le x\le b,
\end{displaymath} (1)

niin F on derivoituva välillä [a,b] ja F'(x)=f(x) kaikilla $x\in[a,b]$. Päätepisteissä täytyy ottaa toispuoleiset derivaatat. Tämän mukaan jokaisella jatkuvalla funktiolla on integraalifunktio eli jokainen jatkuva funktio on jonkin funktion derivaatta. Integraalifunktiolle saadaan jopa esitys määratyn integraalin avulla eli laskemalla tietyn alueen pinta-ala kaavalla (1). Lause ei kuitenkaan kerro mitään siitä, voidaanko integraalifunktio esittää alkeisfunktioitten avulla eli kuinka integraalifunktio todella lasketaan. Esimerkiksi funktion

 \begin{displaymath}
f(t)=(1+t^2)^{1/3},
\qquad -1\le t\le1.
\end{displaymath} (2)

eräs integraalifunktio on

\begin{equation*}F(x)=\int_{-1}^x (1+t^2)^{1/3}\,dt,\qquad -1\le x\le 1,
\end{equation*}

mutta on mahdotonta esittää yllä olevaa integraalia alkeisfunktioitten avulla. Tämä esimerkki näyttää sen, että derivointi on yleensä helpompaa kuin integrointi. Kaavalla (2) määritelty funktio on helppo derivoida soveltamalla tunnettuja derivointisääntöjä, mutta ei ole olemassa mitään yleistä keinoa sen integraalifunktion esittämiseksi alkeisfunktioitten avulla.

Toisen osan klassinen muotoilu. Lauseen toisen osan mukaan tietyillä oletuksilla funktio saadaan takaisin integroimalla derivaatastaan. Tarkemmin sanottuna, jos F on jatkuvasti derivoituva funktio välillä [a,b] ja F'(x)=f(x) kaikilla $x\in[a,b]$, niin

\begin{equation*}F(b)-F(a)=\int_a^b f(t)\,dt.\end{equation*}

Tämä antaa keinon funktion määrätyn integraalin eli funktion kuvaajan rajoittaman pinta-alan laskemiseksi integraalifunktion avulla.

3. Moderni analyysin peruslause

Pohditaan seuraavaksi hieman analyysin peruslauseen oletuksia. Katsotaan aluksi paria esimerkkiä.

Olkoon tarkasteluväli [-1,1] ja määritellään

\begin{equation*}f(t)=\begin{cases}
0,&\qquad -1\le t<0,\\ 1,&\qquad 0\le t\le1.
\end{cases}\end{equation*}

Tämä funktio ei ole jatkuva, mutta analyysin peruslauseen ensimmäinen osa pätee, jos unohdamme epäjatkuvuuskohdan nollassa. Kaavalla (1) määritelty funktio on tässä tapauksessa

\begin{equation*}F(x)=\begin{cases}
0,&\qquad -1\le x\le 0,\\ x,&\qquad 0<x\le1,
\end{cases}\end{equation*}

ja nollan ulkopuolella se on derivoituva ja sen derivaatta on f.

Tarkastellaan sitten analyysin peruslauseen toista osaa saman esimerkin valossa. Nyt F on jatkuvasti derivoituva nollan ulkopuolella ja F'(x)=f(x) kun $x\ne0$. Lisäksi kaava (1) pätee. Esimerkkimme viittaa siihen, että ainakaan oletus funktion f jatkuvuudesta ei näytä kovinkaan tärkeältä, jos analyysin peruslauseen väitteitä hieman muokataan.

Ensimmäisessä esimerkissämme "derivaattafunktio" f on epäjatkuva, mutta funktio F ei ollutkaan derivoituva nollassa. Samanlainen ilmiö voi kuitenkin tapahtua vaikka funktio on derivoituva kaikkialla. Siis se, että funktio on derivoituva kaikkialla, ei takaa derivaatan jatkuvuutta. Tämän näemme tutkimalla funktiota

 \begin{displaymath}
F(t)=
\begin{cases}
t^2\sin\dfrac 1{t^2},&\qquad -1\le t<0,\,0<t\le 1,
\\
0,&\qquad t=0.
\end{cases}\end{displaymath} (3)

Tämä funktio käyttäytyy kaukana nollasta hyvin, mutta nollan lähellä se heilahtelee melko pahasti. Kerroin t2 pitää kuitenkin huolen siitä, että funktion arvot lähestyvät nollaa riittävän nopeasti. Kun $t\ne0$, niin F on derivoituva ja suoralla laskulla havaitsemme, että

\begin{equation*}F'(t)
=2t\sin\frac1{t^2}-\frac2t\cos\frac1{t^2}.
\end{equation*}

Tällä ei ole raja-arvoa pisteessä 0.


Kuva 2: Function F(t) kuvaaja lähellä origoa.

Tapaus t=0 vaatii erikoistarkastelun. Kirjoittamalla auki erotusosamäärään näemme, että

\begin{equation*}\frac{F(t)-F(0)}{t-0}
=t\sin\frac1{t^2},\qquad t>0.\end{equation*}

Ottamalla puolittain itseisarvot saamme arvion

\begin{equation*}\left\vert\frac{F(t)}t\right\vert
\le\vert t\vert,\end{equation*}

ja tästä seuraa, että

\begin{equation*}F'(0)=\lim_{t\to0}\frac{F(t)-F(0)}{t-0}=0.\end{equation*}

Siis F on derivoituva kaikkialla, mutta derivaattafunktio ei ole jatkuva.

Lebesguen integraali. Ymmärtääksemme analyysin peruslauseen yleisen muotoilun tarvitsemme tavallista määrättyä integraalia yleisemmän Lebesguen integraalin, jonka avulla voimme laskea hyvin epäsäännöllisten funktioitten integraaleja. Lebesguen integraalin määritelmä on hieman monimutkainen ja jatkossa kannattaakin ajatella kaikkia integraaleja tavallisina määrättyinä integraaleina eli funktion kuvaajan rajoittamina pinta-aloina.

Yksi keskeinen käsite Lebesguen integrointiteoriassa on nollamittainen joukko. Sillä tarkoitetaan niin pientä joukkoa, ettei se vaikuta funktion integraalin arvoon. Intuitiivisesti on selvää, ettei funktion arvon muuttaminen yhdessä pisteessä vaikuta funktion kuvaajan rajoittamaan pinta-alaan ja siten integraalin arvoon. Tarkemmin sanottuna reaalilukujoukko E on nollamittainen, mikäli se voidaan peittää väleillä [ai,bi], i=1,2,..., siten, että niiden pituuksien summa on mielivaltaisen pieni. Sanomme, että ominaisuus pätee melkein kaikkialla, mikäli se pätee nollamittaisen joukon ulkopuolella.

Nollamittaisen joukon käsitteen oppii parhaiten tutkimalla esimerkkejä. Todistetaan seuraavaksi, että rationaalilukujen joukko $Q=\{q_i\:i=1,2,\dots\}$ on nollamittainen. Tämä nähdään siten, että aluksi kiinnitetään pieni luku $\varepsilon>0$. Näytämme, että rationaalilukujen joukko Q voidaan peittää väleillä, joiden pituuksien summa on korkeintaan ennalta annettu $\varepsilon$. Otetaan jokaiselle rationaaliluvulle qi, $i=1,2,\dots$, väli

\begin{equation*}I_i=[q_i-2^{-i-1}\varepsilon,q_i+2^{-i-1}\varepsilon].
\end{equation*}

Nyt välin Ii pituus on $2^{-i}\varepsilon$ ja välien pituuksien summa on

\begin{equation*}\varepsilon\sum_{i=1}^\infty2^{-i}=\varepsilon.
\end{equation*}

Lopulta $\varepsilon$ voidaan valita niin pieneksi kuin haluamme, joten rationaalilukujen joukko on nollamittainen.

Tarkastellaan välillä [a,b] määriteltyä Lebesguen integroituvaa funktiota f, jolle pätee

 \begin{displaymath}
\int_a^b\vert f(t)\vert\,dt<\infty.
\end{displaymath} (4)

Jos (4) pätee, niin sanomme, että f on integroituva välillä [a,b]. Jotta integraali (4) olisi määritelty, meidän täytyy olettaa, että funktio f on riittävän siisti eli Lebesguen mitallinen. Mitallisuus ei ole kovin rajoittava oletus: hyvin karkeasti sanottuna kaikki helpot konstruktiot johtavat mitallisiin funktioihin ja epämitallisen funktion rakentamiseen tarvitaan melko syvällisiä analyysin tietoja. Integroituvuus on ehto funktion koolle. Erityisesti se tarkoittaa sitä, että funktion itseisarvo on keskimäärin niin pieni, että sen ja koordinaattiakselin väliin jäävän alueen pinta-ala on äärellinen. Kaikki rajoitetut positiiviset mitalliset funktiot ovat integroituvia välillä [0,1], mutta esimerkiksi $f:[0,1]\to\mathbb{R}$,

\begin{equation*}f(x)=\begin{cases}
\dfrac 1x,&\qquad 0<x\le1,\\ 0,&\qquad x=0,
\end{cases}\end{equation*}

ei ole integroituva välillä [0,1].

Ensimmäisen osan moderni muotoilu. Palataan nyt analyysin peruslauseen ensimmäisen osan yleiseen muotoiluun. Jos f on integroituva välillä [a,b] ja

 \begin{displaymath}
F(x)=\int_a^xf(t)\,dt,
\end{displaymath} (5)

niin F on derivoituva melkein kaikkialla ja F'(x)=f(x) melkein kaikilla x. Tämä siis kertoo sen, että jokainen integroituva funktio on jonkin funktion derivaatta lukuun ottamatta hyvin pientä joukkoa. Annetun funktion derivaattafunktiolla ei siis yleensä ole mitään hyviä ominaisuuksia.

Toisen osan moderni muotoilu. Tarkastellaan sitten peruslauseen toisen osan oletuksia. Jos F on jatkuvasti derivoituva, niin toisesta osasta seuraa, että

 \begin{displaymath}
F(x)-F(a)=\int_a^xF'(t)\,dt.
\end{displaymath} (6)

Tästä seuraa, että funktio F itse on jatkuva. Pitämällä mielessä analyysin peruslauseen ensimmäisen osan yleistyksen voimme nyt kysyä, riittääkö kaavassa (6) derivaatan jatkuvuuden sijaan se, että derivaatta on olemassa melkein kaikkialla? Tässä kysymyksessä on ongelma, joka ei paljastu aivan heti. Esimerkkimme (3) on derivoituva jokaisessa pisteessä, mutta derivaattafunktio heilahtelee niin pahasti, että se ei ole integroituva. Tämä johtaa siihen, että integraali (6) ei välttämättä ole olemassa ilman derivaatan integroituvuusoletusta.

Cantorin konstruktio. Toinen mielenkiintoinen kysymys on se, onko olemassa funktiota, joka on derivoituva melkein kaikkialla ja jonka derivaatta on integroituva, mutta jota ei saada takaisin integroimalla derivaatastaan? Tämä tarkoittaisi sitä, että kaava (6) ei päde. Sellainen funktio voidaan rakentaa Cantorin joukon avulla. Cantorin joukko on välin [0,1] fraktaalinen osajoukko, joka saadaan poistamalla alkuperäisestä välistä äärettömän monta osaväliä. Olkoot

\begin{eqnarray*}C_0 &=& [0,1],
\\
C_1 &=& \Big[0,\frac13\Big]
\cup\Big[\frac2...
...ac13\Big]
\cup\Big[\frac23,\frac79\Big]
\cup\Big[\frac89,1\Big],
\end{eqnarray*}


ja niin edelleen. Siis Cj+1 saadaan poistamalla jokaisesta Cj:n välistä avoin keskikolmannes, katso alla olevaa kuvaa (Cantorin joukkoa käsitellään myös Aapo Halkon artikkelissa Joukko-oppia reaaliluvuilla Solmussa 2/1998-1999).

Kuva 3: Cantorin joukko.

Kun näin tehdään, niin jokainen Cj, $j=1,2,\dots$, muodostuu 2j:stä välistä, joiden kunkin pituus on 3-j. Cantorin joukon C muodostavat täsmälleen ne pisteet, jotka kuuluvat kaikkiin joukkoihin Cj, $j=0,1,2,\dots$.

Tarkempi silmäys Cantorin joukkoon. Cantorin joukolla on monia mielenkiintoisia ominaisuuksia, joista kaikki eivät suoraan liity tutkimaamme ongelmaan. Cantorin konstruktio on kuitenkin hyvä apuväline rakentaessamme vastaesimerkkejä, joten sen ominaisuuksien miettiminen auttaa hahmottamaan tilanteen paremmin.

Ensimmäinen huomio on se, että Cantorin joukko on nollamittainen. Tämä on helppo todistaa, sillä jokaiselle $j=0,1,2,\dots,$ Cantorin joukko on joukon Cj osajoukko. Koska kukin Cj muodostuu 2j:stä välistä, joiden pituus on 3-j, niin laskemalla välien pituudet yhteen saamme Cj:n välien pituuksien summaksi (2/3)j. Valitsemalla j:n riittävan suureksi saamme tämän mielivaltaisen pieneksi, joten Cantorin joukko on nollamittainen.

Toisaalta Cantorin joukossa on oleellisesti enemmän pisteitä kun vaikkapa luonnollisia lukuja 1,2,3,...on olemassa. Karkeasti sanottuna Cantorin joukossa on yhtä monta pistettä kuin koko reaaliakselilla. Nyt tietysti täytyy olla huolellisempi ja kertoa mitä tarkoittaa se, että joukoissa on yhtä monta pistettä, sillä molemmissa joukoissa niitä on äärettömän monta. Matemaattisesti tämä tarkoittaa sitä, että Cantorin joukon ja reaalilukujen välillä on olemassa bijektio. Jokaista Cantorin joukon pistettä vastaa siis yksikäsitteinen piste reaaliakselilla, ja kääntän jokaista reaalilukua vastaa yksikäsitteinen piste Cantorin joukossa, kunhan bijektiivinen kuvaus on kiinnitetty. Jos joukkojen välille löytyy bijektio, niin sen sijaan että sanoisimme että joukoissa on yhtä monta pistettä, sanomme että joukot ovat yhtä mahtavia. Toisaalta tiedetään, että ei ole olemassa bijektiota reaalilukujen ja luonnollisten lukujen välillä, joten Cantorin joukko on mahtavampi kuin luonnollisten lukujen joukko.

Cantorin joukon konstruktiota katselemalla näemme, että se on välin [0,1] fraktaalinen osajoukko. Tämä tarkoittaa sitä, että Cantorin joukon fraktaalidimensio on aidosti pienempi kuin yksi. (Fraktaalidimension käsitettä tutkittiin Jouni Parkkosen artikkelissa Lumihiutaleesta Solmussa 3/1997-1998). Jos ajatellaan, että reaaliakseli on yksiulotteinen ja taso on kaksiulotteinen, niin Cantorin joukko on esimerkki tapauksesta, jossa ulottuvuus ei ole kokonaisluku. Cantorin joukko voidaan jakaa vasempaan osaan $C_\mathrm{vas}=C\cap[0,1/3]$ja oikeaan osaan $C_\mathrm{oik}=C\cap[2/3,1]$. Geometrisesti osat näyttävät samanlaisilta kuin koko Cantorin joukko, paitsi että ne on pienennetty kertoimella 1/3. Tässä mielessä Cantorin joukko on itsesimilaarinen. Lisäksi Cantorin joukko on oikean ja vasemman osan pistevieras yhdiste eli $C=C_\mathrm{vas}\cup C_\mathrm{oik}$ ja $C_\mathrm{vas}\cap C_\mathrm{oik}=\emptyset$. Oletetaan nyt, että Cantorin joukossa on olemassa fraktaalinen mitta, joka vastaa pituuden mittaamista reaaliakselilla ja merkitään tätä mittaa $\mathcal{H}^s$:llä. Luku s>0 kuvaa fraktaalidimensiota ja esimerkiksi reaaliakselilla se olisi yksi. Nyt

\begin{equation*}\mathcal{H}^s(C)
=\mathcal{H}^s(C_\mathrm{vas})+\mathcal{H}^s(C...
...c13\Big)^s\mathcal{H}^s(C)
+\Big(\frac13\Big)^s\mathcal{H}^s(C).\end{equation*}

Toinen yhtälö perustuu fraktaalimitan skaalausominaisuuteen: Jos reaaliakselin väliä pienennetään kertoimella 1/3, niin pituus tietysti täytyy jakaa kolmella. Tämä vastaa edellisessä yhtälössä tapausta s=1. Jos oletamme, että Cantorin joukon fraktaalimitta $\mathcal{H}^s(C)$on äärellinen, niin voimme jakaa sen pois yhtälöstä ja saamme että

\begin{equation*}1=2\Big(\frac13\Big)^s.\end{equation*}

Ratkaisemalla yhtälön saamme Cantorin joukon fraktaalidimensioksi

\begin{equation*}s=\frac{\ln 2}{\ln 3}\approx 0,6309.\end{equation*}

Tämä heuristinen päättely ei riitä matemaattiseksi todistukseksi, mutta se kertoo kuitenkin jotain Cantorin joukon luonteesta.

Lebesguen portaat. Cantorin joukon konstruktion avulla voimme rakentaa Lebesguen funktion. Karkeasti ottaen se määritellään siten, että Cantorin joukon konstruktion kussakin vaiheessa ne välit, joita ei oteta mukaan Cantorin joukon rakentamiseen nostetaan ylös, katso alla olevaa kuvaa.

Kuva 4:Lebesguen portaat.

Näin saatu funktio on jatkuva ja se saa kaikki arvot väliltä [0,1]. Toisaalta Lebesguen funktio on vakio kussakin välissä, joten se on derivoituva Cantorin joukon ulkopuolella. Se on siis derivoituva melkein kaikkialla välillä [0,1] ja sen derivaatta on nolla melkein kaikkialla. Nyt siis

\begin{equation*}F(1)-F(0)=1\neq 0=\int_0^1F'(t)\,dt,\end{equation*}

joten analyysin peruslauseen toinen osa ei voi päteä Lebesguen funktiolle: sitä ei saada takaisin integroimalla derivaatastaan.

Lopullinen totuus. On siis olemassa jatkuvia funktioita, joita ei saada takaisin integroimalla derivaatastaan eli joille kaava (6) ei ole voimassa. Kaava (6) on osoittautunut niin hyödylliseksi työkaluksi matemaattisessa analyysissä, että sen avulla määritellään kokonainen funktioluokka.

Olkoon F välillä [a,b] määrilty funktio. Sanomme, että F on absoluuttisesti jatkuva, jos on olemassa integroituva funktion f siten, että

\begin{equation*}F(x)=F(a)+\int_a^xf(t)\,dt.\end{equation*}

Jos yllä oleva esitys on voimassa, niin F'(x)=f(x) melkein kaikilla $x\in[a,b]$. Absoluuttisesti jatkuvien funktioitten merkitys analyysissä perustuu siihen, että niillä on monia derivoituvien funktioitten hyviä ominaisuuksia, vaikka ne ovatkin derivoituvia vain melkein kaikkialla.

Erityisesti absoluuttisesti jatkuva funktio on jatkuva tavallisessa mielessä, mutta Lebesguen funktio osoittaa, että käänteinen väite ei päde: jokainen jatkuva funktio ei ole absoluuttisesti jatkuva.

Absoluuttinen jatkuvuus liittyy läheisesti siihen, miten funktio F kuvaa nollamittaiset joukot. Lebesguen funktio kuvaa nollamittaisen Cantorin joukon Csiten, että $[0,1]\setminus f(C)$ on nollamittainen. Siis nollamittaisen joukon kuva täyttää melkein koko maalijoukon. Tämä ei ole mahdollista absoluuttisesti jatkuvalle funktiolle. Seuraava lause antaa yhden karakterisaation absoluuttiselle jatkuvuudelle.

Olkoon $F:[a,b]\to\mathbb{R}$. Silloin F on absoluuttisesti jatkuva jos ja vain jos seuraavat neljä ehtoa ovat voimassa:

(1)
F on jatkuva,
(2)
F on derivoituva melkein kaikkialla,
(3)
F' on integroituva ja
(4)
F kuvaa nollamittaiset joukot nollamittaisiksi.

Valitettavasti tässä ei ole mahdollista todistaa edellä olleita tuloksia, mutta asiasta kiinnostuneet voivat perehtyä todistuksiin vaikka Rudinin kirjasta Real and Complex Analysis.

Juha Kinnunen
Helsingin yliopisto


Solmu 5/1998-1999
Viimeksi muutettu 23. marraskuuta 1999.