Teoria
Kaikkiin nukleaatioteorioihin tarvitaan kaksi elementtiä: ensinnäkin keino laskea klustereiden ominaisuuksia, kuten niiden rakenne ja vapaat energiat, ja toiseksi dynaaminen kuvaus vaihteluista. Klassisen tiheysfunktionaaliteorian (cDFT) (21, 22) on jo pitkään katsottu voivan tarjota ensimmäisen elementin. Oxtobyn ja Evansin 1980-luvulla tekemästä uraauurtavasta työstä (23) lähtien cDFT:tä on käytetty kriittisten klustereiden rakenteen ja energian määrittämiseen ensin nestepisaroiden ydintymisessä höyrystä ja myöhemmin kiteytymisessä. Varhaisiin laskelmiin sisältyi monia yksinkertaistavia oletuksia, mutta uudemmat työt ovat osoittaneet kvantitatiivisen vastaavuuden simuloinnin kanssa (24). cDFT:n etuna vaihtoehtoisiin tekniikoihin, kuten faasikenttä-kiteiden (PFC) teoriaan (25) ja diffuusien rajapintojen malleihin verrattuna on se, että se on periaatteessa ”ab initio”, eli se vaatii syötteeksi vain atomien välisen potentiaalin, ja että se antaa kvantitatiivisesti tarkan kuvauksen molekyylitason korrelaatioista ja rakenteesta. cDFT on perustavanlaatuinen teoria, josta muut voidaan ymmärtää approksimaatioina (22).
Tässä käytetyssä cDFT:n toteutuksessa kunkin kemiallisen lajin paikallinen lukumäärän tiheys diskretisoidaan kuutiomaiselle laskennalliselle hilalle, jonka hilaväli on paljon pienempi kuin yksittäisten molekyylien. Paikalliset tasapainotiheydet määritetään minimoimalla paikallisten tiheyksien funktionaalia, joka antaa sekä molekyylien tasapainojakauman että systeemin vapaan energian. Teoria kuvaa oikein molekyylitason piirteitä, kuten tiheiden nesteiden pakkautumista kerroksiksi seinän lähellä. Homogeenisen nesteen tiheys on tasainen, mutta kiinteä aine on luonnostaan epäyhtenäinen molekyylitasolla, koska tiheys on jyrkästi huipussaan ristikkokohdissa ja laskee hyvin alhaisiin arvoihin ristikkokohtien välillä. Viimeaikaiset edistysaskeleet cDFT:ssä ovat laajentaneet sen sovellettavuutta erittäin epäyhtenäisiin systeemeihin, kuten tiheisiin nestepisaroihin ja kiinteisiin klustereihin, jotka ovat tasapainossa alhaisen tiheyden höyryn taustan kanssa (ks. kuva 1).
Kakkoselementti, joka tarvitaan nukleaation kuvaamiseen, on fluktuaatioiden kuvaus (26). Luonnollinen kehys tälle on Landaun alulle panema fluktuoiva hydrodynamiikka (FH), jota on tutkittu ja kehitetty intensiivisesti. FH on nykyään laajalti käytetty työkalu, jota on sovellettu useisiin aiheisiin, kuten moodikytkentäteoriaan, lasisiirtymään ja ydintymiseen, ja sen perustana on ollut perustavanlaatuisempi tilastollinen mekaniikka. Teoriassa käytetyt perussuureet ovat kunkin lajin spatiaalisesti vaihtelevat paikalliset tiheydet sekä nopeus- ja lämpötilakentät. Suurille hiukkasille, kuten kolloideille tai makromolekyyleille, pienempien hiukkasten kylvyssä (esim. vesi) voidaan johtaa likimääräinen tehokas kuvaus suurista molekyyleistä, jossa pienempien molekyylien vaikutus mallinnetaan kitkan ja stokastisen voiman yhdistelmänä. Jos kylvyn vaimennus on voimakas, tämä voidaan edelleen pelkistää yhdeksi yhtälöksi, joka kuvaa suurten lajien tiheyskenttää (28, 29), jonka muoto on∂∂tn^t(r)=D∇⋅n^t(r)∇δFδn^t(r)+∇⋅2Dn^t(r)ξ^t(r)(1)missä n^t(r) on vaihteleva paikallinen tiheys, joka ei ole tasapainomäärä: cDFT:n paikallinen tiheys on tämän vaihtelun keskiarvo tasapainosysteemille. Kerroin D on diffuusiokerroin pienen tiheyden raja-arvossa (eli kun kylvyssä on vain yksi suuri molekyyli, joka on Brownin liikkeessä), joka voidaan laskea systeemin muodostavien molekyylien ominaisuuksien perusteella. Vapaan energian funktionaalin F katsotaan olevan cDFT:n Helmholtzin funktionaali. Hydrodynamiikan tasolla (ennen kuin oletetaan ylivaimennusraja) tämä liittyy yleisemmin FH-yhtälöiden paineen gradienttiin, ja sen käyttö on eräänlainen paikallisen tasapainon approksimaatio, joka on yleinen tasapainottomassa tilastollisessa mekaniikassa (26). ξ^t(r) on paikallista valkoista kohinaa (jossa on delta-funktion korrelaatioita tilassa ja ajassa), joka syntyy pienten kylpymolekyylien törmätessä suuriin molekyyleihin, ja se on mallissa esiintyvien vaihteluiden alkuperä. Tämän mallin tärkeä ominaisuus on, että se säilyttää hiukkasten lukumäärän kaikkina aikoina, paitsi mahdollisesti järjestelmän rajoilla. Tässä keskityn tähän yksinkertaiseen, mutta realistiseen malliin ja jätän vastaavanlaisen kehityksen vähemmän rajoittavilla oletuksilla tulevaan työhön.
CDFT-vapaaenergiafunktioiden käyttö stokastisissa malleissa on kyseenalaistettu (30), koska stokastisten mallien tyypillisissä derivaatioissa esiintyy karkearakeinen vapaaenergia eikä tasapainon cDFT-funktio. Ero johtuu fluktuaatioista, joita stokastisessa mallissa edustaa eksplisiittisesti fluktuointivoima, ja odotetaan, että cDFT-funktionaalin tulos on karkearakeisen funktionaalin fluktuointikeskiarvo. Tässä, kuten lähes kaikissa sovelluksissa, vapaan energian funktionaalin katsotaan olevan hienostuneen kovan pallon funktionaalin ja potentiaalin vetovoimaisen hännän keskikenttäkäsittelyn summa (22). Kovan pallon osuuksien osalta tällaisella keskiarvolla ei odoteta olevan juurikaan vaikutusta, koska kaikki korrelaatiot ovat lyhytaikaisia. Systeemeissä, joissa on pitkän kantaman vetovoimainen häntä, tässä ja kaikissa vastaavissa sovelluksissa käytetyn keskikenttäkuvauksen voidaan olettaa olevan perustellumpi karkearakeisille malleille kuin fluktuaatiokeskiarvoistetun mallin, koska tämä keskiarvoistaminen on nimenomaan fysikaalinen alkuperä renormalisointi-ilmiöille, jotka mitätöivät keskikenttäkuvauksen, esimerkiksi kriittisissä ilmiöissä. Näin ollen cDFT:n kovan pallon vapaan energian funktionaalin ja keskikentän vetovoimaisen hännän yhdistelmän voisi väittää olevan hyvä arvaus karkearakeiselle vapaalle energialle ja huono arvaus cDFT-funktionaalille, pikemminkin kuin päinvastoin.
Olisikin mahdollista valita yksi cDFT-mallin funktionaaleista käytettäväksi stokastisessa mallissa ja suorittaa suorat numeeriset simulaatiot. Tätä lähestymistapaa on hiljattain hyödynnetty, ja se on lupaava karkearakeinen simulointimenetelmä nukleaation tutkimiseen (31). Toinen mahdollisuus on lisätä karkearakeisuutta ottamalla käyttöön kollektiivisia muuttujia tai järjestysparametreja. Tätä reittiä on tutkittu muissa paikoissa, joissa on osoitettu, että voidaan palauttaa klassinen nukleaatioteoria (CNT) sopivilla approksimaatioilla (26, 32). Näin ollen tässä käsiteltävä teoria ei ole vaihtoehto CNT:lle vaan pikemminkin perustavampi teoria, jolle CNT on approksimaatio. Tässä pyritään kuitenkin jatkamaan teoreettista kehitystä stokastisten prosessien teorian välineitä käyttäen ja keskittymään ydintymisreittiin peruskohteena.
Jos systeemi alkaa heikkona liuoksena (eli höyryn kaltaisena tilana) ja muodostaa spontaanisti klusterin (joko tiheän liuoksen pisaran tai kiteisen klusterin), niin paikallinen alkukonsentraatio on vakio koko systeemissä. Kun klusteri on läsnä, konsentraatio on suuri pisaran sisällä ja pieni sen ulkopuolella: Tilojen välinen ero voidaan luonnehtia täysin paikallisen tiheyden avulla. Tässä käytetyn kaltaisille stokastisille malleille voidaan antaa tarkka lauseke todennäköisyydelle seurata mitä tahansa polkua jostakin alkutiheysjakaumasta, n0(r), mihin tahansa lopputiheysjakaumaan, nT(r), ja etsimällä polkua, jolla on suurin todennäköisyys, voidaan määrittää todennäköisin polku (MLP), joka luonnehtii siirtymää. Perusajatus juontaa juurensa Onsageriin ja Machlupiin (33), ja yleistyksen mielivaltaisiin diffuusioprosesseihin antoi Graham (34). Jos alkutila on yhtenäinen emäfaasi ja lopputila sisältää uuden faasin kriittisen (tai jälkikriittisen) klusterin, MLP on todennäköisin ydintymisreitti. Yleisesti ottaen MLP:n määrittäminen on erittäin epätriviaalia, mutta merkittäviä yksinkertaistuksia tapahtuu heikon kohinan rajoissa (jotka vastaavat fyysisesti esimerkiksi alhaisempia lämpötiloja), jolloin stokastinen teoria vastaa Wentzell-Freidlinin suuren poikkeaman teoriaa (35). Tällöin voidaan todistaa (26), että nukleaation MLP:n on kuljettava kriittisen klusterin läpi – seikka, joka ei yleensä päde vahvan kohinan raja-arvossa ja osoittaa, että tavanomainen kuva nukleaatiosta pätee vain tässä raja-arvossa. Lisäksi voidaan osoittaa, että MLP voidaan rakentaa aloittamalla kriittisestä klusterista ja häiritsemällä systeemiä hieman epästabiileihin suuntiin niin, että dynamiikan deterministinen osa∂∂tn^t(r)=D∇⋅n^t(r)∇δFδn^t(r)(2)saa tiheyden putoamaan vapaan energian gradienttia alaspäin joko alkuvaiheeseen tai loppuvaiheeseen häiriön suunnasta riippuen. Kun nämä kaksi osittaista polkua yhdistetään, saadaan täydellinen MLP. Huomaa kuitenkin, että niillä on kaksi hyvin erilaista luonnetta: Todellisuudessa systeemi alkaa alkuvaiheesta, ja sen jälkeen vaihtelut ajavat sitä ylöspäin vapaan energian estettä, kunnes se saavuttaa kriittisen klusterin, jonka jälkeen se jatkaa kasvuaan, kunnes mahdollisimman paljon materiaalia on sisällytetty uuteen vaiheeseen. Toinen osa, joka alkaa kriittisestä klusterista ja kasvaa, on vain normaalia termodynaamista kasvua, jota ohjaa vapaan energian gradientti. Ensimmäistä osaa kuitenkin ajetaan vapaan energian gradienttia vastaan fluktuaatioiden vaikutuksesta, ja on erittäin ei-triviaali ja hyödyllinen tulos, että MLP tälle prosessille voidaan määrittää laskemalla ”taaksepäin” gradienttia alaspäin (26).
Ennemmin kuin suoraan gradienttilaskeutumista eli yhtälöä 2 kriittisistä klustereista, tässä työssä hyödynnetään säiemenetelmää (36), joka on matemaattisesti samanarvoinen, mutta sen etuina ovat tehokkuus ja yksinkertaisuus. Erityisesti se määrittää koko polun kerralla ja on erityisen hyödyllinen silloin, kun on useita vapaan energian väliminimejä tai kun vapaan energian gradientit ovat heikkoja – molemmat näistä seikoista osoittautuvat jäljempänä merkityksellisiksi. Toteutuksen yksityiskohtia käsitellään täydentävässä tekstissä, ja tässä yhteydessä huomautetaan vain, että merkkijonomenetelmässä työskennellään koko polkua pitkin jakautuneiden tiheyksien eli ”kuvien” kanssa, jolloin polkua lähestytään diskreettien pisteiden kokoelmana. Kun niitä siirretään yhtälön 2 mukaisesti siten, että pisteiden väliset etäisyydet pysyvät yhtä suurina, määritetään gradienttipolku. Menetelmä edellyttää polun alkuarviota, ja tähän käytettiin yksinkertaista lineaarista interpolointia päätepisteiden välillä. Näissä laskelmissa lähtökohtana eli alkukuvana on yhtenäinen, pienitiheyksinen järjestelmä, ja polun loppupiste on kriittinen klusteri. Laskelmat paljastavat, miten järjestelmä kehittyy edellisestä jälkimmäiseen.
On aiheellista mainita, että tämän teorian yksittäisiä elementtejä on käsitelty aiemmin vastaavissa yhteyksissä. Esimerkiksi Lutskon (24) tutkimuksessa käytettiin hyvin samankaltaista nudged elastic band -menetelmää yhdessä nykyaikaisen cDFT-vapaaenergiafunktiofunktionaalin kanssa kuvaamaan neste-nesteen ydintymistä. Kyseisessä työssä ei kuitenkaan ymmärretty realistisen dynaamisen kuvauksen käyttöönoton merkitystä. Vastaavasti faasikenttätutkimuksissa, kuten Qiun ja Qianin (37) sekä Backofenin ja Voigtin (38, 39) tutkimuksissa, käytetään yksinkertaisempia vapaan energian funktioita ja ad hoc -dynamiikkaa yhdessä jousimenetelmän kanssa. Vaikka kriittiset klusterit määritetään oikein, polkujen fysikaalisuus on epäselvä dynamiikan abstraktin luonteen vuoksi (esim. paikallisen massan säilymisen puuttuminen, kun järjestysparametri on tulkittava tiheydeksi). Lisäksi poissuljetut tilavuusvaikutukset, jotka hallitsevat rakennetta molekyylitasolla, ovat näiden mallien soveltamisalan ulkopuolella. Tässä työssä käytetään kehittynyttä fundamentaalisen mittateorian mallia kovan pallon osuudelle vapaan energian funktionaalissa, jonka tiedetään antavan erittäin tarkan kuvauksen erityisesti kovan pallon systeemeistä ja yhdistettynä potentiaalin vetovoimaosuuden keskikenttämalliin molekyylitason rakenteesta yleisemmille potentiaaleille (22).
Kiteytymistä koskevia lähestymistapoja, jotka ovat hengeltään hyvin lähellä tässä esiteltyä, on tutkittu jonkin aikaa myös PFC-yhteisössä (25). Ne voidaan ymmärtää cDFT-malleina, joita yksinkertaistetaan laajentamalla vapaan energian funktionaalia F yhtenäisen tilan n0 ympärille, jolloin saadaan kahdenlaisia termejä (41, 42). Ensimmäinen ryhmä termejä on gradienttiekspansio, joka katkaistaan neljännessä kertaluvussa. Toinen joukko termejä on muodoltaan ekspansio muuttujalla φ(r) ≡ (n(r) – n0)/n0, vaikka tätä ekspansiota joskus vältetäänkin (43). Molemmat laajennukset ovat hallitsemattomia kiinteässä tilassa, jossa tiheyden vaihtelut ovat useita kertaluokkia pienimmillä molekyylin pituusskaaloilla, ja tästä syystä PFC-malleja ei yleensä voida parametrisoida tiettyyn vuorovaikutuspotentiaaliin. Pikemminkin niiden perustana oleva tehokas potentiaali määräytyy käytettyjen approksimaatioiden perusteella, ja se voi olla hyvin epätavanomainen. Tämä yksinkertaistettu vapaan energian funktio on yhdistetty dynamiikkaan monissa tutkimuksissa, mukaan lukien joissakin tutkimuksissa, joissa yhdistelmä on hyvin samankaltainen kuin tässä käytetty (45), ja se on ollut perustana kiteytymisrintamien etenemisen karkeaharjoittelulle kahdessa ulottuvuudessa (43) ja nukleaation karkeaharjoittelulle (44-46). Tämän työn tavoitteena on ylittää näiden yksinkertaistettujen mallien rajoitukset keskittyen samalla ydintymisreittiin MLP:n käsitteen avulla.