Theory
A nucleation minden elméletéhez két elemre van szükség: egyrészt a klaszterek tulajdonságainak, például szerkezetének és szabad energiáinak kiszámítására, másrészt a fluktuációk dinamikai leírására. A klasszikus sűrűségfunkcionál-elmélet (cDFT) (21, 22) már régóta ismert, hogy képes az első elemet biztosítani. Oxtoby és Evans 1980-as években végzett úttörő munkája (23) óta a cDFT-t a kritikus klaszterek szerkezetének és energiájának meghatározására használják, először a folyadékcseppek gőzből történő magképződéséhez, később pedig a kristályosodáshoz. A korai számítások számos egyszerűsítő feltételezést tartalmaztak, de az újabb munkák a szimulációval való kvantitatív egyezést mutattak (24). A cDFT előnye az alternatív technikákkal, például a fázismező-kristályelmélettel (PFC) (25) és a diffúz határfelületi modellekkel szemben az, hogy elvileg “ab initio”, csak egy atomok közötti potenciált igényel bemenetként, és hogy kvantitatívan pontos leírást ad a molekuláris szintű korrelációkról és szerkezetről. A cDFT egy alapvető elmélet, amelyből kiindulva a többi elmélet közelítéseként értelmezhető (22).
A cDFT itt használt implementációjában az egyes kémiai fajok helyi számsűrűségét egy kocka alakú számítási rácson diszkretizáljuk, amelynek rácstávolsága jóval kisebb, mint az egyes molekuláké. Az egyensúlyi helyi sűrűségeket a helyi sűrűségek egy függvényének minimalizálásával határozzuk meg, ami megadja mind a molekulák egyensúlyi eloszlását, mind a rendszer szabad energiáját. Az elmélet helyesen írja le az olyan molekuláris léptékű jellemzőket, mint például a sűrű folyadékok rétegekbe tömörülése a fal közelében. Különösen, míg egy homogén folyadék sűrűsége egyenletes, addig egy szilárd test molekuláris szinten eleve nem egyenletes, mivel a sűrűség a rácspontokon élesen kiugrik, és a rácspontok között nagyon alacsony értékekre csökken. A cDFT legújabb fejlesztései kiterjesztették alkalmazhatóságát az erősen nem egyenletes rendszerekre, például a sűrű folyadékcseppekre és az alacsony sűrűségű gőz hátterével egyensúlyban lévő szilárd klaszterekre (lásd az 1. ábrát).
A magképződés leírásához szükséges második elem a fluktuációk leírása (26). Ennek természetes kerete a fluktuáló hidrodinamika (FH), amely Landau-tól származik, és amelyet intenzíven tanulmányoztak és fejlesztettek. Az FH ma már széles körben használt eszköz, amelyet számos témában alkalmaztak, például a móduscsatolás elméletében, az üvegesedésben és a magképződésben, és amelynek alapjait az alapvetőbb statisztikai mechanikában állapították meg. Az elméletben használt alapvető mennyiségek az egyes fajok térben változó helyi sűrűségei, valamint a sebesség- és hőmérsékletmezők. Nagy részecskék, például kolloidok vagy makromolekulák esetében, kisebb részecskékből álló fürdőben (pl. víz) a nagy molekulák közelítő effektív leírását lehet levezetni, amelyben a kisebb molekulák hatását a súrlódás és egy sztochasztikus erő kombinációjaként modellezik. Ha a fürdő csillapítása erős, akkor ez tovább redukálható egyetlen egyenletre, amely a nagy fajokra vonatkozó sűrűségmezőt írja le (28, 29), amelynek formája∂∂tn^t(r)=D∇⋅n^t(r)∇δFδn^t(r)+∇⋅2Dn^t(r)ξ^t(r)(1)ahol n^t(r) az ingadozó helyi sűrűség, amely nem egyensúlyi mennyiség: A cDFT helyi sűrűsége ennek ingadozással átlagolt értéke egy egyensúlyi rendszerre. A D együttható a diffúziós együttható a kis sűrűségű határértékben (azaz amikor a fürdőben csak egyetlen nagy molekula van, amely Brown-mozgást végez), amely a rendszert alkotó molekulák tulajdonságai alapján kiszámítható. Az F szabadenergia-függvényt a cDFT Helmholtz-funkciójának tekintjük. A hidrodinamika szintjén (a túltompított határérték feltételezése előtt) ez általánosabban az FH-egyenletekben szereplő nyomásgradienshez kapcsolódik, és használata egyfajta helyi egyensúlyi közelítés, amely a nem egyensúlyi statisztikai mechanikában gyakori (26). Végül ξ^t(r) a nagy molekulákkal ütköző kis fürdőmolekulákból eredő helyi fehér zaj (térbeli és időbeli delta-függvényes korrelációkkal), amely a modellben az ingadozások forrása. A modell fontos tulajdonsága, hogy a részecskék számát minden időben megőrzi, kivéve esetleg a rendszer határainál. Itt erre az egyszerű, de reális modellre koncentrálok, és a kevésbé korlátozó feltevésekkel történő hasonló fejlesztéseket a későbbi munkákra hagyom.
A cDFT szabadenergia-funkcionálok használatát a sztochasztikus modellekben megkérdőjelezték (30), mert ami a sztochasztikus modellek tipikus levezetéseiben előfordul, az egy durva szemcsés szabadenergia, és nem az egyensúlyi cDFT-funkcionál. A különbség a sztochasztikus modellben kifejezetten a fluktuáló erő által reprezentált fluktuációkból adódik, és elvárható, hogy a cDFT-funkcionál a durva szemcsés funkcionál fluktuációs átlagából adódjon. Itt, mint majdnem minden alkalmazásban, a szabadenergia-funkcionált egy kifinomult keménygömb-funkcionál és a potenciál vonzó farkának átlagmező-kezelése összegének tekintjük (22). A kemény gömbi hozzájárulások esetében egy ilyen átlagnak várhatóan kevés hatása lesz, mivel minden korreláció rövidtávú. A nagy hatótávolságú vonzó csóvákkal rendelkező rendszerek esetében az itt és minden hasonló alkalmazásban használt középmező-leírás várhatóan jobban igazolható a durva szemcséjű modellekhez, mint a fluktuációval átlagolt modellhez, mivel ez az átlagolás éppen a renormálási hatások fizikai eredete, amelyek érvénytelenítik a középmező-leírást, pl. a kritikus jelenségeknél. Ezért a cDFT keménygömbi szabadenergia-funkcionál és az átlagmező vonzó csóvájának kombinációját úgy lehetne érvelni, hogy a durva szemcsés szabadenergia jó becslés, a cDFT-funkcionál pedig rossz becslés, és nem fordítva.
A cDFT modellfunkcionálok közül ki lehetne választani egyet a sztochasztikus modellben való használatra, és közvetlen numerikus szimulációkat lehetne végezni. Ezt a megközelítést nemrégiben kiaknázták, és ez egy ígéretes durva szemcsés szimulációs módszer a nukleáció tanulmányozására (31). Egy másik lehetőség a kollektív változók vagy rendparaméterek bevezetésével történő további durvaszemcsésítés. Ezt az utat máshol is vizsgálták, ahol kimutatták, hogy megfelelő közelítésekkel vissza lehet állítani a klasszikus nukleációs elméletet (CNT) (26, 32). Az itt tárgyalt elmélet tehát nem a CNT alternatívája, hanem inkább egy alapvetőbb elmélet, amelynek a CNT csak egy közelítése. Itt azonban az a cél, hogy az elméleti fejlődést a sztochasztikus folyamatok elméletének eszközeivel folytassuk, és a nukleációs útvonalra, mint alapvető tárgyra koncentráljunk.
Ha egy rendszer gyenge oldatként (azaz gőzszerű állapotban) indul, és spontán magot képez egy klaszterből (akár sűrű oldatcsepp, akár kristályos klaszter), akkor a kezdeti helyi koncentráció az egész rendszerben állandó. Amikor a klaszter jelen van, a koncentráció a csepp belsejében magas, kívül pedig alacsony: Az állapotok közötti különbség teljes mértékben a helyi sűrűséggel jellemezhető. Az olyan sztochasztikus modellek esetében, mint amilyen az itt használt is, pontos kifejezést lehet adni arra a valószínűségre, hogy egy adott útvonal valamely kezdeti sűrűségeloszlástól, n0(r), egy adott végső eloszlásig, nT(r), követhető, és a maximális valószínűségű útvonal keresésével meghatározható a legvalószínűbb útvonal (MLP), amely az átmenetet jellemzi. Az alapötlet Onsagerre és Machlupra (33) vezethető vissza, az általánosítást tetszőleges diffúz folyamatokra Graham (34) adta meg. Ha a kezdeti állapot az egységes anyafázis, és a végső állapot az új fázis kritikus (vagy posztkritikus) halmazát tartalmazza, akkor az MLP lesz a legvalószínűbb magképződési útvonal. Általában az MLP meghatározása erősen nem triviális, de fontos egyszerűsítések történnek a gyenge zajhatárban (ami fizikailag pl. alacsonyabb hőmérsékleteknek felel meg), ebben az esetben a sztochasztikus elmélet egyenértékű a Wentzell-Freidlin-féle nagy eltérés elmélettel (35). Ekkor bizonyítható (26), hogy a magképződésre vonatkozó MLP-nek át kell haladnia a kritikus halmazon – ez a tény általában nem igaz az erős zajhatárban, és azt mutatja, hogy a magképződés szokásos képe csak ebben a határban érvényes. Továbbá megmutatható, hogy az MLP úgy konstruálható, hogy a kritikus klaszterből kiindulva a rendszert az instabil irányokban enyhén perturbáljuk úgy, hogy a dinamika determinisztikus része∂∂tn^t(r)=D∇⋅n^t(r)∇δFδn^t(r)(2)a perturbáció irányától függően a sűrűség a szabadenergia-gradiens mentén a kezdeti fázisba vagy a végső fázisba esik. E két részleges útvonalat összeadva kapjuk a teljes MLP-t. Megjegyzendő azonban, hogy két nagyon különböző karakterrel rendelkeznek: A valóságban a rendszer a kezdeti fázisban indul, majd az ingadozások a szabadenergia-gáton felfelé hajtják, amíg el nem éri a kritikus csomópontot, majd ezt követően tovább növekszik, amíg a lehető legtöbb anyag beépül az új fázisba. A második rész, amely a kritikus klaszterből indul és növekszik, csak a szabadenergia-gradiens által vezérelt normál termodinamikai növekedés. Az első részt azonban a szabadenergia-gradienssel szemben az ingadozások hajtják, és igen nem triviális és hasznos eredmény, hogy az MLP ehhez a folyamathoz a gradiens “visszafelé” történő leesésével határozható meg (26).
Ahelyett, hogy közvetlenül a gradiens-leereszkedést, azaz a 2. egyenletet használnánk a kritikus klaszterektől, a jelen munka a húrmódszert (36) alkalmazza, amely matematikailag egyenértékű, de a hatékonyság és az egyszerűség előnyeit kínálja. Különösen, hogy egyszerre határozza meg a teljes útvonalat, és különösen hasznos, ha több köztes szabadenergia-minimum van, vagy ha a szabadenergia-gradiensek gyengék – mindkettő fontosnak bizonyul az alábbiakban. A megvalósítás részleteit a Kiegészítő szöveg tárgyalja, és itt csak annyit jegyzünk meg, hogy a húrmódszerben a pálya mentén elosztott sűrűségek vagy “képek” gyűjteményével dolgozunk, így azt diszkrét pontok gyűjteményeként közelítjük meg. Ezeket a 2. egyenlet szerint mozgatva, a pontok közötti egyenlő távolság megtartásának kényszere mellett, meghatározzuk a gradiens leszálló pályát. A módszernek szüksége van az útvonal kezdeti becslésére, és ehhez a végpontok közötti egyszerű lineáris interpolációt használtuk. Jelen számításokban a kiindulási pont, azaz a kezdeti kép az egységes, kis sűrűségű rendszer, az útvonal végpontja pedig a kritikus klaszter. A számításokból kiderül, hogyan fejlődik a rendszer az előbbiből az utóbbiba.
Meg kell említeni, hogy ennek az elméletnek az egyes elemeit már korábban is tárgyalták hasonló összefüggésekben. Például Lutsko (24) tanulmányában a nagyon hasonló nudged elastic band módszert a legkorszerűbb cDFT szabadenergia-funkcionállal együtt használták a folyadék-folyadék nukleáció leírására. Abban a munkában azonban nem értették meg a reális dinamikai leírás bevezetésének fontosságát. Hasonlóképpen, az olyan fázismező-vizsgálatok, mint Qiu és Qian (37), valamint Backofen és Voigt (38, 39) egyszerűbb szabadenergia-funkcionálokat és ad hoc dinamikát használnak a húrmódszerrel együtt. Míg a kritikus klasztereket helyesen határozzák meg, a dinamika absztrakt jellege miatt (pl. a helyi tömegmegőrzés hiánya, amikor a rendparamétert sűrűségként kell értelmezni) az utak fizikalitása nem egyértelmű. Ezenkívül a kizárt térfogathatások, amelyek molekuláris szinten uralják a szerkezetet, kívül esnek e modellek alkalmazási körén. A jelen munka a szabadenergia-funkcionálhoz való keménygömbi hozzájárulás kifinomult fundamentális mértékelméleti modelljét használja, amely közismerten nagyon pontos leírást ad különösen a keménygömbi rendszerekről, és a potenciál vonzó részének átlagos mező modelljével kombinálva a molekuláris szintű szerkezetről általánosabb potenciálok esetén (22).
A kristályosodásnak az itt bemutatotthoz szellemében nagyon közeli megközelítéseit egy ideje már a PFC közösségben is vizsgálják (25). Ezek cDFT-modellekként értelmezhetők, amelyeket úgy egyszerűsítenek, hogy az F szabadenergia-funkcionált egy egységes állapot, n0 körül kiterjesztik, ami kétféle kifejezést eredményez (41, 42). A tagok első csoportja egy gradiens kiterjesztés formáját ölti, amely negyedik rendben le van csonkolva. A második kifejezéskészlet a φ(r) ≡ (n(r) – n0)/n0 változóban történő kiterjesztés formáját ölti, bár ezt a kiterjesztést néha elkerülik (43). Mindkét kiterjesztés kontrollálatlan a szilárd állapotban, ahol a sűrűség több nagyságrendnyi változása a legkisebb molekuláris hosszskálákon is előfordul, és emiatt a PFC modelleket általában nem lehet egy adott kölcsönhatási potenciálra paraméterezni. Inkább a mögöttük álló effektív potenciált az alkalmazott közelítések határozzák meg, és az nagyon nem szokványos lehet. Ezt az egyszerűsített szabadenergia-funkcionált számos tanulmányban dinamikával kapcsolták össze, köztük olyanokban is, amelyekben a kombináció nagyon hasonló az itt használthoz (45), a kristályosodási frontok kétdimenziós terjedésének (43) és a magképződésnek (44-46) a durva szemcseméretezésének alapjaként. A jelen munka célja, hogy leküzdje ezen egyszerűsített modellek korlátait, miközben a magképződési útvonalra összpontosít az MLP koncepcióján keresztül.