通過了解 PID 控制器的概念和它在 RAI 生態系統中的參數化,更好理解 RAI 如何應對系統控制之外的各種攻擊和外生衝擊。

原文標題:《DeFi 新玩法丨看 Reflexer 如何將 PID 控制理論應用於加密貨幣
撰文:BlockScience
翻譯:Yangz

從與美元掛鉤的穩定幣到近期火熱的算法穩定幣 Fei,「穩定」資產還可以有新的玩法嗎?來看看 Reflexer 是如何將 PID 控制理論應用於加密貨幣的吧。注:Reflexer 是一個旨在打造第一個只支持 ETH 的去中心化,非掛鉤穩定資產 RAI 的平臺。RAI 可以作爲其他 DeFi 協議的更「穩定」的抵押品(與 ETH 或 BTC 相比),或作爲內含利率的穩定資產。值得注意的是,官方指出,RAI 並不屬於穩定幣 ,其背後的系統也只關心市場價格儘可能地接近贖回價格。PID 控制,是最早發展起來的控制策略之一,由於其算法簡單、魯棒性好和可靠性高,被廣泛應用於工業過程控制,至今仍有 90% 左右的控制迴路具有 PID 結構。簡單的說,根據給定值和實際輸出值構成控制偏差,將偏差按比例、積分和微分通過線性組合構成控制量,對被控對象進行控制。

以下爲全文翻譯:

這篇作品深入探討了 BlockScience 團隊與 Reflexer 實驗室合作開展的工程設計工作,重點是在 2021 年 2 月 17 日主網啓動前對 RAI 系統進行參數化。涵蓋概念包括 PID 控制器、治理面、不確定性下的參數選擇、控制器壓力測試和安全系統推出。

前言

web3 領域已經成爲了許多方向快速進行金融實驗的基礎。許多項目都在爲其代幣尋求價格穩定(任何有用的貨幣都應該如此),並且經常以不同的方式進行。從外部貨幣掛鉤到重定價機制,有許多關於「穩定」的嘗試,但 RAI 是第一個使用既有控制理論走向反思性(或自我反思性)穩定價格的代幣系統的此類代幣。與現有的與法幣掛鉤的系統相比,RAI 可以「減震 ETH」,因爲穩定控制器可以減弱基礎資產引起的價格波動,而不需要明確的掛鉤。

更具體地說,通過在系統設計中利用比例-積分-微分控制器(PID)控制器,RAI 可以爲以太坊 DeFi 生態系統提供一種不與任何外部資產掛鉤的低波動性儲備資產。在各種設備中部署 PID 控制器的現有工程實踐深度爲我們提供了堅實的工程基礎,因而我們可以從中考慮 RAI 的設計。

複雜的系統

優化複雜的系統基礎設施以平衡多個利益相關者的需求是工程設計的一項壯舉。它需要對系統目標、約束條件和利益相關者需求的理解,以及對所涉及的權衡進行全面分析。建模和仿真的工具,如 cadCAD,可以很好地幫助我們管理複雜性和平衡優化,以確保首選結果。

這就需要我們深刻理解系統目標以及實現這些目標需要應用的機制所涉及的參數。在本節中,我們將研究 RAI 系統的各種目標,以及涉及哪些參數,包括受控和不受控。

深入解析 Reflexer 穩定機制:如何將 PID 控制理論應用於加密貨幣?

RAI 分析儀表盤向最終用戶展示相關的系統指標。這些同樣的指標通過 cadCAD 模型爲設計提供了信息,甚至在 RAI 系統存在之前,就已經對它們進行了測量。

目標

RAI 生態系統的目標是工程設計過程的首要考慮因素。系統目標保證了 cadCAD 仿真參數及指標與總體目標的一致性。RAI 項目的系統目標包括:

  • 在不假設贖回價格掛鉤的情況下,平滑二級市場的價格變動。

  • 在一系列外生衝擊下,控制器的穩定性。

  • 如果二級市場違反流動性要求,可平和地啓動和關閉贖回價格調整(機制)。

系統設計的下一步是確定參數,這些參數可分爲兩類:一類是在系統控制下的參數(受控參數),另一類是無法控制的參數(環境參數)。

受控參數規定了系統設計者可以選擇的關鍵特性,以實現系統目標。RAI 項目控制參數包括 :

  • 控制器專用參數

  • 債務市場具體參數

  • 定價預言機參數

環境參數規定了系統的外部特徵,也影響系統目標的實現。RAI 項目的環境參數包括:

  • ETH 價格

  • 二級市場的「外部」交易需求(不包括因市價與贖回價錯位而產生的「內部」交易需求)。

此外,衡量這些目標實現情況的指標也很重要。我們可以在給定環境參數下,根據反映系統目標的 KPI 彙總來選擇控制參數。RAI 項目針對每個系統目標的 KPI 包括:

  • 響應性目標:合理的套利器和控制器對不同環境參數脈衝的響應時間。

  • 波動性目標:二級市場價格變化的統計離散性。

  • 穩定性目標:測量穩定與不穩定路徑在模擬中的相對頻率。

  • 流動性目標:二級市場滑點的可控性。

治理面

加密經濟系統和控制系統有一個共同的現象,就是有一組由人類設定的參數,在系統動態中編碼權衡決策。在加密經濟系統中,我們把受到人類監督的參數稱爲治理面。

明確治理面很重要,而且在可能的情況下,重要的是,調整這種參數的效果相對直接。通常情況下,治理的概念被用作一個籠統的概念,假設人類將擁有專門知識、規程和協調,以就未來對這些參數的更改達成一致。

在實踐中,目標是保持較小的治理面,以減少治理行動的頻率和複雜性。此外,前期基於模型的系統工程工作可以幫助確定初始參數,以制定推出計劃和 (或) 最大限度地減少未來變化的規模。

瞭解並選擇控制器類型

RAI 是一種創新的加密經濟系統,它使用 PID 控制器的變體作爲維持市場價格穩定的手段。PID 控制器是最常見的一類控制器。它利用比例 (P)、積分 (I) 和微分 (D) 來影響時間序列的未來值。

PID 控制器的一個強大特點是,即使在沒有預測的情況下,它也能不斷地適應,因爲誤差的增加往往會使它的適應強度更高。具體來說,P 是對眼前測量的一種理解,而 I 是對過去的理解,D 則是與未來的預期變化有關。

對於 D 而言,通過外推預期變化,有可能降低無噪聲 (理想化) 穩態誤差率,但代價是對突發變動的敏感性。一般來說,微分對市場價格中經常出現的噪聲和波動測量很敏感。在經濟環境中,D 可能成爲攻擊向量。

鑑於這些考慮,(我們)決定將分析重點放在 P 和 I 上,並將 D 設爲零。下文將簡要介紹用於評價啓動時 RAI 參數備選方案的分析種類。

探索 P 和 PI 變量,爲 RAI 啓動進行預調

迄今爲止,RAI 僅爲了響應動態的簡單性而使用 P (Kp);然而,由於已知比例控制器會受到穩態誤差的影響,因此也需要包括一個積分項。雖然積分控制器可以有效地處理穩態誤差,但它們很容易受到 wind-up (飽和)的影響,即積分項的累積會導致控制動作的偏差。爲了應對這種情況,我們還必須考慮一種抗 wind-up (飽和)機制。因此,積分泄漏率被納入我們的參數選擇空間。

惡意鯨魚測試

如果不瞭解大型代幣持有者(' 鯨魚 ')的潛在影響,任何關於價格穩定性的實驗都是不完整的。在下面的場景中,我們將設想一個名爲白鯨的惡意鯨魚購買了大部分的 RAI 供應,並利用它強行將 RAI 的市場價格保持在一個恆定的水平。

在下面的例子中,我們考慮了 5 種可供選擇的控制器類型的變量(正 Ki 與負 Ki,泄露積分器與非泄露積分器,以及零 Ki),並驗證了在合理選擇參數的情況下,長期來看,鯨魚是可能會輸給控制器的。

第一個可視化是看如果白鯨保持市場價格不變,贖回價格會發生什麼。從下圖 1 中可以看到,在所有測試的方案上,除了 Ki 爲負且無泄漏項的方案外,贖回價格在 2 周的時間內都會趨於零,這就意味着該參數化選擇不可行。

深入解析 Reflexer 穩定機制:如何將 PID 控制理論應用於加密貨幣?

相對於比例控制,具有正 Ki 項的 PI 控制器加速了白鯨誘導的市場暴跌。負 Ki 項的 PI 控制器可以緩衝崩潰,使系統恢復。然而,泄漏項是至關重要的,因爲如果讓積分項壓倒比例項,就等於控制器向攻擊者投降--這是我們不能容忍的。幸運的是,在泄漏積分項和比例項之間的關係上有一個分析邊界,能夠確保這種情況不會發生。

在 RAI 經濟動態的背景下,這種情況是如何發生的?發生這種情況的原因是控制器會根據市場價格自動調整贖回率。

當選擇比例控制器 (僅 Kp) 或帶有泄露積分項的 PI 控制器 (Kp & Ki) 時,穩態動態能包括恆定的負贖回率,着是我們在 RAI 生態系統中的目標。值得注意的是,如果我們排除泄漏,積分項就會產生反作用的加速效應。在 Ki 爲正的情況下,贖回率會向負方向加速,而在 Ki 爲負的情況下,贖回率會向正方向加速。這兩種 PI (無泄漏)情況都不是特別理想的情況。

深入解析 Reflexer 穩定機制:如何將 PID 控制理論應用於加密貨幣?

在沒有泄漏項的情況下,加入積分項有可能使 RAI 系統不可持續,因爲很明顯,它允許對用戶進行經濟剝削,或者由於越來越大的負利率而使代幣越來越無法使用。考慮到鯨魚攻擊是真實存在的問題,這一分析表明,只有在包含抗 windup (飽和)泄漏機制的情況下,P 控制器是可行的,PI 控制器是可行的。

穩態誤差測試

RAI 的另一個關注點是穩態誤差;具體來說,系統有可能在沒有縮小贖回價格與市場價格之間的預期差距的情況下實現某種程度的價格穩定。事實上,在控制設計空間中引入積分項的唯一原因是爲了幫助消除穩態誤差。穩態誤差問題往往是在存在噪聲或衝擊的情況下產生的。

在下圖 3 中,市場按照馬丁格爾過程演變。我們觀察到,Ki 項往往會對贖回率產生偏差(見下圖),這種偏差可能很小,但隨着時間的推移,將導致贖回價格的巨大差異。

深入解析 Reflexer 穩定機制:如何將 PID 控制理論應用於加密貨幣?圖 3. 即使參數選擇得當,每小時兌換率的變化幅度很小(<5e-9),但隨着時間的推移,仍會導致較大的累積誤差

在圖 4 中,我們可以看到累積誤差隨時間的變化。無泄漏的正 Ki 傾向於增加絕對誤差 (較大幅度的負誤差),而無泄漏的負 Ki 傾向於減少絕對誤差 (較小幅度的負誤差),兩者都是相對於 P 控制器測量的。負 Ki 無泄漏的 PI 控制器實現了最小的絕對誤差,但由於上面討論的惡意鯨魚攻擊,我們已經排除了該設計。

深入解析 Reflexer 穩定機制:如何將 PID 控制理論應用於加密貨幣?

在我們的例子中,相對於僅有 P 的控制器,加入泄露積分項的好處很小,因此需要進一步的調整,以便在穩態誤差的基礎上有意義地區分這兩種選擇。就目前而言,這意味着加入 I 項所增加的複雜性在短期內並不能被系統穩定性的好處所證明,在實施之前還需要在這個方向上進行更多的研究。

另一個重要的觀察是贖回價格的失控趨勢。比例控制器和有抗 windup (飽和)的 PI 控制器能夠實現控制,而沒有抗 windup (報個)的 PI 控制器則會失控。負 Ki 項會導致贖回價格發散(跑偏到無窮大),而正 Ki 項會導致贖回價格收斂到 0。

深入解析 Reflexer 穩定機制:如何將 PID 控制理論應用於加密貨幣?圖 5. 非泄漏的 PI 控制器會在贖回價格上產生漂移,即使累積價格誤差的大小仍然是有界的

不確定性下多維繫統的參數選擇

在對控制參數進行迭代的同時,還要對 RAI 系統和交互作用的大量數據和複雜性進行科學分析,這就需要使用新的科學方法。

上面的簡單模型只考慮了 P(I) 的控制邏輯,下面用於分析的模型則包括了該背 RAI 的抵押債務頭寸以及作爲 RAI 二級市場 (和價格傳感器) 的流動性池服務

爲此,BlockScience 開發了「不確定性下的參數選擇」方法,以實現數據驅動的知情決策。這篇關於「在不確定性下執行參數選擇」的文章對它以及相關步驟和挑戰進行了簡要描述。

RAI 參數選擇

在下面一節中,我們將提供一些非詳盡的例子,說明在更廣泛的 RAI 系統模型上運行的一些計算實驗,其中包括 SAFEs 系統和流動性池(ETH/RAI Uniswap 實例)。

場景測試

我們的工作流程規定了一些測試場景,以將系統目標與可測量的 KPI,以及最終與選定的控制參數聯繫起來。所執行的場景包括:

  1. 「合理性檢驗」,以確保系統的 Plant 表現符合預期;這將考慮控制器關閉的情況,唯一的不確定性來源是 ETH 價格的變動。
  2. 衝擊檢驗,即引入外生過程的預設變化,衡量系統的反應能力,以及
  3. 軌跡抽樣,即蒙特卡洛在許多隨機過程實現上運行,在各種環境條件下對反映系統目標的關鍵績效指標進行測量和評價。

「合理性檢驗」測試

要測試的基線場景是債務和二級市場系統在沒有控制器的情況下自行運行。這種測試是爲了確保 「Plant」 模型在使用它來評估控制器之前正常工作。

這個合理性檢驗通過固定贖回價格來複制 ' 掛鉤到法幣 ' 的控制器。在這種情況下,系統應該達到一種狀態,即 ETH 的價格變動會被 ' 傳遞 ' 到市場價格上,而贖回價格固定在其初始條件下(這種情況下,RAI 是 Reflexer 在發佈時設定的值,3.14 美元 /RAI)。「合理性檢驗」的結果見下圖 6。

深入解析 Reflexer 穩定機制:如何將 PID 控制理論應用於加密貨幣?圖 6:在 PID 控制器關閉的情況下,將生成的 ETH 價格信號引入模型,在 RAI 的市場價格上產生相應的變動

如圖 6 所示,在控制器關閉的情況下,ETH 價格產生的變動會在 RAI 的市場價格中產生相應的變動,並有輕微的向上漂移(具體到 ETH 價格的衝擊過程實現)。觀察到的動態與同類系統(如單一抵押品 DAI)中的動態相似。

衝擊測試的攻擊和失效模式

與任何綜合系統設計一樣,我們需要了解我們系統的侷限性,以及在什麼情況下會出現故障。衝擊測試從實現外部過程的一次性變化開始,例如 ETH 的價格,並檢查由此產生的對系統動態的影響。衝擊測試對於選擇能保持系統穩定的參數範圍特別有用,即保持價格和代幣餘額不至於跑到無窮大或爲零。

下面是一個例子,比如,兩週後 ETH 價格突然下跌 30%。我們可以看到,在 Kp=2e-07 和 5e-09 的情況下,對 PI 變量的影響是失控的,而那些由參數建議給出的值則保持穩定和有界。

深入解析 Reflexer 穩定機制:如何將 PID 控制理論應用於加密貨幣?圖 7:2 周後 ETH 價格階梯變化下贖回價格與市場價格的衝擊分析。綠色爲泄露 PI 控制器的可行參數範圍,紅色爲失敗模式的例子

建議參數範圍

基於不確定性工作流程下的參數選擇,我們確定 P 控制器是最簡單和最安全的網絡啓動配置,並進一步觀察到,如果我們希望進一步減少穩態誤差,可以添加一個積分,但只有當泄漏項被包括在內,並進一步滿足條件 Kp > -Ki /(1 - �),其中α是泄漏積分參數使纔可以。

下圖 8 是使用參數值取自推薦範圍的模擬示例,其中比例項爲正,積分項爲負,表現出穩定性--控制器的作用是減弱外生隨機過程的變化,如 ETH 價格。在這種情況下,Kp 項比 Ki 項強 3 個數量級以上,積分項每期泄漏 1/1000 的值。由此產生的系統在穩態時的表現與純 P 控制器相當(如下圖所示),但如果出現穩態誤差,則有額外的能力來消除它們。

深入解析 Reflexer 穩定機制:如何將 PID 控制理論應用於加密貨幣?圖 8:贖回價格與 ETH 價格的比較,使用推薦參數的實現

深入解析 Reflexer 穩定機制:如何將 PID 控制理論應用於加密貨幣?圖 9:模擬 RAI 流動資金餘額與 RAI 債務餘額的實現情況

逐步推出

在創建和部署新的金融系統時,我們需要進行漸進式的測試和推廣,以確保系統安全,然後再向更多用戶和更多資本開放。

2020 年 10 月,ProtoRAI(PRAI) 進行了一個激勵性的主網測試,以低債務上限的方式啓動,用於測試系統行爲,併爲更大規模的正式 RAI 系統啓動提供參考。這裏的目的是在全面部署之前,觀察小規模低質押的情況。

RAI 網絡於 2021 年 2 月 17 日上線,初始配置只有比例控制器 Kp 項。該系統表現出預期的行爲,與我們在比例控制器情況下預期的結果一致。

深入解析 Reflexer 穩定機制:如何將 PID 控制理論應用於加密貨幣?截至 2021 年 4 月 2 日,每個 RAI 分析儀表盤的價格

繼續監測實時數據,並將其與系統模型相結合,將揭示是否值得納入綜合控制項 Ki 及其泄漏的 「抗飽和」機制。這將增加系統的複雜性,但也可以確保長期的可持續性,從而在 RAI 系統的生命週期內促進治理最小化。

治理最小化

試圖通過忽略治理面來實現治理最小化,就好比上了一輛自動駕駛汽車,卻無法指示汽車導航,讓它帶你到哪裏去。

在實踐中,治理最小化首先要有一個定義明確的治理面,然後是關於誰、何時以及如何改變參數的明確程序。成功的治理最小化意味着做出更少、更小、更明確的改變,並減少業務開銷。

參數完全不耦合的情況很少;更多的時候,適當的值是相互關聯的,就像我們看到的 Kp、Ki 和α(泄露積分參數)。模型在監測系統健康方面發揮着重要的作用,因爲它們可以幫助抑制爲了治理行動而採取的治理行動,這實際上是將系統置於風險之中,同時反過來幫助確定何時需要採取行動,有足夠的預警來規劃、測試和執行有效的干預措施。

下一步

鑑於我們已經有了 RAI 動態和主網發佈的全功能模型,我們接下來要擴大現有模型的規模,使其與實時數據相結合,爲持續監測提供信息。此後還要作出決定,要從衝擊和事件中學習,以提高我們對周圍複雜的新動態的理解。

結論

在這篇文章中,我們總結了 RAI 穩定性控制器的參數選擇的工程工作,旨在進一步教育和告知以太坊社區關於計算機輔助設計在複雜系統中的重要性。

通過介紹 PID 控制器的概念和它在 RAI 生態系統中的參數化,以及對系統進行電池衝擊和靈敏度測試以瞭解系統的響應情況,我們更好地瞭解了 RAI 如何應對系統控制之外的各種攻擊和外生衝擊。

最終,Reflexer 團隊的目標是提供一種低波動性、最小化治理、穩定價格的資產,供以太坊生態系統使用。儘管存在不確定性,但只要有嚴格的控制理論基礎,這些特性就可以變得可靠。

來源鏈接:www.8btc.com