清研智庫:AI可以模擬人類社會復雜的經濟選擇嗎?
稅收政策分析是一個發展良好的領域,擁有強大的研究機構、智囊團和政府機構廣泛的建模基礎架構。由于稅收政策影響到所有人,尤其是富人,因此它獲得了很多關注和研究經費。除進行實證研究外,布魯克林城市稅收政策中心和稅收聯合委員會等組織還對稅收政策進行了微觀模擬,以全面模擬數千種決策手段。但是,由于很難猜測人們將對不斷變化的公共政策情景做出怎樣的反應,因此這些模型在解釋個體行為因素的能力方面受到限制。
來自哈佛大學銷售力量的一組研究人員開發了一個旨在提出新的稅收政策的人工智能(AI)系統,他們稱之為AI經濟學家。盡管其初步分析的結果并沒有被《美國法典》收錄,但他們提出的方法可能具有相當大的意義。當前的大多數稅收政策模型都可以根據先前的研究結果推斷人們對政策變化的反應。但是,在AI經濟學家的方法中,計算經濟參與者的行為是從簡化的博弈經濟中學習的。他們使用一種稱為強化學習的AI來做到這一點。
強化學習
AI的一個特定子領域稱為強化學習,推動了復雜行為建模的進步。強化學習系統在古代游戲和現代電子游戲中都擊敗了人類玩家。強化學習的工作原理是鼓勵隨機探索可能采取的行動,然后獎勵那些導致積極成果的行動。
“ AI經濟學家”方法-從游戲到博弈論
哈佛銷售力量的研究人員從游戲到博弈論,采用了這種方法,建立了一個簡化的世界,在這個世界里,人工代理人可以收集資源(石頭和木頭),然后通過蓋房或在彼此之間出售商品來賺錢。代理人的技能水平不同,具有激勵專業化和造成經濟不平等的雙重結果。他們沒有硬編碼這些代理人的行為,而是將最佳結果定義為金錢和閑暇時間的混合,然后讓人們了解哪些選擇使他們處于最佳狀態。就像捉迷藏一樣,強化學習產生了人類在這種情況下所看到的各種細微差別的活動,比如諸如避稅策略之類的經濟活動,這種行為復雜有趣,因為它提供了一種在復雜模型中產生更現實經濟行為體的方法。
該系統還創建了AI政策監管機構,該機構調整了邊際稅率,以試圖最大限度地提高經濟效率和公平性。
值得進一步考慮的是經濟中的AI參與者。深度學習和強化學習取得了巨大的進步,AlphaGo的例子就是最好的例證。將現代強化學習應用于模擬經濟確實令人信服。但是,這種新方法帶來了新舊挑戰。要了解強化學習方法對學習行為的潛在價值,重要的是要了解現有的稅收模型如何工作,以及為什么行為效應是其設計的一個弱點。
現代稅收模式中的行為
盡管模型可以模擬各種各樣的收入和工資稅政策,但是它們對個人行為變化的核算更加有限。它們主要基于納稅申報表中的管理數據,而這些數據無法深入了解納稅人如何對稅收政策做出反應。此行政稅數據可以告訴您大多數美國人賺了多少錢,有多少家庭獲得了稅收抵免。但是,僅憑這些數據并不能告訴我們這些抵免額如何影響工作決定或提供兒童保育服務。
為此,這些模型使用個人對稅收反應的估計來自實證研究。相對于個人對稅收的所有反應方式,行為影響的清單仍然很短。所有模型均是如此,包括聯邦政府使用的模型。
政策的微小調整將導致較小的行為影響,因此,在接近基準政策的情況下,模型相對準確。但是,隨著變化變得更加劇烈,行為影響可能會變得更大,因此,評估模型估計的準確性變得更加困難。
學習微觀經濟行為的兩個挑戰
微觀經濟行為的有限核算是當前稅收政策微觀模擬模型中的一個已知且顯著的弱點。
要客服這一弱點還存在兩個主要障礙:創建現實的虛擬經濟和在AI代理中產生類似人的行為。
構建現實的虛擬經濟
為了使結果成為有意義的行為,游戲化經濟必須更加現實。
建立足夠現實的經濟模擬將需要大量時間。需要對就業、住房、教育、金融、兒童和老人護理、政府等更為復雜的市場提供代表。歷史上,經濟學家一直不愿在擴大經濟模擬方面投入大量資金。面向公眾的模型似乎并沒有獲得足夠的支持以繼續發展。可以說,開源工作可能會吸引足夠的社區支持以繼續這項工作,但它也可能需要長期的專項資金。
經濟數據收集的急劇增加,特別是在數字經濟中,可能有助于實現這一目標。但是,大多數數據不向公眾公開。如果研究人員能夠將Google、LinkedIn、亞馬遜等數字巨頭的海量專有數據集以及信用卡交易數據結合在一起,那么將會出現更加全面的經濟前景。
雖然建立足夠復雜的經濟模擬以產生令人信服的行為是困難且耗費資源的,但是對電子游戲的研究表明這是可能的。
將AI約束為現實的人類行為
對于AI經濟參與者而言,有助于在提議的稅收計劃中發現漏洞和潛在的避稅(甚至逃稅)策略。它也是高度個性化的,這意味著行為是從經濟前景中專門學習的。
另一方面,這也意味著AI參與者在優化其經濟狀況時需要受到限制。這并不是說AI不會放松,因為研究人員將“最優”的定義設定為放松和賺錢的結合。但是,這的確意味著AI參與者具有超自然的理性,以無人能及的方式最大化其財務和休閑度。使用AI模擬人的目的是為了更接近現實的人類行為,而不是經濟機器。
從長遠來看
在幾乎所有的社交應用程序中,AI本身什么都不做。然而,隨著領域專家的謹慎應用,AI可以帶來漸進式的改進,隨著時間的推移,會產生有意義的影響,就像在政策研究中一樣。
我們可以合理地假設,在經濟行為建模中采用強化學習將需要很長時間才能有意義地應用。這一點尤其正確,因為它需要更全面的經濟模擬才能真正提供信息。不過,20年后,這種方法可能會產生相當大的影響,或許會取代目前圍繞動態評分(即宏觀經濟因素應在多大程度上被納入微觀模擬模型)的辯論。許多因素表明,這可能是由于計算能力和大數據可用性的提高,行為經濟學的普遍接受度以及從理論模型向實證經濟學的更廣泛轉變。如果它真的流行起來,一種從根本上更具信息性的經濟分析方法可能就在眼前——它可以幫助設計一個更好的稅收制度,甚至告訴我們什么時候稅收是解決政策問題的錯誤方法。