DD共趨檢驗和DDD運行
雙重差分法共同趨勢檢驗
如下面方程(1),這是個教科書式的DID。因變數Yjt是第j個城市在第t年的嬰兒死亡率。等式右邊控制了地區uj和時間kt,Postj是處理前處理後的dummy,Tj是是否是treatment group的dummy。這樣,交互項前面的係數就是我們關心的效應。
上面DID成立的前提條件在於「共同趨勢假設」,那麼作者是如何一步一步讓大家信服的呢?
1.畫圖。
在有超過2期數據的時候,畫圖是經常被採用的方法。
如圖,可以發現treatment group和control group在1998年之前基本保持差不多的趨勢,1998年之後treatment group的嬰兒死亡率驟減。
2. 比較各年的交互項係數
作者計算了各年的交互項係數,發現1998年之後這個係數有個下降。類似上圖,原本treatment group的嬰兒死亡率更高,趨勢平穩,但1998年之後就有了逆反的趨勢。
(但1998年後的係數均不顯著,90%的置信區間都蓋住了0。也就是說,其實本文的證據不是特別「強」,只是把各年year dummy合在一起成Post dummy才變得顯著。這或許可以解釋加了時間趨勢後就不顯著了。)
3.加時間趨勢
如式(2),作者加入了每個地區的時間趨勢變數,控制可能存在的趨勢差異。
但加入時間趨勢後,主結果變得不顯著了!如表3的第(4)列。作者的解釋是:加入地區時間趨勢變數後,自由度下降太多,標準誤變大了1倍導致不顯著,但係數接近不變說明系統性趨勢差異的有無不能解釋嬰兒死亡率的不同或者說處理組和對照組不存在系統性的趨勢差異。文章的結論並沒有強大到星星一直能穩健存在,但現有證據還算有力。上述3個步驟差不多是DID的標準流程了。
4.檢驗每個協變數的DID效應
第4步倒是不多見,因此特意推文,供大家參考。
政策可能是內生的,比如如果女性勞動參與率更高的城市污染更高,那麼兩控區就更針對這些城市,這些城市的女性更注重孩子的質量(quantity-qualitytradeoff),所以嬰兒死亡率低。這就混淆到了本文「兩控區與嬰兒死亡率負相關」的結論。
本文把方程(1)中xjt的每個協變數依次放到因變數位置,並檢驗交互項的顯著性。
如上表,交互項均不顯著,第(2)列把樣本限制在1996-2000年的一個五年規劃期內進行回歸,交互項同樣不顯著。
這個思路就在於,所有可觀測的協變數如果被視為因變數的話,兩控區政策對它們都沒有效應。這可以增強我們對共同趨勢成立的信心,因為一個政策的實施,都沒有改變所有x的雙差分值。可以想見,那些x的趨勢跟政策真沒什麼關係。進一步的,既然兩控區政策對所有可觀測協變數的變化沒有影響,那麼可以推測,兩控區政策對所有不可觀測協變數的變化沒有影響(有點像matching的思想)。當然,這不是一個嚴格的檢驗。類似的思路可以參考Altonji et al.(2005)的JPE。
我們認為,這個做法對於DID共同趨勢假設的成立既不是充分條件也不是必要條件——如果用某個協變數x時交互項顯著了,那也不能說就違背了共同趨勢假設,因為某個政策的實施可能確實會讓x發生變化,共同趨勢假設是潛在值,即如果沒有這個政策,原本控制組和處理組應該有共同的趨勢;如果所有x作為因變數時交互項都不顯著,也不能說DID就一定沒問題了,但無疑會很大程度上增強可信度。
三重差分法及運行
雙重差分法的關鍵假設是實驗組與對照組的時間效應一樣。這個假設只有通過足夠長的時間序列數據才能檢驗。需要指出的一點是,即使干預發生之前兩組時間序列一致,也不能保證干預發生後兩組時間序列是一致的。有可能在干預發生的同時在實驗組或者對照組中又發生了其他影響產出的事件,則干預發生後兩組的時間趨勢是不一致的。簡單的雙重差分估計是有偏的。如圖3所示,如果對照組是虛線所示,則雙重差分估計是無偏的。但如果對照組是上方的實線,則雙重差分估計法是有偏的,偏差部分是在時刻,該實線與虛線之間的距離。
解決這個問題有兩個思路:第一個是尋找更多的對照組,把多個對照組加權構造成一個虛擬的對照組,使得雖然每個對照組都與實驗組的時間趨勢不一樣,但加權後的虛擬對照組的時間趨勢與實驗組的一樣。這個方法被稱作綜合控制法(Synthetic Control Method)。Abadie & Gardeazabal(2003)(14)用這個方法研究了恐怖衝突對經濟發展的影響。
解決這個問題的第二個思路是估算出這個因為時間趨勢不同而帶來的偏差,然後從雙重差分結果中減去這個偏差即可。這被稱作三重差分法(Difference-in-differences-in-differences, DDD)。三重差分法的思路是,既然兩個地區(分別指實驗組和對照組)的時間趨勢不一樣,那麼我們可以分別在兩個地區尋找一個沒有受到干預影響的人群/行業,通過對這兩組的雙重差分估算出時間趨勢的差異,然後再從原來實驗組和對照組的雙重差分估算值中減去這個時間趨勢差異。Gruber(15)就使用了這種方法。
圖3時間趨勢差異造成的估計偏差
三重差分法例證:
三重差分法回歸及運行命令
正如上面的二重差分法實際上運用的是OLS做的回歸,我們之前說過,倍差法是相當於two-way fixed effect model,裡面包括個體效應時間效應,而對於一個這樣的panel data,我們可以運用LSDV通過添加個體和時間虛擬變數來回歸,或者運用demeaned variables回歸來消除個體和時間效應,再加上那些交互效應後就可以像其他fixed effect回歸一樣。二重差分法一般是在同一個省(地區)區分treatment和control組的,而三重差分法則包括另一個未受到政策衝擊的省(地區),來區分treatment和control組的,當然三重差分法要穩健得多。
Empirical Methods in Applied Economics Lecture
Jorn-Steffen Pischke
http://econ.lse.ac.uk/staff/spischke/ec524/evaluation3.pdf
接下來,我們來區分一下二重差分和三重差分在Stata的運行過程
1992年,美國新澤西州通過法律將最低工資從每小時4.25美元提高到5.05美元,但在相鄰的賓夕法尼亞州最低工資卻保持不變。Card and Krueger收集了兩個州的快餐店在實施新法前後僱傭人數的數據,並使用雙重差分法進行估計。
註:fte:full time employment人數; treated=1,表示快餐店在新澤西州,否則在賓夕法尼亞州;t=1,表示時間為1992年11月, 否則為1992年2月;bk=1,表示Burger King快餐品牌;kfc=1,表示肯德基快餐品牌;roys=1,表示Roy Rogers快餐品牌; wendys=1,表示Wendy s快餐品牌。
以下黑色字體的code可以直接在Stata上執行
1.讀取數據:
use "http://fmwww.bc.edu/repec/bocode/c/CardKrueger1994.dta"
2. 簡單的二重差分:
diff fte, t(treated) p(t)
*這裡DD10%水平下顯著
3.簡單的三重差分(快餐品牌bk作為第二個處理組):
diff fte, t(treated) p(t) ddd(bk)
*這裡DDD表不顯著
@計量經濟學圈
記錄一個我們生活在其中的時代社會,一個非常具有潛力的深度與客觀兼具的大號,囊括的主題如下:經濟、社會、歷史、新聞、世界、計量工具。
※微觀計量的最新進展
※傾向匹配分析深度
※政策效應評估的四種方法
TAG:計量經濟學圈 |
※D-GLES支持VR讓你的智能手機完美運行《DOOM》
※RPCS3運行《GT賽車HD概念版》《如龍OF THE END》
※在 Linux 中怎麼運行 MS-DOS 遊戲和程序
※OLED周報:維信諾6代柔性AMOLED線啟動運行,萬潤股份戰投簽訂增資協議
※No AMD?《命運2》又出現對AMD的Bug:在三代銳龍平台上無法運行
※OPPO Find X遊戲性能體驗:全程滿幀運行
※微軟 Azure推出支持運行AI、HPC工作負載的NVIDIA GPU
※TEAM-XECUTER推出運行盜版遊戲的SWITCH配件
※首款運行在安卓手機上的SWITCH模擬器MONONX
※Morph 3D虛擬形象創建引擎可直接運行於遊戲和VR應用
※可獨立運行的 MIDI 處理器 Midihub 發布
※使用Docker運行常見的Web服務與管理
※NASA公布OSIRIS-REx探測器圍繞Bennu運行拍到的新短片
※1GB運存運行安卓GO系統:TCL阿爾卡特1X上手體驗
※混合雲利器:VMware 上可運行 AWS RDS 資料庫
※《戰神》新作PS4和PS4 Pro畫面及幀數運行表現分析
※Switch可全速運行PSP《合金裝備:和平行者》及GTA
※三星發布LPDDR5運行內存 UFS3.0還遠嗎?
※人臉識別技術+前後兩顆攝像頭8GB運行內存 OPPO新機媲美IPHoneX
※Chrome瀏覽器中的GPU及內存運行