Wat is the story behind ?

I guess this is will be one of the rarely-seen posts written in Chinese in this website because I worte this for my last assignment in NSYSU. I will just cut off the intro and the conclusion.



為什麼工具變數重要呢?讓我們先來考慮下列問題。我們都知道警察人數的多寡和犯罪率一定存在某種關係,因為警察的存在可以嚇阻犯罪。以我們最貼近我們生活的新聞為例:台中市犯罪率高的一個主要原因常常被認為是警察人數不夠應付龐大的台中市人口。但是,值得注意的是,一個地方警察人數眾多,通常也象徵著那個地方犯罪率高,否則不需要這麼多警察。因此,一個有趣的問題是,如果一個地方警察多,意味這地方治安好呢,還是治安差呢? 犯罪率的高低可以用警察人數的多寡來推論嗎?

再來看看一個例子,我們會更清楚工具變數的重要性。某甲去修了微積分得了高分,後來在某甲在經濟學考試中也拿了高分。於是我們得出結論,修微積分有助經濟學考試拿高分。是這樣子嗎?有沒有可能是某甲本身數理能力就不錯,如果沒有修微積分,同樣還是可以拿高分?

如果還是不懂,再看最後一個例子。在台灣,大多數的人應該都同意以下的論述:泛藍的人反扁,泛綠的人士挺扁。所以要知道某人泛藍或泛綠,通然我們就可以知道這個人挺扁還是反扁,其他因素都不重要了。教育程度,種族,職業,都跟無法比一個人的黨派屬性更具有解釋力。然而,事實是如此嗎?

以上的這些問題,都關係著一個很重要的問題,那就是工具變數。詳細的說,兩個變數之間,如果還存在第三個變數可以同時解釋這個變數,那麼我們應該把這個第三個變數的影響力拿掉,我們才可以看清楚這兩者之間的關係。

用嚴謹的計量術語來說,傳統的迴歸分析中,有一個條件即是誤差項(error term) 不可以和解數變數(explanatory variable) 有關,否則後果就是biased。 所謂工具變數(instrument variable) 之所以是一個「工具」就是如果解釋變數與誤差項(Sometime error term is also interpreted as unobservable variables )有關時,我們要找出一個變數來替這個會導致bias的解釋變數,此變數與原解釋變數有關,但與誤差項無關。

一個有名的例子是,在探討工資與一個人受教長短的議題中,我們用一個人「生於九年國教施行前」或「施前後」來取代受教育長短,因為受教長短和一個人資質有關,但資質不可觀察,是為Error term。也就是說受教長短不可用來解釋工資,因為它違反了迴歸分析中的一個重要假設。如果沒有釐清這些重要的假設,而似是而非的利用回歸分析的,其實只是貽笑大方罷了。

No comments: