從主觀交易到客觀交易(5)—統計方法的實踐[程序化老手]
?
?
統計分析由明確的程序構成,用以收集、分析與解釋資料。如果技術分析真具備所相信功能,必須採用科學架構,運用正統的統計分析。用于檢定交易策略是否有效的統計方法為「統計推論」。
在統計推理的計算過程,先假設所有技術分析指標不具預測功能(虛無假設),再用實際證據(歷史測試的報酬率)否認虛無假設,并接受替代假設,以承認技術分析法具備預測能力。若技術分析法無預測功能,則在抽離趨勢的資料中,期望報酬率應為0;但須注意的是,樣本必須夠大,若樣本太小,報酬率也可能顯著偏離0。統計學可以透過數學函數計算因機運而獲利的機會有多少,若機運小到顯著程度(例如5%),則接受為非機運結果。
若某技術分析法則的期望報酬為0或負數,則歷史測試績效應該相當接近0。但歷史測試績效并不顯著等于0(甚至顯著大于0),則可做出有效結論,「技術分析法則期望報酬率為0或負數的說法非常不可能成立」。
統計學通常以虛無假設成立的機率低于0.05,作為觀察的統計顯著性指標。但若使用資料探勘方法形成策略,可能產生資料探勘偏頗,則虛無假設的績效門檻必須高很多,才可避免誤判。此外,由于無法假定金融市場的動態結構是平穩的,在此考慮的技術分析法則不能發生在無限的未來期間。
統計推論的要素包括:母體、由母體隨機抽樣取得的樣本、母體參數、樣本統計量(樣本可衡量的性質)、推論(根據樣本統計量推估母體參數的方法)、有關推論的可靠陳述(包含不確定性,但考靠性可以衡量)。
統計推論的方法是對邏輯推論的假設,依據實證結果做出檢定。
在方法的運用上,可以使用…
1.「單一母體平均數的統計檢定」,用以檢定特定交易策略的回測績效是否顯著不小于特定值(例如0或交易成本)
2.「單一母體平均數的比例檢定」,用以檢定特定交易策略的回測勝率是否顯著不小于特定值(例如60%)
3.「單一母體平均數的比例檢定」,用以檢定特定交易策略的回測變異數(風險指標)是否顯著不小于特定值(例如市場風險)
4.「成對母體平均數的統計檢定」,用以檢定兩交易策略的回測績效是否顯著不相同
5.「成對母體平均數的比例檢定」,用以檢定兩交易策略的回測勝率是否顯著不相同
6.「成對母體平均數的比例檢定」,用以檢定兩交易策略的回測變異數(風險指標)是否顯著不相同
7.「單因子變異數分析母體平均數的比例檢定」,用以檢定單一變數(例如策略運用在不同類股),對于交易策略的回測結果的影響效果。
8.「雙因子變異數分析母體平均數的比例檢定」,用以檢定兩變數(例如策略運用在不同時期、不同期貨商品),對于交易策略的回測結果的影響效果。
9.「區間估計」,用交易策略的回測結果(樣本),估計該交易策略實際交易策略的可能報酬落點。
?
以下僅就「單一母體平均數的統計檢定」說明運用。
首先,檢定須在抽樣之前,先對母體參數建立暫時性的假設,經資料收集后做統計分析,以判斷是否拒絕該母體參數所做之假設。,母體參數包含平均數、比例、變異數。
對母體參數所做的暫時性假設,稱為虛無假設(Null Hypothesis),以H0表之;另須建立一與H0互斥的假設,稱為對立假設(Alternative Hypothesis),以H1表之。通常,對立假設才是研究者比較關心且想要得到的結論,假設檢定的目的是希望能根據樣本數據,推翻虛無假設,接受對立假設。
除非普查,否則透過樣本作母體假設的檢定,無法完全確認,可能出現兩種錯誤,型1錯誤是「事實上虛無假設為真,卻否決虛無假設」,此錯誤機率以Alpha表之,進行假設檢定時,犯型1錯誤的最大機率稱為顯著水準(Level of Significance),通常取0.01、0.05或0.1。型1錯誤是統計檢定所極欲避免的。型2錯誤是「事實上虛無假設為假,卻接受虛無假設」,此錯誤機率以Beta表之。所謂「接受虛無假設」,比較嚴謹的說法應該是「目前沒有足夠證據推翻虛無假設」。
假設檢定的型態依據拒絕區域的位置不同,分為單尾檢定(One-tailed Test)與雙尾檢定(Two-tailed Test),單尾檢定又可分為左尾檢定與右尾檢定。
對雙尾檢定來說,其拒絕區域平均分配在樣本抽樣分配的兩側(各佔0.5 Alpha)。
對單尾檢定之左尾檢定,其拒絕區域在樣本抽樣分配的左側(佔Alpha)。
對單尾檢定之右尾檢定,其拒絕區域在樣本抽樣分配的右側(佔Alpha)。
?
假設檢定包含以下5步驟:
1.依據研究主題,對母體參數建立虛無假設與對立假設
2.選擇檢定統計式,針對樣本的抽樣分配,確定檢定統計式
3.考量犯型1誤差造成后果大小,與愿意承擔風險,設定顯著水準,并計算臨界值。
4.依據樣本數值代入檢定統計式,計算檢定統計量。
5.依據決策法則,比較檢定統計量與臨界值,做出檢定結論。
所謂「決策法則」,判斷方法如下…
?
1.若樣本統計量落在接受區域,則「不拒絕」或「接受」虛無假設。
2.若樣本統計量落在拒絕區域,則「拒絕」虛無假設,推論對立假設為真。
?
用于決定接受與拒絕區域的臨界值,與樣本平均、標準差(變異程度)、樣本數以及顯著水準等因素有關,均可直覺推論。
?
以上統計分析程序可以在Excel上實踐。
有思路,想編寫各種指標公式,程序化交易模型,選股公式,預警公式的朋友
可聯系技術人員 QQ: 511411198 進行 有償 編寫!(不貴!點擊查看價格!)
- 上一篇:小心追殺程序化交易策略
- 下一篇:沒有了!
相關文章
-
沒有相關內容