關於Cart的演算法 |
尚未結案
|
hotswin
中階會員 發表:72 回覆:92 積分:52 註冊:2003-11-06 發送簡訊給我 |
最近小弟要學關於Cart的演算法,可是找不到相關的的書或範例
Google也找沒有教學的範例。
所以想請教高手 example
請教圖中的 結點 文字 學年,學院,年齡...等
是以什麼資料得到的呢 1,樹根分割法則
從樹根處選擇一個具有最小不純度的屬性(註),並依此屬性所以可能的值產生不同分枝,每
一分枝含有所有該屬性之值同此分枝之值的資料 2.分枝判別法則
判斷每一分枝:如果分枝中佔有最大比例的決策值,其比例大於一預設之最大決策比例限制,
則稱此分枝為近似同質分枝. 3.終止法則
如果所有分枝均為, 或
(1) 近似同質分枝,或
(2) 分枝所處層數大於一預設之最大分枝層限制,或
(3) 分枝所含資料數目小於一預設之最小分枝資料數目限制
則以目前各分枝中佔有最大比例的決策值做為此分枝之決策值,輸出歸納決策樹並停止;否
則到步驟4 4.分枝分割法則
對每一個非同質分枝,在該分枝下,選擇一個該分枝尚未選擇過,且具有最小不純度的屬性,
同步驟1的方法產生下一層分枝,回到步驟2. 註:
假設一個離散資訊Y={Y1,Y2,Y3,….,Yn}
不純度函數Gini指標函數為
Gini(Y)=1-{P(Y1)^2+ P(Y2)^2+ P(Y3)^2+…P(Yn)^2}
Gini函數值越小代表此離散資訊分布情形越純
------
xinjier禮品贈品 |
本站聲明 |
1. 本論壇為無營利行為之開放平台,所有文章都是由網友自行張貼,如牽涉到法律糾紛一切與本站無關。 2. 假如網友發表之內容涉及侵權,而損及您的利益,請立即通知版主刪除。 3. 請勿批評中華民國元首及政府或批評各政黨,是藍是綠本站無權干涉,但這裡不是政治性論壇! |