《機(jī)器學(xué)習(xí)試題》由會(huì)員分享,可在線閱讀,更多相關(guān)《機(jī)器學(xué)習(xí)試題(2頁珍藏版)》請(qǐng)?jiān)谘b配圖網(wǎng)上搜索。
1、精品文檔
2歡在下載
2010年春碩士研究生 機(jī)器學(xué)習(xí) 試題
下列各題每個(gè)大題 10分,共8道大題,卷面總分 80分
注意:在給出算法時(shí),非標(biāo)準(zhǔn)(自己設(shè)計(jì)的)部分應(yīng)給出說明。特別是自己設(shè)置的參數(shù)及變 量的意義要說明。
1.下面是一個(gè)例子集。其中,三個(gè)正例,一個(gè)反例。 “P”為正例、"N’為反例。這些例子
是關(guān)于汽車的。例子有 4個(gè)屬性,分別是“產(chǎn)地”、“生產(chǎn)商”、“顏色”、“年代”。
產(chǎn)地
生產(chǎn)商
顏色
年代|
類別
Japan
Honda
Blue
1980
P
Japan
Honda
Blue
1990
P
USA
Chrysl
2、er
Red
1980
N
Japan
Honda
Red
1980
P
其中:“產(chǎn)地”的值域?yàn)椋↗apan,USA)、“生產(chǎn)商”的值域?yàn)椋℉onda, Chrysler)、"顏色"的 值域?yàn)椋˙lue,Red)、“年代”的值域?yàn)椋?980,1990)。這里規(guī)定“假設(shè)”的形式為 4個(gè)屬性值
約束的合??;每個(gè)約束可以為:一個(gè)特定值 (比如Japan、Blue等)、?(表示接受任意值)
和 (表示拒絕所有值)。例如,下面假設(shè):
(Japan, ?, Red, ?)
表示日本生產(chǎn)的、紅色的汽車。
1)根據(jù)上述提供的訓(xùn)練樣例和假設(shè)表示,手動(dòng)執(zhí)行候選消除算法。特別是要寫出處理
3、 了每一個(gè)訓(xùn)練樣例后變型空間的特殊和一般邊界;
2)列出最后形成的變型空間中的所有假設(shè)。
2 .寫出ID3算法。(要求:除標(biāo)準(zhǔn)ID3算法外,要加入“未知屬性值”和“過適合”兩種情 況的處理)。
3 .給出一個(gè)求最小屬性子集的算法。
4.給定訓(xùn)練例子集如下表。依據(jù)給定的訓(xùn)練例子,使用樸素貝葉斯分類器進(jìn)行分類。
給定類別未知例子〈高度=矮,頭發(fā)=紅,眼睛=蘭>,計(jì)算這個(gè)例子的類別。(計(jì)算類別時(shí)要 先列出式子,然后再代入具體的數(shù)) 。
例子號(hào)
高度
頭發(fā)
眼睛
類別
1
矮
淡黃
蘭
+
2
高
淡黃
蘭
+
3
高
紅
蘭
+
4
高
淡黃
4、
褐
一
5
矮
里 八、、
蘭
一
6
高
里 八、、
蘭
一
7
高
里 八、、
褐
一
8
矮
紅
褐
一
5.給定線性函數(shù) ?(x) W0 W1X1
wnxn及誤差定義 E 1 (f(x) ?(X))2
2x D
其中,Xi是例子x的第i個(gè)屬性值,f(x)是目標(biāo)函數(shù),D是訓(xùn)練例子集合。請(qǐng)給出一個(gè)算法, 這個(gè)算法能求出一組 Wi值,使得線性函數(shù) ?(x)逼近目標(biāo)函數(shù)f(x)(本題要求寫出算法的 步驟,算法步驟的詳細(xì)程度要符合書中算法的標(biāo)準(zhǔn)) 。
6.給定例子集(如下表),要求:1)用平面圖直觀畫出例子的分布; 2)給出一種規(guī)則好壞
5、
的評(píng)判標(biāo)準(zhǔn);3)寫出概念聚類算法。
例子
X1
X2
X3
X4
e1
0
A
0
1
e2
0
B
0
0
e3
0
C
1
2
e4
1
A
0
2
e5
1
C
1
1
e6
2
A
1
0
e7
2
B
0
1
e8
2
B
1
2
7.簡(jiǎn)述題
1)簡(jiǎn)述“機(jī)器發(fā)現(xiàn)”的三個(gè)定律;
2) KBANN EBNN FOCL是分析學(xué)習(xí)和歸納學(xué)習(xí)結(jié)合的三個(gè)算法。簡(jiǎn)述這三個(gè)算法與單純的 歸納學(xué)習(xí)方法相比,分別有什么區(qū)別或優(yōu)點(diǎn)。
8.關(guān)于模式定理
1)分析“選擇步”對(duì)群體遺傳的影響:令 m(s,t
6、)是群體中模式s在時(shí)間t (或第t代)的 實(shí)例數(shù)量,f(h)是個(gè)體h的適應(yīng)度,f(t)是時(shí)間t (或第t代)群體中所有個(gè)體的平均
適應(yīng)度,n為群體中個(gè)體的總數(shù)量, U:s,t)是時(shí)間t (或第t代)群體中模式s的實(shí)例
的平均適應(yīng)度。在“選擇步”中,每個(gè)個(gè)體被選中的概率為 Pr(h) (Pr(h)的計(jì)算見公式
(1)),如果共進(jìn)行了 n次獨(dú)立選擇,請(qǐng)給出在第(t+1)代(即下一代)的群體中,模式 s 的實(shí)例存在的期望數(shù)量 E[m(s,t+1)](要求給出分析過程)。
Pr(h)「^) (1)
i1f(hi)
2)分析“變異步”對(duì)群體遺傳的影響:令 m(s,t)是群體中模式s在時(shí)間t (或第t代)的 實(shí)例數(shù)量。設(shè)在模式 s中有R(s)個(gè)確定位,變異操作以概率 Pm選擇一位并改變這位上
的值。如果只考慮變異步對(duì)群體遺傳的影響,請(qǐng)給出在第 (t+1)代(即下一代)的群體
中,模式s的實(shí)例存在的期望數(shù)量 E[m(s,t+1)](要求給出分析過程)。