《社會網(wǎng)絡(luò)分析課件.ppt》由會員分享,可在線閱讀,更多相關(guān)《社會網(wǎng)絡(luò)分析課件.ppt(54頁珍藏版)》請在裝配圖網(wǎng)上搜索。
1、郭世月 社會網(wǎng)絡(luò)分析 UCINET的原理及應(yīng)用 參 考 資 料 社 會網(wǎng)絡(luò) 分析 導論 /劉軍 著 .北京:社 會 科 學 文 獻 出版 社, 2004 社 會網(wǎng) 分析 講義 /羅 家德著 .北京:社 會 科 學 文 獻 出版 社, 2005 整體 網(wǎng) 分析 講義 : UCINET軟 件使用指南 /劉軍 著 .上 海:格致出版社, 2009 國際 社 會網(wǎng)絡(luò) 分析 網(wǎng) ( INSNA): http:/www.insna.org 學習內(nèi) 容 2. 社 會網(wǎng)絡(luò) 分析相 關(guān)概 念及其 應(yīng) 用 3. UCINET簡 介 4. 案例分析 作者同被引可 視 化 研 究 1. 什 么 是社 會網(wǎng)絡(luò) 分析
2、1. 什么是社會網(wǎng)絡(luò)分析 人際關(guān)系網(wǎng) 因特網(wǎng) 生態(tài)網(wǎng) 神經(jīng)網(wǎng)絡(luò) 科學引文網(wǎng) 作者合作網(wǎng) 什么是社會網(wǎng)絡(luò)? 社會網(wǎng)絡(luò)是指 社會行動者 ( social actor)及其 間的 關(guān)系 的集合。也可以說,一個社會網(wǎng)絡(luò)是由多 個點(社會行動者)和各點之間的連線(行動者之 間的關(guān)系)組成的集合。用點和線來表達網(wǎng)絡(luò),這 個是社會網(wǎng)絡(luò)的形式化界定。 點 關(guān)系 個體、公司、 、城市、國家 貿(mào)易關(guān)系、朋友關(guān)系、 、距離關(guān)系 實質(zhì)研究對象 社會網(wǎng)絡(luò)的形式化表達 矩陣中的行與列都代表“社 會行動者”,即圖中的各點 。行與列對應(yīng)的要素代表的 就是各個行動者之間的“關(guān) 系”。 社群圖 用于表示一 個群體成員 之間的關(guān)系
3、, 由點和線連 成的 圖。 矩陣 完備圖、非完備圖 (成員之間的緊密度) 有向圖、無向圖 (關(guān)系方向) 二值圖、符號圖、賦值圖 (關(guān)系的緊密程度) 2 社會網(wǎng)絡(luò)分析相關(guān)的概念及應(yīng)用 與“中心性”有 關(guān)的概念 與“距離”有關(guān) 的 概念 社會網(wǎng)絡(luò)分析 相關(guān)概念 與“關(guān)聯(lián)性”有關(guān) 的概念 與“凝聚子群” 有 關(guān)的概念 2.1 與“關(guān)聯(lián)性”有關(guān)的概念 2.1.1 子圖 一個圖 G的子圖 Gs的定義是, Gs中的點集(記作 Ns )是 G的點集( N)的一個子集,并且 Gs中的線集 ( Ls )也是 G的線集( L)的一個子集, Gs中的所有 線也必須是在 G中的所有點之間的線。 2.1.2 關(guān)聯(lián)圖和成
4、分 對于一個圖來說,如果其中的任何兩點之間都存 在一個途徑( Path),則稱這兩點是相互可達的,稱 該圖時關(guān)聯(lián)圖( connected graph)。也就是說,關(guān) 聯(lián)圖中的任何兩點之間都是可達的。 如果一個圖不是關(guān)聯(lián)的,就稱之為“不關(guān)聯(lián)圖”。 一個“不關(guān)聯(lián)圖”,可以分為兩個或者多個子圖,我 們稱之為關(guān)聯(lián)子圖。一個圖中的各個關(guān)聯(lián)子圖都叫做 “成分”( components),它是最大的關(guān)聯(lián)子圖。 也就是說,“成分”內(nèi)部的任何點之間都存在途徑。 但是,成分內(nèi)部的一點與任何外在于該成分的點之間 都不存在任何途徑。 三個成分: C1=n1, n2, n3, n4, n5 C2=n7, n8, n9,
5、 n10 C3=n6 2.2 與“距離”有關(guān)的概念 2.2.1 點的度數(shù) 與某點相鄰的那些點稱為該點的“鄰點” ( neighborhood),一個點 ni的鄰點的個數(shù)稱為該 點的“度數(shù)”( nodaldegree),記作 d(ni),也叫關(guān) 聯(lián)度( degree of connection)。 一個點的度數(shù)就是對其“鄰點”多少的測量。實 際上,一個點的度數(shù)也是與該點相連的線的條數(shù)。如 果一個點的度數(shù)為 0,稱之為“孤立點”( isolate)。 在一個有向圖中,必須考察線的方向。因此,一 點的“度數(shù)”包括兩類,分別稱為“點入度”( in- degree)和“點出度”( out-degree)
6、。一個點的 點入度指的是直接指向該點的點的總數(shù);點出度指的 是該點所直接指向的點的總數(shù)。 點 5的度數(shù)為: 點 10的度數(shù)為: 點 8的點數(shù)為: 4 2 1 阿庫( n3)的點入度是: 點出度是: 3 2 2.2.2 測地線、距離和直徑 在給定的兩點之間可能存在長短不一的多條途徑。 兩點之間的長度最短的途徑叫做 測地線 。如果兩點之 間存在多條最短途徑,則這兩個點之間存在多條測地 線。 兩點之間的測地線的長度叫做測地線 距離 ,簡稱 為“距離”( distance)。也就是說,兩點之間的距 離指的是連接這兩點的最短途徑的長度。 一個圖一般有多條測地線,其長度也不一樣。我 們把圖中最長測地線的長
7、度叫做圖的 直徑 。如果一個 圖是關(guān)聯(lián)圖,那么其直徑可以測定。如果圖不是關(guān)聯(lián) 的,那么有的點對之間的距離就沒有界定,或者說距 離無窮大。在這種情況下,圖的直徑也是無定義的。 n1到 n4的測地線是: n1到 n5的距離是: 該圖的直徑是: l2l4 3 3( l2l4 l5、 l3l4 l5 ) 2.2.3 密度 密度指的是一個圖中各個點之間聯(lián)絡(luò)的緊密程度。 固定規(guī)模的點之間的連線越多,該圖的密度就越大。 密度的測量: 在無向圖中,密度用圖中實際擁有的連線數(shù) l與最 多可能存在的連線總數(shù)之比來表示,即 密度 2l/n(n-1) 在有向圖中,有向圖所能包含的最大連線數(shù)恰恰 等于它所包含的總對數(shù),
8、即 n(n-1), 密度 =l/n(n-1) (n表示圖的規(guī)模,即該圖一共有 n個點。 ) 2.3 與“中心性”有關(guān)的概念 “中心性”的研究意義 : “權(quán)力”在社會學中是一個非常重要的概 念。一個人之所以擁有權(quán)力,是因為他與他者 存在關(guān)系,可以影響他人。在一個群體中,我 們?nèi)绾稳ソ缍硞€人的權(quán)利大???社會網(wǎng)絡(luò)學 者就從“關(guān)系”的角度出發(fā),用“中心性”來 定量研究權(quán)力。人或者組織在社會網(wǎng)絡(luò)中具有 怎樣的權(quán)力,或者說居于怎樣的中心地位,這 一思想是社會網(wǎng)絡(luò)分析者最早探討的內(nèi)容之一。 2.3 與“中心性”有關(guān)的概念 2.3.1 點度中心性 ( 1)點度中心度 與該點有直接關(guān)系的點的數(shù)目(在無向圖中是
9、點 的度數(shù),在有向圖中是點入度和點出度),這就是點 度中心度( point centrality)。 點 度 中 心 度 絕對中心度 無向圖中,點的絕對中心度即為該點的度數(shù)。 有向圖中 內(nèi)中心度 點入度 外中心度 點出度 相對點度中心度 有向圖: CRD (x)=(x的點入度數(shù) +x的點出度 )/(2n-2) 無向圖: CRD (x)=(x的度數(shù) )/(n-1) (2)點度中心勢 中心度是來描述圖中任何一點在網(wǎng)絡(luò)中占據(jù)的核 心性,中心勢是來刻畫網(wǎng)絡(luò)圖的整體中心性。 對于一個網(wǎng)絡(luò)來說,它的中心勢指數(shù)由如下思想給 出:首先找到圖中的最大中心度數(shù)值;然后計算該值 與任何其他點的中心度的差,從而得到多
10、個“差值”; 再計算這些“差值”的總和;最后用這個總和除以各 個差值總和的最大可能值。用公式表示如下: 2.3.2 中間中心性 ( 1)點的中間中心度 中間中心度測量的是行動者對資源控制的程度。 如果一個點處于許多其他點對的測地線(最短的途徑) 上,我們就說該點具有較高的中間中心度。他起到溝 通各個他者的橋梁作用。 中間中心度的測量: 具體地說,假設(shè)點 j和 k之間存在的測地線數(shù)目用 gjk 來表示。第三個點 i能夠控制此兩點的交往的能力用 bjk (i)來表示,即 i處于點 j和 k之間的測地線上的概率。 點 j和 k之間存在的經(jīng)過點 i的測地線數(shù)目用 gjk (i)來表 示。那么, bjk
11、 (i)= gjk (i)/ gjk 。 計算點 i的中心度, 需要把其相應(yīng)于圖中所有的點 對的中間度加在一起 ,所以點 i的絕對中間中心度 = 1 4 5是一個連接 1和 5的測地線, 1和 5之間的測地線僅此 一條, 4的中間中心度為 1。 2 4 5是一個連接 2和 5的測地線, 2和 5之間的測地線僅此 一條, 4的中間中心度多了 1。 3 4 5是一個連接 3和 5的測地線, 3和 5之間的測地線僅此 一條, 4的中間中心度又多了 1。 1 4 3是一個連接 1和 3的測地線, 1和 3之間的測地線有 2 條( 1 4 3 和 1 2 3 ), 4的中間中心度賦予 1/2。 所以,行
12、動者 4的中間中心度為: 1+1+1+1/2=3.5,記作 CB(4)=3.5 ( 2)中間中心勢 網(wǎng)絡(luò)中中間中心性最高的節(jié)點的中間中心性與其 他節(jié)點的中間中心性的差距。該節(jié)點與別的節(jié)點的差 距越大,則網(wǎng)絡(luò)的中間中心勢越高,表示該網(wǎng)絡(luò)中的 節(jié)點可能分為多個小團體而且過于依賴某一個節(jié)點傳 遞關(guān)系,該節(jié)點在網(wǎng)絡(luò)中處于極其重要的地位。 2.3.3 接近中心性 ( 1)點的接近中心度 接近中心度又稱整體中心度,它是對圖中某點的 不受他人控制的測度。 接近中心度的測量方法: 接近 中 心 度 絕對接近中心度 相對接近中心度 ( dij為點 i和 j之間的測 地線距離) ( n為網(wǎng)絡(luò)的規(guī)模) “中心性”總
13、結(jié) 刻畫的是行動 者的局部中心 指數(shù),測量網(wǎng) 絡(luò)中行動者自 身的交易能力 ,沒有考慮到 能否控制他人 點度中心度 研究一個行動 者在多大程度 上居于其他兩 個行動者之間, 因而是一種 “控制能力” 指數(shù) 中間中心度 考慮的是行動 者在多大程度 上不受其他行 動者的控制 接近中心度 2.4 與“凝聚子群”有關(guān)的概念 大體上說,凝聚子群是滿足如下條件的行動者子集 合,即在此集合中的行動者之間具有相對較強的、 直接的、緊密的、經(jīng)常的或者積極的聯(lián)系。 研究意義:通過對社會網(wǎng)絡(luò)的凝聚子群的分析, 可揭示社會結(jié)構(gòu),量化結(jié)構(gòu)。 2.4 與“凝聚子群”有關(guān)的概念 2.4.1 派系 在一個圖中,“派系”指的是至
14、少包含三個點的 最大完備子圖。 派系的成員至少包含三個點; 派系是“完備”的,即其中任何兩點之間都是直 接相關(guān),都是鄰接的; 派系是“最大”的,其含義是,我們不能向其 中加入新的點,否則將改變“完備”這個性質(zhì)。 2.4.2 -派系 對于一個總圖來說,如果其中的一個子圖滿足如 下條件,就稱之為 -派系:在該子圖中,任何兩點之 間在總圖中的距離(即測地線距離)最大不超過。 一個 -派系實際上就是最大的完備子圖本身,也 就是上述的“派系”。而一個 -派系則是這樣的一個 派系,即其成員或者直接(距離為)相連,或者通 過一個共同鄰點(距離為)間接相連。 2.4.3 k-叢 一個 k-叢就是滿足下列條件的
15、一個凝聚子群,即 在這樣一個子群中,每個點都至少與除了 k個點之外的 其他點直接相連。也就是說,當這個凝聚子群的規(guī)模 為 n時,其中每個點至少都與該凝聚子群中 n-k個點有 直接聯(lián)系,即每個點的度數(shù)都至少為 n-k。 如果 k=1,根據(jù)定義, -叢中的每一個成員都與 其他 n-1個點相連,那么,一個 1-叢就等于 1-派,也 當然是一個派系,是一個最大的完全子圖。當 k=2的 時候,其中所有點都至少與 n-2個其他點相連,但是, 2-叢可以不是 2-派系。 左圖是 3-派系,因為所有點之間的距離都不大于 3。 然而,它卻不是一個 3-叢,因為與點 A、 C、 E、 F相連的 成員的數(shù)目都少于
16、6-3=3。 右圖即是 3-派系,也是 3-叢。 2.4.4 k-核 k-核指的是滿足下面條件的一個子圖,即子圖中 的點都至少與該子圖中的 k個其他點鄰接。 k-叢要求各個點都至少與除了 k個點之外的其他 點相連,而 k-核要求任何點與至少 k個點相連。 UCINET軟件簡介 簡史: UCINET(University of California at Irvine NETwork)是一種功能強大的社會網(wǎng)絡(luò)分析軟件,它 最初由加州大學爾灣分校社會網(wǎng)絡(luò)研究的權(quán)威學者 Linton Freeman編寫,后來主要由波士頓大學的 Steve Borgatti和威斯敏斯特大學的 Martin Evere
17、tt 維護更新。 處理數(shù)據(jù):全部數(shù)據(jù)都用 矩陣形式 來存儲、展示和描 述。可處理 32767個點的網(wǎng)絡(luò)數(shù)據(jù)。 UCINET主界面 Exit Spreadsheet 數(shù)據(jù)輸入形式之一:直接錄入矩陣( DataSpreadsheets ) Import text data from spreadsheet 數(shù)據(jù)輸入形式之二:將 Excel文件轉(zhuǎn)化為 Ucinet格式數(shù)據(jù)( DataImport via Spreadsheet ) Edit Text File 數(shù)據(jù)輸入形式之三:編輯文本文件創(chuàng)建 UCINET數(shù)據(jù)( FileText Editor, DataImport Text fileRaw/D
18、L ) Display Ucinet Dataset Netdraw 4 案例分析 作者同被引可視化研究 什么是同被引? 什么是作者同被引? 什么是可視化? 同被引也稱為共引( Co-citation),兩篇 或兩篇以上的文獻同時被別的文獻引用。文 獻 A與文獻 B同時作為了文獻 C的參考文獻。 兩位作者發(fā)表的文獻同時被其他文獻 引用。作者 A和作者 B發(fā)表的文章,同時 被文獻 c引用了。 用圖形的方式來表達內(nèi)容結(jié)構(gòu),直觀、清楚。 研究 目的 描述學科結(jié)構(gòu) 揭示作者各自或共同代表的主題領(lǐng)域 揭示文獻的影響力 探討學科范式 主要步驟 選擇研究領(lǐng)域。本案例選擇的研究領(lǐng)域是“認知心理 學”。 選擇資
19、料來源數(shù)據(jù)庫。本案例選擇的數(shù)據(jù)庫是中國引 文數(shù)據(jù)庫( http:/ 確定收集范圍,檢索出所需文獻。 確定分析對象。本案例選擇了被引頻次高于等于 10次的文獻的第一作者。 統(tǒng)計各作者所發(fā)表文獻的引證文獻,并兩兩比較,計 算出被引頻次。建立被引頻次矩陣。 如,作者 A發(fā)表文獻的引證文獻是 a1,a2,a3, , an (即這些文獻引用過作者 A發(fā)表的文章) 作者 B發(fā)表文獻的引證文獻是 b1,b2,b3, , bn。 比較這兩個文獻集合,相同元素的個數(shù),即為 A與 B 的被引頻次。 用 UCINET軟件將 EXCEL格式的被引頻次矩陣轉(zhuǎn)化為 UCINET格式。 用 UCINET軟件中的 NetDraw將被引頻次矩陣轉(zhuǎn) 化為可視化圖譜。 結(jié)果分析。 謝謝大家!