[GIS原理] 10
在知識(shí)傳播途中,向涉及到的相關(guān)著作權(quán)人謹(jǐn)致謝意!
南師國(guó)家精品課程《地理信息系統(tǒng)》——主講人:韋玉春老師
文章目錄
【描述性統(tǒng)計(jì)】有一個(gè)群體,用均值、方差、標(biāo)準(zhǔn)差、眾數(shù),這叫描述性統(tǒng)計(jì)
【推斷性統(tǒng)計(jì)】有一個(gè)大的區(qū)域,在這區(qū)域里采了幾個(gè)樣,對(duì)這幾個(gè)樣本用描述性統(tǒng)計(jì)。然后用這個(gè)數(shù)據(jù)推斷這個(gè)區(qū)域的數(shù)據(jù)。推斷性統(tǒng)計(jì)基于概率論
【怎么往外推斷呢?】數(shù)學(xué)分布(正態(tài)、二項(xiàng)分布),這個(gè)數(shù)服從什么分布,在某個(gè)概率下,這個(gè)分布是成立的–>進(jìn)行向外推斷
1 空間統(tǒng)計(jì)描述 1.1 描述性統(tǒng)計(jì)
【描述性統(tǒng)計(jì)】
對(duì)空間對(duì)象分布狀況的統(tǒng)計(jì)對(duì)具有空間坐標(biāo)的屬性的統(tǒng)計(jì)
【舉例】有多少
長(zhǎng)三角地區(qū)城市分布具有聚集性?江蘇省人均GDP是多少?
【基本統(tǒng)計(jì)量】
【正態(tài)分布】統(tǒng)計(jì)學(xué)中所有的東西,在大量的情況下,假設(shè)的都是正態(tài)分布
【規(guī)則!】如果你的數(shù)據(jù)不是正態(tài)分布,那么你的數(shù)據(jù)描述就要用另外一套指標(biāo)
【舉例】平均成績(jī)是80分,你默認(rèn)的假設(shè)是全班成績(jī)是服從正態(tài)分布的–>如果全部成績(jī)放在一起的分布不是正態(tài)的,那么這個(gè)平均成績(jī)就是有偏差的,不合適的
1.2 探索性數(shù)據(jù)分析
【探索性數(shù)據(jù)分析】首先是尋找數(shù)據(jù)的模式和特點(diǎn),再根據(jù)數(shù)據(jù)特點(diǎn)選擇合適的模型。揭示數(shù)據(jù)中存在的模式
是空間推斷性統(tǒng)計(jì),探究“怎么分布的?”的問題
【解釋】拿到數(shù)據(jù)后,要想清楚,你要做什么,你要怎么做,為什么而做?探索性數(shù)據(jù)分析:天天看數(shù)據(jù),找數(shù)據(jù)的規(guī)律,找想法,找個(gè)研究方向
【探索性數(shù)據(jù)分析的重要性】認(rèn)為,“在認(rèn)識(shí)到你看來多好的測(cè)量了它以前,重要的是理解你能做什么”
【動(dòng)手前的三個(gè)問題】
科學(xué)問題是怎么產(chǎn)生的:你拿到數(shù)據(jù)后要干嘛呢?解決的是什么問題?問題不一樣,統(tǒng)計(jì)方法不一樣。如何引導(dǎo)產(chǎn)生新的調(diào)查設(shè)計(jì)方案:你這個(gè)調(diào)查方案是怎么產(chǎn)生的,調(diào)查方案怎么選擇如何繼續(xù)進(jìn)行分析:做完之后,將來怎么做呢?
【步驟】數(shù)據(jù)->數(shù)據(jù)的數(shù)學(xué)分布->概率論->推斷
1.2.1 直方圖
【直方圖】
對(duì)樣本數(shù)據(jù)按一定的分級(jí)方案(等間隔分級(jí)、標(biāo)準(zhǔn)差等)進(jìn)行分級(jí),統(tǒng)計(jì)記錄落入各個(gè)級(jí)別中的個(gè)數(shù)或占總樣本數(shù)的百分比,然后用條帶圖或柱狀圖表現(xiàn)出來。直方圖可以直觀反映采樣數(shù)據(jù)分布特征、總體規(guī)律,可以用來檢驗(yàn)數(shù)據(jù)分布和尋找數(shù)據(jù)離群值
【特點(diǎn)】
適用于空間對(duì)象為點(diǎn)和面的屬性數(shù)據(jù)簡(jiǎn)單易用缺乏空間信息 1.2.2 Q-Q圖
【Q-Q圖】用來輔助判斷樣本數(shù)據(jù)是否服從正態(tài)分布
【做法】做數(shù)據(jù)的四分位數(shù)(四分之一劃分):25%、50%、75%,即是Q-Q圖
【解釋】數(shù)據(jù)上怎么分布的?Q是的首字母,表示四分位數(shù)圖
【拓展】假如數(shù)據(jù)不是正態(tài)分布的
平均數(shù):那么平均數(shù)去失去了作用中位數(shù):這時(shí)候,中位數(shù)就能更好的描述數(shù)據(jù)四分位數(shù):25%、50%(中位數(shù))、75%
2 空間自相關(guān)分析
【空間自相關(guān)】空間中相近的樣點(diǎn)具有某種相似性,相距較遠(yuǎn)的樣點(diǎn)往往不相似
【作用】解釋和尋找存在的空間聚集性或“焦點(diǎn)”
【舉例】把小偷的點(diǎn)標(biāo)在地圖上,用空間自相關(guān)來分析,找哪里是賊窩
【舉例】葉子的分布:沒有風(fēng)吹,距離越近,葉子是越厚的。風(fēng)一吹,越遠(yuǎn)葉子越薄
【變異】越近空間越相似–>反過來說:越近空間變異越少,越遠(yuǎn)空間的變異越大
2.1 類型 全局(全程)自相關(guān)局部自相關(guān):相關(guān)的范圍
2.2 自相關(guān)的解釋 正自相關(guān):屬性值的差異隨距離變小越相似負(fù)自相關(guān):反向相關(guān),屬性值的差異隨距離變小越不相似0:屬性值的差異與距離沒有關(guān)系 2.3 自相關(guān)性測(cè)度
自相關(guān)的定量判定,三個(gè)統(tǒng)計(jì)量
’參數(shù) 2.3.1 權(quán)重矩陣
【解決的問題】數(shù)據(jù)的關(guān)系,怎么引入到計(jì)算里呢?空間權(quán)重矩陣(w矩陣)
【空間權(quán)重矩陣】是空間自相關(guān)分析的基礎(chǔ)
空間數(shù)據(jù)中隱含的拓?fù)湫畔⑻峁┝丝臻g鄰近的基本度量,這通常可通過二元對(duì)稱的空間權(quán)重矩陣W來表達(dá)
【怎么做的?】約定:相鄰定義為1,不相鄰定義為0 --> 產(chǎn)生了一個(gè)0、1表
【注意】所有相關(guān)的度量都需要經(jīng)過檢驗(yàn),不以值的高低斷英雄,而在置信區(qū)間和顯著性(要做一個(gè)概率檢驗(yàn)、顯著性檢驗(yàn))
【自相關(guān)的取值范圍】[-1,1]
【例子】I=0.001,這個(gè)關(guān)系是強(qiáng)還是弱呢?不知道,必須做檢驗(yàn)。根據(jù)檢驗(yàn)之后才知道
【原因】I的大小和樣本數(shù)是有關(guān)系的
數(shù)據(jù)量少,只有兩個(gè)點(diǎn)的時(shí)候,I=0.1那相關(guān)性肯定是很弱的數(shù)據(jù)量有一個(gè)億,I=0.1那相關(guān)性就已經(jīng)是很強(qiáng)的了 2.3.2 ’sI
【’sI】包括全程和局部?jī)蓚€(gè)參數(shù),用來分析空間的相關(guān)性
【解釋】w=1即是任意一個(gè)數(shù)對(duì)于均值的偏差,和方差的公式很像,只是加了一個(gè)w(距離比較近才計(jì)算,比較遠(yuǎn)w=0就不計(jì)算了)
【意義】I值越大,表明正的空間相關(guān)性越強(qiáng)
正相關(guān):如果是正的而且顯著,表明具有正的空間相關(guān)性。 即在一定范圍內(nèi)各位置的值是相關(guān)的負(fù)相關(guān):如果是負(fù)值而且顯著的,則具有負(fù)的空間相關(guān)性,數(shù)據(jù)之間反相關(guān)隨機(jī):接近于0則表明數(shù)據(jù)的空間分布是隨機(jī)的,沒有空間相關(guān)性 2.3.3 參數(shù)
【應(yīng)用場(chǎng)景】進(jìn)行局部自相關(guān)分析
【意義】C值大于0,表明正的值四周為高值環(huán)繞,小于0,則為低值環(huán)繞,0則為無聚集特征。
2.3.4 G統(tǒng)計(jì)量
【應(yīng)用場(chǎng)景】局部自相關(guān)分析
【意義】較高的G值表明位置周圍是較高的數(shù)據(jù),即數(shù)據(jù)具有聚集性
【結(jié)論】模擬表明 (Ord 和 1994),在xi 周圍不存在空間聚集的原假設(shè)的條件下,G的分布接近與正態(tài)。對(duì)于不同的觀察值N,在不同的顯著性概率下G值各不相同。
【例如】在90%的概率下,N=40對(duì)應(yīng)的G值為2.7913
2.4 應(yīng)用問題
什么情況下要用空間自相關(guān),用空間自相關(guān)用來研究什么問題
【問題】常識(shí)是否需要證明?
你已經(jīng)知道你的研究對(duì)象就是聚集的,你還用空間自相關(guān)去做,這就沒有必要了
【例子】
螞蟻在空間上是不是空間自相關(guān)的?所以不能用空間自相關(guān)來研究螞蟻,螞蟻就是一窩一窩的研究蝗蟲在空間上是不是空間自相關(guān)?可以的,原先沒有這個(gè)概念