空間信息分析技術(shù)
- 期刊名字:地理研究
- 文件大?。?12kb
- 論文作者:王勁峰,武繼磊,孫英君,李連發(fā),孟斌
- 作者單位:中國科學院地理科學與資源研究所
- 更新時間:2020-09-25
- 下載次數(shù):次
第24卷第3期地究Vol. 24, No. 32005年5月GEOGRAPHICAL RESEARCHMay, 2005空間信息分析技術(shù)王勁峰,武繼磊,孫英君,李連發(fā),孟斌(中國科學院地理科學與資源研究所,北京100101)摘要:在GIS技術(shù)日趨成熟和空間數(shù)據(jù)極大豐富的今天,通過分析空間數(shù)據(jù)探索空間過程機理正變得日益迫切。空間信息分析技術(shù)至少包括以下六個主要方面: (1)空間數(shù)據(jù)獲取和預(yù)處理; (2) 屬性數(shù)據(jù)空間化和空間尺度轉(zhuǎn)換; (3) 空間信息探索分析; (4) 地統(tǒng)計; (5) 格數(shù)據(jù)分析; (6) 復(fù)雜信息反演和預(yù)報。本文提出了解決具體應(yīng)用問題一般的空間數(shù)據(jù)分析計算、結(jié)果解釋和反饋程序。認為空間過程的一般共性和作為共同的研究對象,各種不同的方法技術(shù)最終可能導(dǎo)致空間數(shù)學(spatial mathematics)的產(chǎn)生,同時發(fā)展魯棒的空間分析軟件包對于普及空間數(shù)學是必要的。關(guān)鍵詞: GIS;空間信息;空間過程;空間分析;機理解釋文章編號: 1000-0585(2005)03-0464-091引言隨著對地觀測、社會經(jīng)濟調(diào)查、計算機網(wǎng)絡(luò)和格網(wǎng)信息處理能力的迅速提高,空間數(shù)據(jù)正在以指數(shù)方式急速增加。通用和專用的(時)空間數(shù)據(jù)結(jié)構(gòu)1、應(yīng)用于具體事物的管理信息系統(tǒng)、以及對這些海量空間數(shù)據(jù)進行深加工以獲得高附加值的信息產(chǎn)品的空間信息分析技術(shù)[2]成為空間信息三大領(lǐng)域。數(shù)據(jù)分析通常用統(tǒng)計學方法,當今流行軟件包SPSS、MATLAB 等大大地促進了數(shù)據(jù)分析深加工及其在各領(lǐng)域的應(yīng)用(徐建華,2002)。但是,空間數(shù)據(jù)通常具有非獨立性,這與經(jīng)典統(tǒng)計學基本假設(shè)相駁。因此,專門的空間信息分析理論和技術(shù)正在迅速發(fā)展[3~5],已在遙感、生態(tài)環(huán)境、地球科學、社會經(jīng)濟等領(lǐng)域得到諸多成功的應(yīng)用,展現(xiàn)出廣闊的應(yīng)用潛力。2研究動態(tài)統(tǒng)計分析是常規(guī)數(shù)據(jù)分析的主要手段。然而,傳統(tǒng)統(tǒng)計學在分析空間數(shù)據(jù)時存在致命的缺陷,這種缺陷是由空間數(shù)據(jù)的本質(zhì)特征和傳統(tǒng)的統(tǒng)計學方法的基本假設(shè)共同造成的。傳統(tǒng)的統(tǒng)計學方法是建立在樣本獨立與大樣本兩個基本假設(shè)之上的,對于空間數(shù)據(jù),這兩個基本假設(shè)前提通常都得不到滿足。空間上分布的對象與事件在空間上的相互依賴性是普遍存在的,這使大部分空間數(shù)據(jù)樣本間不獨立,即不滿足傳統(tǒng)統(tǒng)計分析的樣本獨立性前提,因而不適于進行經(jīng)典統(tǒng)計分析[°];另一方面,有些空間數(shù)據(jù)采樣困難,如某些氣象臺站分布在稀疏的山區(qū),導(dǎo)致樣本點太少而不能滿足傳統(tǒng)統(tǒng)計分析方法大樣本的前提;地學中國煤化工收稿日期: 2004-10-16; 修訂日期: 2005-01-28YHCNMHG基金項目:國家自然科學基金課題(4071111)、 863 項目(2002AA135230-1) 和973項目(2001CB5103) 支持。作者簡介:王勁峰(1965-), 上海市人,研究員,博士生導(dǎo)師。主要從事地球信息科學研究。Email: wangjf@igsnrr. ac. cn3期王勁峰等:空間信息分析技術(shù)465空間數(shù)據(jù)通常的不可重復(fù)性進--步造成了空間數(shù)據(jù)分析的特殊性。因此,專門的空間信息分析理論、方法和技術(shù)自20世紀60年代末開始得到認識并研究??臻g數(shù)據(jù)大體.上可分為空間離散或連續(xù)型數(shù)據(jù)(可互相轉(zhuǎn)化),以及多邊形數(shù)據(jù)兩大.類。自然科學多涉及前者,而社會經(jīng)濟科學多涉及后者。隨著人地一體化研究趨勢的發(fā)展,對兩類數(shù)據(jù)進行綜合分析的趨勢日益顯露。目前空間數(shù)據(jù)分析軟件包已有不少,主要來自兩大學科領(lǐng)域:地理學和地質(zhì)學。由于地理學和地質(zhì)學研究對象不同,所涉及的數(shù)據(jù)特點和分析方法不同,造成兩大流派在軟件功能、結(jié)構(gòu)、風格上的不同。在歐美,60年代經(jīng)歷了地理學計量革命,其主流是試圖將社會經(jīng)濟時空格局和過程數(shù)學公式化。在GIS趨于成熟和空間數(shù)據(jù)迅速膨脹的技術(shù)條件下,當時的學者成為現(xiàn)今地理信息科學的主要推動者,造成地理學者所研發(fā)的空間信息分析軟件包多帶有處理多邊形數(shù)據(jù)(社會經(jīng)濟統(tǒng)計單元,遙感像元數(shù)據(jù)亦屬此類)的特點。相反,源于地質(zhì)學的空間分析軟件包一般適用于分析離散和連續(xù)的數(shù)據(jù)。空間信息分析理論和技術(shù)較為復(fù)雜,對于一般科研人員而言掌握難度大,耗費精力多。為此,美英兩國都已建立了相應(yīng)的國家級研發(fā)計劃,更有甚者,全球銷量最大的GIS基礎(chǔ)軟件的研發(fā)者美國環(huán)境系統(tǒng)研究所在ARCGIS8.1及以上版本已集成了地統(tǒng)計學模塊刀,目前正在積極爭取集成美國國家基僉會資助完成的Lattice數(shù)據(jù)分析模塊,該功能可以被幾乎所有從事地理信息管理的用戶所使用,進行空間信息的分析和深加工。3技術(shù)體系空間信息分析包括數(shù)據(jù)獲取和預(yù)處理(模塊M1);當進行多源異構(gòu)數(shù)據(jù)綜合分析時,需要進行屬性數(shù)據(jù)空間化和尺度轉(zhuǎn)換處理(模塊M2);然后進行空間數(shù)據(jù)探索分析(模塊M3);之后根據(jù)屬性數(shù)據(jù)的空間存在格式(空間連續(xù)分布或離散分布、規(guī)則或不規(guī)則多邊形分布、多源復(fù)雜異構(gòu)信息),分別引導(dǎo)建立地統(tǒng)計模型(模塊M4)、格數(shù)據(jù)分析模型(模塊M5)、復(fù)雜信息分解和預(yù)報模型(模塊M6)、以及其他(見圖1)。M1至M3屬數(shù)據(jù)預(yù)處理范疇,M4至M6屬問題建模范疇,對建立的模型M4- M6 需要求解,機理解釋及預(yù)報。圖中各模塊可獨立或聯(lián)合運行,這取決于所研究的問題和對象(所需輸出),以及研究人員當前所處的分析階段(輸人)。 具體研究內(nèi)容如下:模塊1.空間數(shù)據(jù)獲取和預(yù)處理空間數(shù)據(jù)采集與盡可能完備化是所有工作重要的第一一步,主要利用采樣、插值、缺值方法。(1)空間信息抽樣估計在地學空間應(yīng)用領(lǐng)域, 如環(huán)境監(jiān)測、資源調(diào)查、社會統(tǒng)計等,空間信息抽樣估計問題大量存在(8.9]??臻g抽樣針對地學對象普遍存在的空間關(guān)聯(lián)性和先驗信息,從樣本選取方式、空間關(guān)聯(lián)性及精度衡量三方面對空間信息獲取提供符合統(tǒng)計假設(shè)的新的解決思路。全國耕地面積動態(tài)調(diào)查,原先窮盡總體的方法.中國煤化工既耗時又花費巨大,報告形成緩慢;而采用Sandwich空間采樣模MHCNMHG信息并輔以少量樣本,就可以同時形成全國2700多個縣的分縣報告,既節(jié)省大量時間和開支又能滿足精度要求。在此基礎(chǔ)之上建立空間抽樣優(yōu)化決策通用集成模型,解決地學分析及資源調(diào)查466地理研究24卷M1空間數(shù)據(jù)獲取和預(yù)處理:多源異構(gòu)數(shù)據(jù)空間覆蓋、采樣,插值.缺值處M3空間數(shù)據(jù)探索分析M2屬性數(shù)據(jù)空間(數(shù)據(jù)性質(zhì)認知→建模引導(dǎo))化和空間尺度轉(zhuǎn)換|為數(shù)據(jù)提出模型類型:建|M4地統(tǒng)計(空間離散、連續(xù))模|M5格分析模型( 多邊形、格網(wǎng))M6多源復(fù)雜信息自適應(yīng)模型其他:如空間數(shù)據(jù)挖掘等選擇參數(shù)估計方法選擇數(shù)值方法以完成參數(shù)估計細化或調(diào)整模型|求|解個診斷統(tǒng)計:殘差和敏感分析評價擬合度和預(yù)報能力擬合/預(yù)報是否可接受?是否|機解釋報合,分析、模擬、預(yù)報圖1空間數(shù)據(jù)分 析技術(shù)和計算程序Fig. 1 Spatial data analysis techniques and algorithm中空間抽樣問題。軟件實現(xiàn)上,基于Microsoft Windows 平臺,Visual 系列軟件組件對象方法系統(tǒng)集成11。(2)空間數(shù)據(jù)插值與缺值根據(jù)已 知空間樣本點(例如氣象臺站、野外調(diào)查)數(shù)據(jù)進行插值12.18]或推理[4J]來生成面狀數(shù)據(jù)或估計未測點數(shù)值是地學研究經(jīng)常遇到的問題。理解初始假設(shè)和使用的方法是空間插值過程的一一個關(guān)鍵,為不同空間過程選擇不同插值方法[15.16]。缺值問題與插值類似,有部分交叉,以Bayes先驗概率為其特征。插值有點、面之分,對于面插值,經(jīng)過預(yù)處理(如去除趨勢特征等)可以進行缺值分析;對于點插值,經(jīng)過預(yù)處理(如構(gòu)建泰森多邊形再去除趨勢特征等)也可以使用缺值方法。對于缺值的補整,如果具備某些時空特征,則完全可以使用插值中國煤化工模塊2.屬性數(shù)據(jù)空間化與空間轉(zhuǎn)換fYHCNMHG自然與人文要素結(jié)合研究的時代正在到來。美國宇航局(NASA)將地表人類活動模式加入全球變化模型中從本質(zhì)上提高了預(yù)報精度。又如,自然災(zāi)害的災(zāi)情空間預(yù)報需要自3期王勁峰等:空間信息分析技術(shù)467然要素和社會經(jīng)濟要素相互作用的計算,自然要素可以通過遙感獲取,社經(jīng)要素需要根據(jù)統(tǒng)計數(shù)據(jù)進行空間細化。地球生態(tài)環(huán)境以及社會經(jīng)濟數(shù)據(jù)通常是具有不同形狀和尺度的地理空間單元,需要建立屬性數(shù)據(jù)空間化及空間尺度轉(zhuǎn)換技術(shù),其核心是非空間信息或更大空間單元的屬性數(shù)據(jù)在(較小)空間上表達的理論和方法,或稱可變面元問題(Modifia-ble areal unit problem) (MAUP),包括三類技術(shù):GIS方法。實現(xiàn)地理空間單元間屬性數(shù)據(jù)的轉(zhuǎn)化,包括聚集、拆分和空間建模(Spa-tial modeling)。聚集主要解決從小區(qū)域(點)向大區(qū)域(面)轉(zhuǎn)化問題;拆分則考慮從大區(qū)域向小區(qū)域轉(zhuǎn)化問題。前者可利用空間采樣技術(shù)實現(xiàn)。尺度轉(zhuǎn)化理論及方法。不同的時間和空間尺度限制了信息被觀測、描述、分析和表達的詳細程度。尺度轉(zhuǎn)化存在“自上而下scaling down”和“自下而上scaling up”兩種基本方式。不同尺度水平上,尤其是Downscaling的轉(zhuǎn)化,存在其區(qū)域邊界規(guī)則與地理邊界規(guī)則的差異、數(shù)據(jù)轉(zhuǎn)化的控制和實施形式。小區(qū)域統(tǒng)計學理論及方法。所謂“小區(qū)域”,本質(zhì)上是指區(qū)域內(nèi)樣本點較少,因此在統(tǒng)計分析過程中,需要從相關(guān)區(qū)域“借力”來獲得詳細的信息,其核心是建立相關(guān)區(qū)域(數(shù)據(jù))的聯(lián)系模型,實現(xiàn)屬性數(shù)據(jù)空間表達。以上內(nèi)容著眼點有所不同,但都可歸結(jié)為屬性數(shù)據(jù)從大區(qū)域向小區(qū)域轉(zhuǎn)化,最終完成綜合的屬性數(shù)據(jù)空間化方法和軟件包設(shè)計與實現(xiàn),并對表達結(jié)果的精確性和不確定性做定量分析和解釋。模塊3.空間信息探索分析探索數(shù)據(jù)分析(Exploratory Data Analysis, EDA)目標是最大化分析者對數(shù)據(jù)集及其隱含結(jié)構(gòu)的洞察,揭示數(shù)據(jù)屬性,用以引導(dǎo)選擇合適的數(shù)據(jù)分析模型。EDA主要采用圖形技術(shù)進行以下分析: (1)最大化對數(shù)據(jù)集的洞察; (2) 揭示數(shù)據(jù)隱含的結(jié)構(gòu); (3)提取重要的變量; (4) 檢測異常點; (5) 檢驗隱含的假設(shè)條件; (6) 發(fā)展精簡的模型; (7)決定因素的最優(yōu)設(shè)置。空間數(shù)據(jù)探索分析(Exploratory Spatial Data Analysis, ESDA) 是EDA的擴展,用來對具有空間定位信息的屬性進行分析,包括:探索數(shù)據(jù)的空間模式[7],對假設(shè)數(shù)據(jù)模型、模型基礎(chǔ)和數(shù)據(jù)的地理性質(zhì)進行闡述,評價空間模型等。ESDA 技術(shù)同樣要求可視和健壯,強調(diào)把數(shù)字和圖形技術(shù)與地圖聯(lián)系。對“某些事件在地圖上的什么位置”[18,19]、“這部分地圖的屬性值在概括統(tǒng)計中處于什么位置”、“地圖的哪些區(qū)域滿足特定的屬性要求”等問題的回答是很重要的。本模塊具體內(nèi)容包括:探索工具。軟件實現(xiàn)當前已經(jīng)有ESDA技術(shù),并且實現(xiàn)表(Table)、 地圖(Map) 和圖形(Figure) 各窗口鏈接,支持同時打開四個窗口:數(shù)據(jù)表窗口(顯示 當前數(shù)據(jù)和在過程中創(chuàng)建的變量),地圖窗口,圖形窗口和文本輸出窗口(返回ESDA輸出)。區(qū)劃(regionalization)。 空間單元有時很小,比如一個村或鄉(xiāng)鎮(zhèn),如果以此進行自然災(zāi)害發(fā)生率或疾病發(fā)生率等小概率事件,統(tǒng)計對這種小的統(tǒng)計單元很敏感。由于空間信息分析要求各空間單元內(nèi)的信息變差具有相對--致性,因此,經(jīng)常需要對空間單元的大小進行調(diào)整,通過模型計算,實現(xiàn)統(tǒng)計單元的均質(zhì)性中國煤化工(eguality)和空間緊湊性(compactness)。YHCNMHG模塊4.地統(tǒng)計模塊點狀數(shù)據(jù)或空間連續(xù)分布數(shù)據(jù)(直接獲得或由點狀數(shù)據(jù)通過空間插值或趨勢面模擬獲468地理研究24卷得)是空間數(shù)據(jù)的一-種主要存在形式(例如氣象臺站、地質(zhì)物探、生態(tài)環(huán)境等數(shù)據(jù))[0。主要包括以下幾方面:變異函數(shù)(variogram)。 變異函數(shù)可以說是整個地統(tǒng)計學的基礎(chǔ),但以前人們只注重了點的變異函數(shù)。隨著尺度問題的提出,變異函數(shù)的正則化( regulization)問題提上了日程??死锔穹椒?Kriging)。 以往把Kriging法看成是地統(tǒng)計學的全部。通過它人們找到了一種最優(yōu)的、無偏的估值方法。長期以來,人們僅僅把它看作是一種插值方法。其實不僅僅如此,Kriging還可以給出每一點的不確定性、利用多種附屬信息填補采樣不足的缺陷等。模擬方法(Simulation)。 這是當今地統(tǒng)計領(lǐng)域中最為活躍的一種方法。由于Kriging方法具有平滑作用,即將極大值偏小估計、極小值偏大估計,使得整幅圖像趨于平緩。但有時人們需要的恰恰正是那種極值,例如在水污染中,就是要通過污染金屬所表現(xiàn)的極值來發(fā)現(xiàn)污染源。此外,Simulation通過多種實現(xiàn)(realization) 系統(tǒng)的表現(xiàn),研究問題的各種情況,具有較好的統(tǒng)計效用。模塊5.格數(shù)據(jù)分析模塊多邊形數(shù)據(jù)(杜 會經(jīng)濟統(tǒng)計數(shù)據(jù)格式),包括規(guī)則格網(wǎng)數(shù)據(jù)(遙感), 是空間數(shù)據(jù)的又-種主要存在形式。通過空間自相關(guān)和協(xié)相關(guān)模型,找出研究對象在空間布局上的聯(lián)系與差異,以及空間多元解釋變量。例如土地利用變化的環(huán)境和人文經(jīng)濟驅(qū)動因子識別,環(huán)境污染的空間動態(tài)建模,為預(yù)報和調(diào)控提供科學依據(jù)。空間局域統(tǒng)計分析技術(shù),則可找出空間熱點(hotspots)問題區(qū),應(yīng)用于疾病、犯罪等空間格局的熱點診斷和預(yù)報。空間回歸模型??臻g回歸分析技術(shù)可以用于探討估計值的空間關(guān)系,地學對象的空間依賴性和空間異質(zhì)性使一般回歸方法不適應(yīng)在空間上的分析??臻g回歸分析有三種特殊形式: (1)聯(lián)立自回歸模型(Simultaneous Autoregressive Model, SAR); (2)空間移動平均模型(Spatial Moving Average Model, SMA); (3)條件自回歸模型(Conditional Au-toregressive Model, CAR)。局域統(tǒng)計模型。局域統(tǒng)計分析模型對研究區(qū)域內(nèi)距某一目標單元一定距離的空間范圍內(nèi)所有點的值進行分析。計算指定距離內(nèi)的空間關(guān)聯(lián)度,從而監(jiān)測空間內(nèi)的熱點區(qū)域,并通過G;檢驗。模塊6.多源復(fù)雜時空信息的分解、融合、預(yù)報模塊環(huán)境、地學、社會、經(jīng)濟、交通、疾病、遙感監(jiān)測等時空信息大多是多源復(fù)雜因素綜合作用的結(jié)果。通過觀測信息反演地學過程機理是地球科學,特別是地球空間信息科學的基本任務(wù)之一,目前可用的數(shù)學方法有統(tǒng)計[21]、神經(jīng)網(wǎng)絡(luò)、小波分析、遺傳算法、元胞自動機22?等,也是目前數(shù)據(jù)挖掘的基本手段。但這些方法只能進行單一成因要素(團)提取和簡單過程預(yù)報,要實現(xiàn)基于時空信息復(fù)合過程的科學預(yù)報,不僅需要實現(xiàn)多源復(fù)雜因子的分解,更需要將多種分解模式重新組構(gòu)融合,形成一個新的整體模式。另外,氣象臺站、生態(tài)網(wǎng)絡(luò)、污染監(jiān)測、野外采樣、社會經(jīng)濟調(diào)查等等,均是空間分散的點狀數(shù)據(jù)。根據(jù)已知點的值推斷未知點的值,中國煤化工雙域狀況是地學.研究的經(jīng)常性任務(wù)。目前使用的是空間幾何插值、MHCNMHG印新近的考慮全局和局域關(guān)聯(lián)信息的空間統(tǒng)計方法。實際上,前人的研究已經(jīng)獲得了很多半結(jié)構(gòu)化的地學機理和規(guī)律,這些先驗信息與空間統(tǒng)計的結(jié)合有望從本質(zhì)上提高空間估計預(yù)報的精度。借3期王勁峰等:空間信息分析技術(shù)469助貝葉斯方法建立統(tǒng)計和機理結(jié)合的空間擴展模型是一種可能的新途徑。總而言之,空間信息分析是指對地球空間信息進行分析模擬和預(yù)測,以及根據(jù)空間信息進行時空運籌的技術(shù)、方法和理論。下表給出了從輸人輸出角度理解什么是空間信息分析模型及其舉例。表1空間信息分析模型的輸入和輸出Tab. 1 Input and output of spatial information analysis model輸出信息屬性舉例空間非空間空間采樣模型熱點探測、插值(Upscaling)輸人信息屬性屬性數(shù)據(jù)空間化經(jīng)典統(tǒng)計學(Downscaling)4若干創(chuàng)新和前沿(1)空間抽樣模型目前空間抽樣模型是針對空間連續(xù)分布對象(如坡面降水)提出的,對于如大區(qū)域耕地問題等空間離散分布地物調(diào)查,缺乏專門的離散空間抽樣模型,雖然可以借助面積成數(shù)進行換算;另外,對小樣本問題、流動地物(海洋)、多維地物(降雨、溫度、土壤含水量等多要素)聯(lián)合調(diào)查和動態(tài)空間(植被變化)采樣問題需要發(fā)展相應(yīng)的空間抽樣模型。(2)屬性數(shù)據(jù)空間化屬性數(shù)據(jù)空間化的系統(tǒng)研究在國際上剛剛開始,有影響的研究成果較少,主要限于GIS的空間分析、尺度變化研究領(lǐng)域。小區(qū)域統(tǒng)計學與GIS的結(jié)合最近開始得到廣泛的關(guān)注。(3)空間尺度轉(zhuǎn)換Statistical Downscaling基于不同尺度空間變量的統(tǒng)計關(guān)系來建立,在全球環(huán)流模型(GCM) 中有廣泛應(yīng)用。該方法假定變量之間的統(tǒng)計關(guān)系不隨尺度變化而改變。Dynamical Downscaling也集中在GCMs領(lǐng)域。因研究對象不同,需要分別設(shè)計模型,在社會經(jīng)濟數(shù)據(jù)方面研究則較少。(4)隨機模擬除Kriging法外,現(xiàn)在的地統(tǒng)計學還可以作為評估未知值不確定性的工具,這主要通過模擬來完成。即通過條件模擬產(chǎn)生多幅模擬圖象用以再現(xiàn)空間依賴的分布格局等統(tǒng)計特性。模擬圖像是地統(tǒng)計學領(lǐng)域中最具潛力的領(lǐng)域。(5)格數(shù)據(jù)模型遙 感和社會經(jīng)濟屬性信息均以規(guī)則和不規(guī)則多邊形為其載體。隨著計算技術(shù)迅速發(fā)展起來的格數(shù)據(jù)分析技術(shù)(Latticedataanalysis)23.24),在美國國家基金支持下,自1999年開始也設(shè)立了五年的研究計劃,由Sergio Rey和Luc Anselin 牽頭,其核心就是空間計量經(jīng)濟學模型分析軟件包的構(gòu)建,在該研究計劃中,設(shè)定了軟件包開發(fā)計劃,同ESRI公司合作,開發(fā)成熟的、具有友好用戶界面的商業(yè)化空間統(tǒng)計與空間分析軟件包。(6)復(fù)合信息模型我們經(jīng)常希望從得到的空聞信息后演地學過程的各種影響因子,例如遙感影像的像元值經(jīng)常是地表混合物體以及地H中國煤化工E綜合作用的結(jié).果;全球氣候變暖受自然和人文因子的雙重作用,享CNM!G訂科學的環(huán)境政策至關(guān)重要;生態(tài)環(huán)境的空間動態(tài)變化受溫度、降水、人類活動空間格局變化的多重影響,準確分解之將有助于對生態(tài)環(huán)境空間動態(tài)進行預(yù)報。470地理研究24卷功率譜和小波可以分解出不同尺度的結(jié)構(gòu)特征;多元回歸通常是全局性的;神經(jīng)網(wǎng)絡(luò)對于短記憶非線性較為有效;遺傳規(guī)劃可以對多個給定模式進行優(yōu)化組合。但是,空間數(shù)據(jù)經(jīng)常受多種因子影響,在缺少對其生成機理了解之前,不應(yīng)人為地套用某個單一模式,各種信息都可能隱含在其中,應(yīng)該建立多模式融合模型,讓數(shù)據(jù)自己說話。5應(yīng)用領(lǐng)域舉例(1)災(zāi)情損失快速準確評估 重大災(zāi)情快速評估涉及受災(zāi)地區(qū)自然和社會經(jīng)濟情況的綜合信息[25]。遙感等技術(shù)為獲得受災(zāi)地區(qū)的致災(zāi)因子信息提供了有效的途徑,但社會經(jīng)濟統(tǒng)計數(shù)據(jù)更新周期較長,不能滿足實時需要,并且是以行政單元為存在形式,與災(zāi)害的地域單元不--致。屬性數(shù)據(jù)空間化技術(shù)與抽樣技術(shù)結(jié)合有望彌補當前災(zāi)情評估中社會經(jīng)濟數(shù)據(jù)難以快速和準確獲得的缺陷,為災(zāi)情損失評估提供技術(shù)保障。(2)人類健康和疾病研究領(lǐng)域通過遙感和地理信息系統(tǒng)手段對截面數(shù)據(jù)如疾病分布、空間擴散[26]、時空演變[C27] 與自然和經(jīng)濟環(huán)境狀況的分布進行分析。公眾的健康問題很大程度與當?shù)氐沫h(huán)境因素有關(guān),對于某些關(guān)鍵的疾病以及醫(yī)療設(shè)施的分布研究也可通過空間數(shù)據(jù)的分析和處理進行。社會學家、經(jīng)濟學家、人類學家以及環(huán)境工作者也將公眾健康安全與有毒廢物、低收入人口乃至少數(shù)人種分布聯(lián)系起來。(3) 公共安全領(lǐng)域犯罪發(fā)生率的分析,開始應(yīng)用空間統(tǒng)計與分析手段,例如,根據(jù)美國的犯罪數(shù)據(jù)分析,盜竊、搶劫以及其他類別的暴力犯罪與當?shù)氐某鞘兄械褪杖搿⒏呤I(yè)率以及人群混雜的區(qū)域高度相關(guān)。利用空間統(tǒng)計和空間分析等手段,可以對犯罪率高發(fā)區(qū)集中控制以及進行社會經(jīng)濟調(diào)節(jié),維護公共安全。(4)其他統(tǒng)計分析在氣候變化、 環(huán)境退化、區(qū)域可持續(xù)發(fā)展、人類活動與環(huán)境及氣候變化的關(guān)系研究、社會經(jīng)濟空間格局動態(tài)變化[8、城市擴張、商業(yè)、遷移、旅游、交通和通訊網(wǎng)絡(luò)分析中廣泛的應(yīng)用,空間分析技術(shù)有望挖掘更多的信息和知識。由于空間信息分析技術(shù)的復(fù)雜性,實際運用基本限于商業(yè)軟件所提供的功能,因此適應(yīng)于各種實際問題的空間信息分析理論和軟件的研發(fā)是受歡迎的,例如SpaceStat,GesLib, CrimeStat,和由國家863計劃支持于2004年完成的國產(chǎn)空間分析軟件包原型Simple0. 1[29]。6結(jié)論和討論空間信息來源于地球科學、社會經(jīng)濟、生命科學、資源和能源、軍事等等廣泛領(lǐng)域,亦是認識和調(diào)控這些系統(tǒng)的基本根據(jù)。數(shù)據(jù)分析的理論是概率論、數(shù)理統(tǒng)計和數(shù)學,但是由于空間過程廣泛存在的相互關(guān)聯(lián)性以及空間信息在空間上特有的多種存在形式與已有經(jīng)典數(shù)學的假設(shè)條件常常產(chǎn)生矛盾,或者在理論上沒有被后者覆蓋,因此產(chǎn)生了專門用于空間信息分析的理論研究[30]。當今空間信息分析技術(shù)至少包括以下六個主要方面: (1)空間數(shù)據(jù)獲取和預(yù)處理; (2) 屬性數(shù)據(jù)空間化和空間尺度轉(zhuǎn)換; (3) 空間信息探索分析;(4)地統(tǒng)計; (5) 格數(shù)據(jù)分析; (6) 復(fù)雜信息反演和預(yù)報模塊應(yīng)用需求、計算技術(shù)進步、空間數(shù)據(jù)激增、學科交叉是空間信息分析技術(shù)中國煤化工空間信息分析技術(shù)的目的是建立研究對象的(統(tǒng)計)數(shù)學模型、且MHCNMHG數(shù)據(jù)挖掘或者機器學習技術(shù)首先產(chǎn)生于計算機科學和生物信息分析81],以概率統(tǒng)計為理論根據(jù),迅速被地球信息分析所借鑒,發(fā)展出來的生物信息科學和地球信息科學在數(shù)3期王勁峰等:空間信息分析技術(shù)471學方法上大體有70%的重合,雖然研究對象完全不同。數(shù)據(jù)挖掘技術(shù)的目的是通過信息發(fā)現(xiàn)研究對象的知識、規(guī)則、關(guān)聯(lián)和模式。當空間過程的機理比較清楚,并且可以據(jù)此建立數(shù)學模型時,例如大氣環(huán)流模式、海洋物理場、地球動力學等,統(tǒng)計類理論就降低到次要地位。但是由于真實世界的復(fù)雜性和或多或少的不確定性,需要確定性的數(shù)學模型和不確定性的統(tǒng)計模型的結(jié)合。確定性數(shù)學模型、空間信息分析技術(shù)和數(shù)據(jù)挖掘技術(shù)是分析空間過程的三種不同的手段。對于傳染病時空過程建模,既可以用確定性的微分方程,也可以用不確定的隨機過程,當后者取極限時將逼近前者,達到形式統(tǒng)一;空間信息分析技術(shù)用于識別傳染病傳播的影響因子,而數(shù)據(jù)挖掘技術(shù)被用于反演傳染病參數(shù)。三種方法靈活使用,互相補充,可以揭示空間過程的多方面特征。雖然出發(fā)點不同,但是研究對象都是空間過程,所以空間過程數(shù)學模型、空間信息分析技術(shù)和數(shù)據(jù)挖掘技術(shù)等發(fā)展最終融合形成統(tǒng)一的空間數(shù)學(spatial mathematics)是有可能的。Matlab, SAS, Spss等軟件包的開發(fā)大大推動了數(shù)學在各領(lǐng)域的廣泛應(yīng)用,空間信息分析技術(shù)的廣泛使用亦需要開發(fā)空間分析軟件包。參考文獻:[1] Buliung R, Kanaroglou P. On design and implementation of an object -relational spatial database for activity/ travelbehavior research. Journal of Geographical System, 2004, 6;237~262.[2] 王勁峰,李連發(fā),葛詠,等.地理信息空間分析的理論體系. 地理學報,2000, 55(1); 92~ 103[ 3 ] Fischer Manfred , Getis Arthur. Recent Developments in Spatial Analysis. Berlin; Springer, 1997.[4]Haining Robert. Spatial Data Analysis, Theory and Practice. Cambridge University Press, 2003.[5] Anselin Luc. Spatial Econometrics: Methods and Models. Dordrecht: Kuwer Academic, 1988[6] 柏延臣,李新,馮學智??臻g數(shù)據(jù)分析與空間模型.地理研究,1999, 18(2): 185~190.[7]ESRI, http://www. esri. com/ software/ arcgis/extensions/ geostatistical/ index html[8]梁進社, 張華.土地利用變化遙感監(jiān)測精度評價系統(tǒng)--以隨機抽樣 為基礎(chǔ)的方法.地理研究,2004,23(1):29~ 37.[9] 鄭袁明,陳同斌.“北京市土壤和蔬菜重金屬污染與風險評價”取得重要進展. 地理研究, 2004, 23(5): 455.[10] Wang J,Liu J,Zhuang D,et al. Spatial sampling design for monitoring cultivated land. International Journal of Re-mote Sensing, 2002,23(2): 263~284.[11]李連 發(fā),王勁峰,劉紀遠。國土澠感調(diào)查的空間抽樣優(yōu)化決策.中國科學D緝,2004 ,34(10) :975~982.[12] 鄭紅星,劉昌明,王中根,等。黃河典型流域分布式水文過程模擬,地理研究,2004 ,23(4) :447~454.[13]廖順寶, 李澤輝,積溫數(shù)據(jù)柵格化方法的實驗。地理研究,2004 ,23(5) :633~640.[14] 周斌,王繁.基于決策樹模型的土壤性質(zhì)空間推斷.土壤邇報, 2004, 35<4) :385~390.[15] 朱會義,劉述林,賈紹鳳.自然地理要素空間插值的幾個問題.地理研究,2004 ,23(4) :425 ~ 432.[16] 李新,程國棟,盧玲.空間內(nèi)插方法比較.地球科學進展,2000,15(3):260~265.[17] 邵全琴,戎愷,馬巍巍,等.西北太平洋柔魚中心漁場分布模式.地理研究,2004,23(1):1~9.[18] 楊林生,陳如桂,王五一,等。1840年以來我國鼠疫的時空分布規(guī)律。地理研究, 2000, 19(3): 43~248.[19] WHO. Disease Mapping and Risk Assessment for Public中國煤化工/1CP/EHRO 02 0301,1997.HCNM H G_[20] 朱華忠,羅天祥,Christopher Daly. 中國高分辨率溫度和降水模擬數(shù)據(jù)的驗讓●吧埋財咒,cU03,22(3) :349~359[21] 徐建華.現(xiàn)代地理學中的數(shù)學方法(第二版).北京:高等教育出版社,2002.[22]黎夏,葉嘉安 .知識發(fā)現(xiàn)及地理元胞自動機.中國科學D輯,2004,34(9) :865~872.472地研究24卷[23] Ying Longgeng. Understanding China's recent growth experience: a spatial econometric perspective. Ann. Reg.Sci, 2003, 37:613~628.[24] Chen Shupeng, Chenghu Zhou. New generation of grid mapping. In: Proceedings of the International Conferenceon Geoinformatics and Modelling Geographical Systems, Beiing, 2004. 15~ 23.[25] Wang J, Wise s, Haining R. An integrated regionalization of earthquake, flood and drought hazards in China.Transactions in GIS, 1997, 2 (1):25~44.[26] 顏維安,馮建良,杭德榮,等。用地理信息系統(tǒng)評價垃圾填埋場對環(huán)境污染及危害的研究,中國衛(wèi)生工程學,2004,3 (3):130~132.[27] Dankmar Bohning,Ekkehart Dietz,Peter Schlattmann. Space time mixture modelling of public health data,Sta-tistics in Medicine , 2000,19; 2333~2344.[28] 劉紀遠,張增祥,莊大方,等。20世紀90年代中國土地利用變化時空特征及其成因分析.地理研究,2003,22(1):1~12.[29] Simple 0. 1, htp://autoib. homebj. com/[30] Michael F Goodchild, Robert P Haining. GIS and spatial data analysis: converging perspectives ,Papers Reg. Sci,2004 ,83:363~385.[31] Pierre Baldi,Soren Brunak. Bioinformatics: The Machine Learning Approach, MIT, 2001.Techniques of spatial data analysisWANG Jin-feng, WU Ji-lei, SUN Ying-jun, LI Lian-fa, MENG Bin,(State Key Lab of Resources and Environment Information System, Institute of GeographicSciences and Natural Resources Research, CAS, Bejing 100101, China)Abstract:GIS is a geo- referenced data based system for manipulating digital spatial and the-matic data. Because of its unique properties of spatial data (spatial dependence and spatialheterogeneity), there is an urgent need to investigate the mechanisms of spatial processesthrough exploring spatial data. The techniques of spatial analysis can be categorized intosix groups: (1) generation of spatial data and its preliminary treatment; (2) spatializationof attribute data and scale transformation of spatial data; (3) visualization and explorationof spatial data; (4) geo-statistics; (5) analysis of lattice data; and (6) reversing informa-tion from complicated spatial data. To meet the real world solutions, a procedural diagramof spatial data analysis is suggested as below: (1) preliminary data treatment; (2) model-ing; (3) solution; and (4) interpretation. Various techniques are being employed to inves-tigate spatial processes, the identical study objective and some common characteristics ofthe study object may lead to the integration and convergence of the various approaches ,and further the introduction of a general science: spatial mathematics. A same importantissue is to develop robust spatial analysis computer packages for public uses.中國煤化工Key words:GIS; spatial data; spatial process; spat,MYHCNMHGofmechanism
-
C4烯烴制丙烯催化劑 2020-09-25
-
煤基聚乙醇酸技術(shù)進展 2020-09-25
-
生物質(zhì)能的應(yīng)用工程 2020-09-25
-
我國甲醇工業(yè)現(xiàn)狀 2020-09-25
-
石油化工設(shè)備腐蝕與防護參考書十本免費下載,絕版珍藏 2020-09-25
-
四噴嘴水煤漿氣化爐工業(yè)應(yīng)用情況簡介 2020-09-25
-
Lurgi和ICI低壓甲醇合成工藝比較 2020-09-25
-
甲醇制芳烴研究進展 2020-09-25
-
精甲醇及MTO級甲醇精餾工藝技術(shù)進展 2020-09-25









