本體概念_論敘詞表的概念屬性對(duì)本體理論的滲透與轉(zhuǎn)換
發(fā)布時(shí)間:2020-03-07 來(lái)源: 人生感悟 點(diǎn)擊:
摘要 論述敘詞表的計(jì)算機(jī)化管理為轉(zhuǎn)換領(lǐng)域本體創(chuàng)造條件,進(jìn)行敘詞表的概念屬性轉(zhuǎn)換本體的理論分析。通過本體轉(zhuǎn)換原理、方法及建模過程的討論,進(jìn)一步指出敘詞表本體轉(zhuǎn)換的可行性和必要性。并借用農(nóng)業(yè)科學(xué)敘詞表轉(zhuǎn)換為農(nóng)業(yè)本體的實(shí)例來(lái)說明OWL語(yǔ)言的實(shí)用性及本體理論在信息資源組織過程中的影響與作用。
關(guān)鍵詞 敘詞表 本體 OWL
分類號(hào) G254.24
本體理論注重在知識(shí)組織結(jié)構(gòu)的層面上描述具有語(yǔ)義關(guān)系的概念意義,其形成的本體技術(shù)(ontology)已經(jīng)被應(yīng)用于數(shù)字圖書館及相關(guān)領(lǐng)域,信息檢索的規(guī)范化、智能化以及Web語(yǔ)義的分析和確定均可以通過Ontology來(lái)實(shí)施。敘詞語(yǔ)言作為一種具有語(yǔ)義關(guān)系的語(yǔ)言系統(tǒng),其詞匯表達(dá)的某一領(lǐng)域的屬性概念和On-tology有著相同的表現(xiàn)功能,通過敘詞語(yǔ)言來(lái)建構(gòu)本體理論中面向?qū)W科領(lǐng)域的概念化描述機(jī)制以及知識(shí)組織多元化體系具有顯著的優(yōu)越性。近幾年來(lái),國(guó)際科研機(jī)構(gòu)和各國(guó)技術(shù)力量進(jìn)行了廣泛的研究,并取得了豐碩的成果,如聯(lián)合國(guó)糧農(nóng)組織利用RDFS(RDF Sche-ma)將Agrovoc敘詞表轉(zhuǎn)換為農(nóng)業(yè)本體;美國(guó)Syracuse大學(xué)的J.Qin和S.Paling建立了把GEM(教育資料網(wǎng)關(guān))中的受控詞表轉(zhuǎn)換為ontology的原理和原則框架。以敘詞語(yǔ)言為基礎(chǔ)建立的ontoloyg是有效可行的ontology enginneering的開發(fā)思路,敘詞表所具有的概念集合和語(yǔ)義關(guān)聯(lián)為本體技術(shù)的開發(fā)提供了豐富的資源。敘詞表必須通過技術(shù)規(guī)范和方法指導(dǎo)逐漸向on-tology遷移,以達(dá)到ontoloyg中要求精確的類與類、類與實(shí)體之間的邏輯關(guān)系。
1 敘詞語(yǔ)言建構(gòu)本體理論的原則和方法分析
敘詞語(yǔ)言的概念語(yǔ)義關(guān)系主要用“用”、“代”、“分”、“屬”、“參”等表示,但是在使用過程中發(fā)現(xiàn)這些語(yǔ)義關(guān)系的邏輯劃分界限并不十分嚴(yán)謹(jǐn),如表示等級(jí)關(guān)系就包括多種:地殼運(yùn)動(dòng)和地殼平行運(yùn)動(dòng)(包含關(guān)系)、寫字樓和寫字間(整體和部分關(guān)系)、機(jī)械理論和電機(jī)原理(類和實(shí)例關(guān)系),這樣,在邏輯關(guān)系的區(qū)別上存在著明顯的混淆。本體技術(shù)的應(yīng)用要求語(yǔ)義關(guān)系建立在嚴(yán)格的邏輯之上,對(duì)于敘詞語(yǔ)言的本體轉(zhuǎn)換需要根據(jù)敘詞的不同情況采取不同的方法:①統(tǒng)一規(guī)則關(guān)系,如聯(lián)合國(guó)糧農(nóng)組織在轉(zhuǎn)換Agrovoc敘詞表時(shí),將BT/NT關(guān)系統(tǒng)一為類與實(shí)例關(guān)系;②概念分解,如Per-ishable Product可以表示為帶有Perishable屬性的Prod-uct,Mother可以表示為帶有Female屬性的Parent。為了促進(jìn)網(wǎng)絡(luò)本體技術(shù)的發(fā)展,使得敘詞語(yǔ)言更完備地轉(zhuǎn)換為本體,國(guó)際信息與文獻(xiàn)標(biāo)準(zhǔn)化委員會(huì)重新修訂了敘詞結(jié)構(gòu)與使用技術(shù)標(biāo)準(zhǔn)(ISO5946),其中明確規(guī)定了轉(zhuǎn)換方法:①用XML Schema構(gòu)建敘詞標(biāo)記語(yǔ)言,建立敘詞語(yǔ)言描述本體的基本框架;②用RDF Schema表示敘詞內(nèi)容,可以將敘詞表中某一個(gè)概念范疇作為本體的某一領(lǐng)域的域值直接引入;③用DAML+OIL、OWL表示敘詞關(guān)系,將本體理論描述引進(jìn)深入。其中,OWL作為語(yǔ)義萬(wàn)維網(wǎng)的核心技術(shù),意在提供一種語(yǔ)言,用于描述Web文檔和應(yīng)用中固有的類和類之間的關(guān)系。它通過定義類和類的屬性來(lái)形式化一個(gè)領(lǐng)域,聲明和定義對(duì)象與對(duì)象的屬性以及在OWL形式化語(yǔ)義允許程度上對(duì)類和對(duì)象進(jìn)行推理。
OWL提供三種表達(dá)能力漸強(qiáng)的子語(yǔ)言,分別是OWLLite、OWL DL、OWL Full。OWL Lite支持的是那些需要一個(gè)分類體系和簡(jiǎn)單約束功能的用戶。例如當(dāng)OWL Lite支持集約束時(shí),它只允許集的值為0或1。OWL DL支持的是想獲得最大表達(dá)能力、具有完全計(jì)算能力及確定性的用戶。OWL DL包括所有OWL語(yǔ)言的約束,如:類型區(qū)分(一個(gè)類不能同時(shí)是一個(gè)對(duì)象或者屬性,一個(gè)屬性不能同時(shí)是一個(gè)對(duì)象或者類)。OWL DL設(shè)計(jì)目的是支持現(xiàn)有的描述邏輯和為推理系統(tǒng)提供預(yù)期的計(jì)算屬性。OWL Full支持的是想獲得最大的表達(dá)能力但不確定是否需要計(jì)算性的用戶。在OWL Full中,一個(gè)類能同時(shí)作為對(duì)象的集合,它本身也可以作為一個(gè)對(duì)象。OWL Full允許一個(gè)本體增加一個(gè)前控詞表的意義。
以上三種子語(yǔ)言,哪一種更適合應(yīng)用本體的使用?具體來(lái)看,選擇OWL Lite還是OWL DL,要根據(jù)用戶對(duì)OWL所提供的需求程度來(lái)判斷,OWL Lite的推理器具有令人滿意的計(jì)算屬性,而OWL DL推理器在遇到其他具有確定性的子語(yǔ)言時(shí),將按最壞情況處理,服從復(fù)雜性更高的子語(yǔ)言;選擇OWLDL還是OWL Full,主要根據(jù)用戶對(duì)建模工具的需求程度來(lái)判斷,兩者相比,OWL Full對(duì)推理的支持比預(yù)期的相對(duì)較弱。
2 敘詞語(yǔ)言建構(gòu)本體的模型理論分析
2,1建模步驟
本體建模理論主要以方法來(lái)表示,本體的建模方法有很多,其中Mariano Fernandez&GOMEZ-PEREZ等的METHONTOLOGY方法最為著名。METHONTOLO-GY是一種本體建模的結(jié)構(gòu)性方法,其步驟為:
2,1,1制定說明單的使用內(nèi)容說明單的制定要詳細(xì)、完備、一致,內(nèi)容包括本體建模的目的、場(chǎng)景、用戶確定、實(shí)現(xiàn)本體的結(jié)構(gòu)化程度、范圍及本體要表達(dá)的術(shù)語(yǔ)集、特性和力度。
2,1,2獲取信息的來(lái)源和方法信息來(lái)源途徑很多,可以是各行業(yè)專家的思想、文獻(xiàn)、數(shù)字、新聞等。獲得信息的方法有邏輯思維法、訪談法、本文知識(shí)的分析與總結(jié)、知識(shí)檢索工具的使用。
2,1,3概念化過程將領(lǐng)域知識(shí)組織成概念模型,用說明單中識(shí)別的領(lǐng)域詞匯表來(lái)描述問題和制定解決方案。生成的概念模型允許最終用戶確定一個(gè)本體是否有用,并且對(duì)于某個(gè)給定的應(yīng)用不需要查看源代碼就可判斷是否可用;比較多個(gè)本體的范圍、完整性、可重用性和共享性。
2,1,4實(shí)現(xiàn)過程
用任何一種形式化的語(yǔ)言編碼實(shí)現(xiàn)本體。需要一種開發(fā)環(huán)境的軟件支持,包括:詞法與語(yǔ)法分析器、翻譯器、編輯器、瀏覽器、搜索器、評(píng)價(jià)器、自動(dòng)維護(hù)工具。
2,1,5評(píng)價(jià)過程
對(duì)本體構(gòu)建的每一個(gè)環(huán)節(jié)中本體本身、軟件環(huán)境、文檔狀況進(jìn)行評(píng)判,包括正確性、穩(wěn)定性和有效性。
2,1,6文檔構(gòu)成形成本體構(gòu)建過程中的各個(gè)環(huán)節(jié)進(jìn)行文檔存貯。
2,2建立詞間關(guān)系自動(dòng)轉(zhuǎn)換系統(tǒng)
由于敘詞表所表達(dá)的詞間關(guān)系過于寬泛,必須對(duì)其進(jìn)行預(yù)處理和精煉。通過預(yù)處理和精煉,可以將敘詞轉(zhuǎn)換為本體中的概念,將詞間關(guān)系精煉為明確的概念間關(guān)系。
2,2,1要確定詞間關(guān)系轉(zhuǎn)換規(guī)則
例如,在Agrovoc敘詞表中,sheep RT mutton被定義為sheep(usedTo-Make>mutton,則可以規(guī)定If class x is sheep#1 andclass Y is mutton#1,and X RT Y then X Y。這樣,敘詞關(guān)系sheep RT mutton自動(dòng)轉(zhuǎn)換為概念關(guān)系sheepmutton。
2,2,2改正有問題的詞間關(guān)系并轉(zhuǎn)換為正確的概念關(guān)系主要算法是:
2,2,3檢查詞間關(guān)系轉(zhuǎn)換的結(jié)果,對(duì)不合理的詞間關(guān)系進(jìn)行修改可以通過三種方式進(jìn)行檢查:
?概念檢查:查詢概念,返回概念間的關(guān)系,檢查是否正確,如檢索“sheep”。
?概念間關(guān)系查詢:如。
?規(guī)則查詢,如Ⅱx and Y are marked as“T*”inthe concept type field,and X BT Y,then XY。
2,3本體的OWL輸出表示
我們可以把METHONTOLOGY方法看成是對(duì)敘詞表的精煉過程,通過建模實(shí)現(xiàn)了敘詞表詞匯上的豐富和語(yǔ)義關(guān)系上的邏輯表達(dá)。在此方法下,通過軟件工具Prot6g62000,利用OWL語(yǔ)言來(lái)整體建模,模型文檔片段如下所示:
對(duì)于建模的評(píng)價(jià)應(yīng)該是查看建模文檔的合理程度及運(yùn)行穩(wěn)定狀態(tài),從中體現(xiàn)出本體概念、屬性及語(yǔ)義關(guān)系的明確性和準(zhǔn)確性,將結(jié)果返回到建模步驟2.1.4中,進(jìn)行修改,經(jīng)反復(fù)修改后最終確定該領(lǐng)域的本體模型框架和內(nèi)容。在建構(gòu)本體的過程中,利用敘詞表進(jìn)行本體建構(gòu)具有客觀的優(yōu)勢(shì),敘詞表本身被稱為輕量級(jí)本體,其所包含的概念層次清晰、邏輯性強(qiáng),對(duì)各個(gè)學(xué)科專業(yè)詞匯收錄得比較完備,在敘詞表的基礎(chǔ)上構(gòu)建本體可以起到事半功倍的效果。尤其對(duì)于一些專業(yè)敘詞表,其構(gòu)建本體的效果更好。
3 農(nóng)業(yè)科學(xué)敘詞表向農(nóng)業(yè)本體轉(zhuǎn)換實(shí)例分析
3,1農(nóng)業(yè)科學(xué)敘詞表的OWL描述
對(duì)于W3C推薦的本體描述語(yǔ)言O(shè)WL有著更為強(qiáng)大的表達(dá)能力,是在Web上發(fā)布和共享本體語(yǔ)義標(biāo)記語(yǔ)言,OWL有三種子語(yǔ)言:OWL Lite、OWL DL和OWLFull。農(nóng)業(yè)科學(xué)敘詞表轉(zhuǎn)換為本體將以O(shè)WL語(yǔ)言格式進(jìn)行保存。我們通過農(nóng)業(yè)科學(xué)敘詞表中的一個(gè)例子來(lái)說明向本體轉(zhuǎn)換的情況,下面為“劍橋?qū)W派”的部分?jǐn)⒃~及詞間關(guān)系:
以上為較為簡(jiǎn)單的OWL表達(dá)的敘詞表中敘詞間的語(yǔ)義關(guān)系,若要更為精確地表達(dá),還要建立更多屬性來(lái)描述細(xì)分后的語(yǔ)義關(guān)系,這里就不再說明了。
3,2農(nóng)業(yè)科學(xué)敘詞表轉(zhuǎn)換本體系統(tǒng)的設(shè)計(jì)與實(shí)施
農(nóng)業(yè)科學(xué)敘詞表本身是一個(gè)敘詞數(shù)量龐大、結(jié)構(gòu)復(fù)雜的語(yǔ)言體系。隨著計(jì)算機(jī)技術(shù)的發(fā)展,目前已經(jīng)研制出電子版的農(nóng)業(yè)科學(xué)敘詞表,我們就以Visual Stu-dio,net 2005應(yīng)用軟件為平臺(tái),構(gòu)建本體批量轉(zhuǎn)換系統(tǒng)。其系統(tǒng)轉(zhuǎn)換功能包括以下三個(gè)方面:
通過系統(tǒng)界面層CAT_To_OWL的顯示,轉(zhuǎn)換系統(tǒng)的操作主界面如圖1所示:
主界面中“核心轉(zhuǎn)化”模塊為主模塊,該模塊可以選擇需轉(zhuǎn)換的敘詞的一級(jí)類目,可選擇多個(gè),并能夠暫;蚪K止轉(zhuǎn)換操作,狀態(tài)區(qū)顯示轉(zhuǎn)換的進(jìn)度,如圖2所示:
核心轉(zhuǎn)換過程中,系統(tǒng)根據(jù)所選定的一級(jí)類目,查找出所有的敘詞,將所有敘詞進(jìn)行“類”的定義,并將和這些敘詞具有等同、等級(jí)和相關(guān)關(guān)系的敘詞查找出,最后根據(jù)不同的關(guān)系類型進(jìn)行OW1的轉(zhuǎn)換,如圖3所示:
以上是對(duì)農(nóng)業(yè)科學(xué)敘詞表轉(zhuǎn)換為本體的功能操作。另外,系統(tǒng)的參數(shù)配置及轉(zhuǎn)換結(jié)果的比較和評(píng)判也是重要的功能部分。通過農(nóng)業(yè)科學(xué)敘詞表的豐富素材及相關(guān)專家的預(yù)處理,才逐步形成了轉(zhuǎn)換后的相關(guān)“類”的語(yǔ)義關(guān)系,繼而形成了農(nóng)業(yè)領(lǐng)域本體完整的結(jié)構(gòu)與充實(shí)的內(nèi)容,為農(nóng)業(yè)信息資源的組織與管理奠定了堅(jiān)實(shí)的基礎(chǔ)。
相關(guān)熱詞搜索:詞表 本體 滲透 論敘詞表的概念屬性對(duì)本體理論的滲透與轉(zhuǎn)換 敘詞表轉(zhuǎn)換為本體的研究 從敘詞表到本體的轉(zhuǎn)化研究
熱點(diǎn)文章閱讀