我國高等教育質量省域分層的K—均值聚類研究
發(fā)布時間:2019-08-11 來源: 日記大全 點擊:
摘 要:近年來,國民對教育的重視程度越來越高,眾多學子通過高等教育改變了人生軌跡。正因如此,高等教育的公平性受到廣泛關注。教育資源的分配對教育質量的產生極大的影響,所以教育資源分配的公平是高等教育公平的核心。本文通過K-均值聚類算法,分析研究截止2016年我國高等教育質量省域差異的問題。聚類結果表明,我國目前教育資源分配在省域層面存在差異,體現(xiàn)在東西部差異與自治區(qū)差異中。但這種差異并不懸殊,可以被縮小。
關鍵詞:高等教育 教育資源分配 教育質量 K-均值聚類算法
一、簡介
。ㄒ唬┭芯勘尘
高等教育作為民族振興、社會進步的重要基石,在當下受到極高的重視。教育興則國家興,教育強則國家強,高等教育正在承擔著增強中華民族創(chuàng)新創(chuàng)造活力,實現(xiàn)中華民族偉大復興的歷史使命。作為萬千即將面臨高考、踏入高等教育大門的高三學子之一,我在憧憬與盼望的同時,也關心著高等教育的改變與發(fā)展。本篇論文的創(chuàng)作靈感便來源于此。
高等教育因其重要性而被媒體廣泛聚焦、被輿論重點關注、被人們時刻心系。但教育資源在各省分配不均衡的現(xiàn)象,長久以來便是社會熱議的重點話題。教育本身是公平的,但在教育質量相對突出的省市學習生活的學生接受了比教育質量相對低的省市的學生更好的教育,這樣教育資源分配不公的問題導致了之后升學、工作等一系列問題的不公。教育資源分配不均直接體現(xiàn)在教師水平、課程資源、科研經(jīng)費的分配不均。特別是那些“985工程”和“211工程”院校以及“雙一流”院校,這些院校的課程設置及其豐富、高水平的從業(yè)者云集,而地方高校存在師資力量短缺和課程匱乏的現(xiàn)象。高三學子普遍在報考大學時,將學校所在省市的教育質量作為重要的參考依據(jù),由此可見一斑。資源分配的不均衡會導致社會的貧富差距越來越大。人才向教育資源多且收入高的地方流動,導致本該需要教育資源的地方人才流失。這也會變向扭曲公民的價值觀,紛紛向教育質量高的省市移動。
為此,國家也已出臺了許多政策緩解這樣的現(xiàn)狀,比如在研究生入學考試時按地區(qū)將中國的省事劃分的A、B、C類地區(qū),依據(jù)考生的生源地以及目標學校的所在地劃分出不同的國家線,以保障那些教育質量欠發(fā)達地區(qū)的學生可以以相對較低的分數(shù)與其他考生競爭,而那些想考入教育質量欠發(fā)達地區(qū)的學生也會得到較低的國家線。又比如很多高等教育學府都積極響應國家政策,鼓勵大學生畢業(yè)后到偏遠地區(qū)支教工作,同時給予應得政策優(yōu)惠。通過這種方式,既可以有效促進偏遠地區(qū)教育質量平穩(wěn)提升,同時也向當代青年人宣傳正確的價值理念。
為進一步深入分析我國目前各省市高等教育水平,本論文通過定量方法討論我國2017年各省市(除香港特別行政區(qū)、澳門特別行政區(qū)、臺灣省)高等教育資源分配的分層現(xiàn)象,依據(jù)評價高等教育水平的各項指標數(shù),采用數(shù)據(jù)挖掘中常用的聚類分析方法,將教育資源分配相近的省市分在同一層中,分配有差異的省市分在不同簇中。同一簇中通過對比,分析出兩省市教育資源分配相近的原因,簇與簇之間通過對比,分析出那些教育資源相對豐富和相對匱乏的省市,以進一步分析,為解決這種不均衡現(xiàn)象提供定量的參考依據(jù)。
。ǘ┭芯糠椒
1.數(shù)據(jù)挖掘
第三次科技革命讓人類進入到了“信息時代”的新紀元,計算機的發(fā)明、出現(xiàn)和普及推動了一系列新型產業(yè)、新型科技的形成,也推動了社會的發(fā)展和人類文明的進步。進入新世紀以來,各行各業(yè)中生產出的數(shù)據(jù)量以每18個月翻一番的驚人速度增長。人們搜集數(shù)據(jù)、處理數(shù)據(jù)的能力也隨著數(shù)據(jù)量的增加不斷提高,而這種趨勢在近幾年變的更為明顯。數(shù)據(jù)也從單一產生于互聯(lián)網(wǎng)行業(yè)衍生到醫(yī)療衛(wèi)生、公共安全、交通物流、電信、金融保險、氣象地理等各行各業(yè)。如此爆炸式發(fā)展的數(shù)據(jù)激起了對數(shù)據(jù)處理的新的要求。雖然不斷擴大的數(shù)據(jù)量滿足了人類學習、生活、工作的需求,但也極大地增加了找到有用信息的難度。如何短時間內找到更為精準的信息,更好的服務于人類的生產生活,更好的推動社會文明的發(fā)展,已經(jīng)成為當代科研人員關注的重點問題;谶@種需求,數(shù)據(jù)挖掘這門技術應運而生。
數(shù)據(jù)挖掘是在大型數(shù)據(jù)存儲庫中,自動地發(fā)現(xiàn)有用信息的過程。如圖1.1所示,數(shù)據(jù)庫中知識發(fā)現(xiàn)(knowledge discovery in database,簡稱KDD,下同)是將未加工的數(shù)據(jù)轉換為有用信息的整個過程,而數(shù)據(jù)挖掘是KDD中不可缺少的一部分。本文研究將按照KDD的步驟進行,即輸入數(shù)據(jù)、數(shù)據(jù)預處理、數(shù)據(jù)挖掘(K-均值聚類)、數(shù)據(jù)后處理、信息分析。
2.聚類分析
聚類分析是數(shù)據(jù)挖掘技術中一項重要的分支。在人們對世界的觀察、分析和描述中,或者在某些概念某些維度上具有特定公共屬性的對象組起著巨大的作用。例如生物學中對所有生物體的系統(tǒng)分層學:界、門、目、科、屬、種,便是一種聚類!熬垲悺蓖覀兩钪谐R姷摹胺诸悺币辉~既有相似之處又存在不同,我們在很小的時候就能將圖片分類為水果、動物、建筑物等,但是在這個例子中,我們先已知了每一類別的特點。而在聚類分析中,我們要先找到每一個分組中的元素,再根據(jù)結果來歸納組內元素的共同特點,并不需要事先定義好類,甚至連類的數(shù)量也不需要定義。聚類分析僅根據(jù)在數(shù)據(jù)中發(fā)現(xiàn)的描述對象及其關系的信息,將數(shù)據(jù)對象分組,即將數(shù)據(jù)劃分成有意義或有用的簇。聚類分析的主要目的是,組(簇)內的對象相互之間是相似的、相關的,而組(簇)間的對象是相異的、不相關的。組(簇)內的相似性越高,組(簇)之間的相互差異越大,此聚類就越好。因此評價一個聚類是否合理的標準是每一簇內的質點是否具有相似的屬性、簇與簇之間是否有明顯的差異。而對于簇的定義則依不同的數(shù)據(jù)特性和期望的結果而產生變化。
3.K-均值聚類算法簡介
K-均值聚類算法是聚類方法中最典型的一種,其中k代表簇的個數(shù)。這種算法于1967年由James MacQueen提出,而后在各領域廣泛應用。它的中心思想是將各簇的質心移動至簇內所有點的平均位置,而后將各點按照其到新質心的距離重新分配入不同的簇。通過反復迭代,直到移動質心前后所有質點所在的簇均不發(fā)生變化為止。在整個算法過程中,質點間的距離,質點與質心的距離,質點與新質心的距離需要多次計算。這個距離衡量了質點相互間,質點與質心的偏差程度,這種距離在本文中的實際意義代表了被選取兩省的教育質量相似或者相異程度。仿照在中學課程中二維坐標系中對兩點A(x1,y1),B(x2,y2)歐幾里得距離的定義如下式(1.1):
熱點文章閱讀