www.日本精品,久久中文视频,中文字幕第一页在线播放,香蕉视频免费网站,老湿机一区午夜精品免费福利,91久久综合精品国产丝袜长腿,欧美日韩视频精品一区二区

國外關(guān)于測試效應的研究概述 心理學常見的166個效應

發(fā)布時間:2020-03-03 來源: 感恩親情 點擊:

  摘要 測試效應的研究表明,“學習”并非只發(fā)生在編碼階段,測試或提取練習除了可評估知識掌握程度之外,在某些情況下它比再次學習能更好地促進長時記憶保持。文章從如下方面概述了國外關(guān)于測試效應的研究:(1)在自由回憶、配對聯(lián)想學習、再認和模擬教育情境等不同性質(zhì)的實驗任務下測試對學習的積極作用;(2)測試可能導致的消極作用,介紹有關(guān)提取導致遺忘,測試的消極暗示效應,測試與錯誤記憶等方面的研究;(3)介紹信息額外呈現(xiàn)理論,過度學習理論,提取努力理論,必要難度理論,遷移適當加工理論等測試效應的有關(guān)理論及其發(fā)展沿革。最后,結(jié)合研究中的爭議及教學應用做了思考,并指出有待進一步研究的問題。
  關(guān)鍵詞 測試效應,消極效應,提取,長時記憶。
  分類號 B849;G442
  
  1 什么是測試效應
  
  1.1測試效應的概念
  測試效應(testing effect)指學習某一內(nèi)容時,進行測試比額外學習能更好地提高后來對它的記憶保持水平,即便在測試無反饋時也是如此。理解這一概念應先區(qū)分測試的間接作用和直接作用,測試的間接作用指測試可通過各種方式促進學習,如,課堂測試可促使學生在一堂課中不斷地學習,測試還可使學生從測試結(jié)果中得到反饋,學習過程中的自我測試可引導學生下一步應學什么等。而測試的直接作用指測試這一行為本身提高了學習和長時記憶,即測試效應。
  通過測試提高記憶保持水平并非新觀點,James(1890)在其《心理學原理》一書中就討論了測試的作用,“……”我們的記憶有一個奇怪的特性,即積極的重復比消極的重復能讓我們更好地記憶。我的意思是,當我們幾乎學會了某一內(nèi)容時,與其再看一遍這些內(nèi)容,不如停下來試著回憶一下。如果我們能通過后一種方式回憶出一些內(nèi)容,那么在下一次我們應該也能回憶出來;而如果是以前一種方式,我們很可能需要再學一次……”。這一現(xiàn)象雖然早已為認知心理學家所關(guān)注,但一直以來并未有系統(tǒng)的研究。人們往往認為測試只是衡量學生學習水平的一種評估工具,而只有通過學習或?qū)Σ牧系木幋a才是真正地“學習”。新近一些研究重新關(guān)注測試效應,這些研究使我們進一步認識到測試不僅可用于評估知識掌握水平,還能使個體所掌握的知識結(jié)構(gòu)發(fā)生變化,極大地提高知識的記憶保持程度。例如,有關(guān)測試效應的研究表明,學習某一內(nèi)容時,重學一遍可增強提取流暢性(retrieval fluency),它使個體對自己的記憶水平更自信,從而在學習時傾向于選擇重學,而實際上重學只促進了短期記憶水平,測試則導致了更好的長時記憶水平。因此,理解測試效應,掌握科學的自我測試策略,可使學生改變錯誤的或低效的學習觀念,在相同的甚或更少的時間(與重復學習相比)星取得更好的學習效果,實現(xiàn)高效率學習。
  
  1.2測試效應的基本研究范式
  研究測試效應的最常見的實驗設計是:學習材料→一次或多次初始測試(initial test)→衡量被試記憶保持程度的最終測試(final test)。實驗一般設立一個實驗組(進行測試)和一個或兩個控制組,考查實驗結(jié)果時將測試組的成績與控制組進行對比?刂平M一般有兩種:①學習材料→無初始測試→最終測試;②學習材料→再次學習→最終測試,該條件下控制組和測試組接觸材料的總的時間相同。
  通過修改基本范式,研究者可以探討各種條件下的測試效應,如學習的材料(無關(guān)詞對、聯(lián)想詞對、散文等),初始和最終測試的形式(自由回憶、再認、線索回憶等),是否對測試提供反饋以及反饋的形式,學習階段和第一次測試的時間間隔,最終測試之前的記憶保持間隔(retention interval)等。
  
  1.3 Tulving的經(jīng)典研究
  人們往往認為學習只發(fā)生在學習(編碼)階段,而測試的作用僅是顯示個體在之前的學習階段學到了什么。Tulving(1967)用實驗證明了學習不僅只發(fā)生在編碼階段,測試本身也是一種學習。TuNing讓被試在三種實驗條件下學習包含36個單詞的詞表。一是標準學習條件:學詞表(study),回憶(test),再學,再回憶,即STST:一是重復學習,被試學習三次測試一次,即SSST;一是重復測試,被試學習一次測試三次,即STTT。三種學習條件下的學習次數(shù)共為24次,因此標準學習條件下分別為12次學習,12次測試,重復學習條件下為18次學習,6次測試,重復測試條件下為6次學習,18次測試。如果“學習”(對某一內(nèi)容的最終掌握)僅在學習或編碼時發(fā)生,那么SSST組的掌握水平應比STST組來得更好,因為它多了6次學習,而STTT組由于學習的次數(shù)最少最終掌握水平理應最差。但Tulving的實驗發(fā)現(xiàn)三種學習條件下的被試在最終測試上的成績幾乎是相同的,STST組和SSST組都回憶了約20個單詞,STTT組回憶了約18.5個單詞。從某種意義上來說,一次測試可相當于一次學習。
  
  2 不同實驗條件下測試對學習的促進作用
  
  Tulving(1967)的經(jīng)典研究探討了測試對自由回憶的促進作用,之后的研究者陸續(xù)對配對聯(lián)想任務、再認等其他回憶形式的測試效應進行了研究。此外,研究者還以散文、GRE單詞等為實驗材料考察了真實教育情境中的測試效應。
  
  2.1自由回憶中的測試效應
  Tulving(1967)的研究引發(fā)了大量的相關(guān)研究,但大多數(shù)研究都仿照Tulving的設計或僅改變一些變量。這些研究在方法上有一個共同之處,即學習時間和測試時間是均等的,且在學習階段呈現(xiàn)單詞的速度和最終測試的時間都很短,實驗中的測試都采用自由回憶形式。如Tulving(1967)的研究中,學習階段36個單詞的呈現(xiàn)速度為1個/秒,在測試階段被試回憶這些單詞的時間也僅為36秒。在這種實驗條件下,是否有可能因為時間過短而使得被試即便學會了36個單詞也無法在規(guī)定時間內(nèi)將其回憶出來?Roediger和Thorpe(1978)對自由回憶與回憶時間的關(guān)系的研究表明,過短的測試時間將大大低估被試所習得的知識量,從而可能低估了測試效應,但研究者未在這一發(fā)現(xiàn)的基礎之上做進一步的探索。為更準確地考查被試的回憶量,Karpicke和Roediger(2007)模仿了Tulving的三種實驗條件,即STST,SSST,STTT,但為避免對被試回憶水平的低估,以3秒1個的速率呈現(xiàn)單詞,這樣測試和學習的時間都增加到2分鐘,每種實驗條件都進行5次循環(huán)(如標準測試條件下為STST,STST,STST,STST,STST)。為考查三種實驗條件對長時記憶的不同作用,研究者進一步探討了一周后三種學習條件下被試的記憶保持水平。結(jié)果表明,STTT組在開始階段(第一次和第二次循環(huán)的最后一次測試)處于劣勢,但很快地趕上SSST組,兩種條件在后面的測試中差異很小。STST組被試在最后4次測試上 的回憶水平都顯著地好于SSST和STTT。因此,總體而言該研究結(jié)果與Tulving(1967)的結(jié)果相符,三種實驗條件下的學習曲線很相似,但該研究還發(fā)現(xiàn)了STST的測試成績與STTT和SSST的差異,研究者認為這是由于在STST中,測試(T)之后伴隨學習(S),這相當于對回憶失敗內(nèi)容的反饋,在STST中這種反饋的機會多于其他兩種條件。此外,更重要的是,該研究考查了被試在1周后的記憶保持水平,發(fā)現(xiàn)SSST的回憶率顯著低于STST和STTT,后兩者無顯著差異,這證明了測試對于提高長時記憶保持的作用。
  為更具體地考察多次測試與多次學習的效應,研究者還考查了不同的重復測試與重復學習條件下的學習效果,以及測試次數(shù)對測試效應的影響。
  Thompson等(1978)的實驗發(fā)現(xiàn)適當?shù)摹皩W習一測試”方式將導致更好的學習效果。實驗設計了三種條件,一為SSSS,詞表呈現(xiàn)4次;一為STTT,學一次,進行三次自由回憶;一為STRTRTR(TR指再次學習回憶失敗的單詞后進行自由回憶),學一遍詞表后進行回憶,再學時僅學習那些回憶失敗的單詞,然后再回憶所有單詞,如此重復三次,該設計實際上模擬學生在學習過程中可能存在的學習方式,即學生往往是先學習某一內(nèi)容,接著通過自我測試看看自己是否掌握,然后再學習那些未掌握的內(nèi)容,如此反復,直到完全掌握。最終測試分別在5分鐘或2天后進行。結(jié)果發(fā)現(xiàn),5分鐘后的測試中,三種實驗條件下的回憶成績?yōu)镾TRTRTR>SSSS>STTT。但兩天后的回憶成績發(fā)生變化,STRTRTR>STTT>SSSS,SSSS組在前一次所能回憶出的單詞的基礎上遺忘率為56%,STRTRTR組被26%,而STTT組僅為13%。
  受Thompson等的研究的啟發(fā),Karpicke和Roediger(2007)在其研究的一個實驗中讓被試在四種學習條件下學習,分別為STST,SSTT,STSnT(Sn指只學回憶失敗的詞),STSnTn(Tn指只回憶之前無法回憶的詞),結(jié)果發(fā)現(xiàn),在一周后的測試中STSnTn組的回憶水平最差,因此是否進行回憶測試是決定長時記憶保持水平的重要因素。Wheeler等(2003)的研究對比了重復學習和重復測試在即時和延時測試中的不同影響。實驗擴展了學習和測試的次數(shù),被試在重復學習(SSSSS)和重復測試(STTTT)兩種條件下學習40個單詞,然后在5分鐘和1周后進行自由回憶測試。結(jié)果發(fā)現(xiàn),雖然在SSSSS條件下,每個學習階段被試都學習了所有的40個單詞,而在STTTT條件下,被試所接觸的僅是他們能回憶起的那些單詞,但SSSSS組被試僅在5分鐘后進行的回憶測試中好于STTTT組,而在一周后的測試中結(jié)果完全相反,這強有力地證明了測試效應顯著作用。Wheeler和Roediger(1992)的一項研究探討了多次測試的效果與單次測試效果的差異。實驗讓被試聽一個包含60個具體物體名稱的故事,每一物體在故事中第一次出現(xiàn)時都在顯示屏上以圖片形式呈現(xiàn),最終測試要求被試回憶圖片的名稱。呈現(xiàn)結(jié)束后,實驗組1進行一次7分鐘的回憶測試后離開,實驗組2進行了三次回憶測試后離開,控制組在呈現(xiàn)結(jié)束后離開實驗室,要求所有被試一周后回來繼續(xù)實驗。結(jié)果發(fā)現(xiàn),從遺忘率來看,實驗組2一周后遺忘率為13%,實驗組1為27%,控制組為46%,重復測試促成最低的遺忘率。
  
  2.2配對聯(lián)想學習中的測試效應
  配對聯(lián)想學習往往以不同聯(lián)想度的詞對或“非詞一詞”(如,“BLSM一筆畫”)為任務,在測試效應的有關(guān)研究中經(jīng)常使用,因為它使研究者可以很方便地控制學習和測試之間的時間間隔,而且也很容易控制反饋。下面介紹Alan(1969)和Jacoby(1978)以配對聯(lián)想學習為任務探討測試效應的兩個代表性研究,并著重介紹采用配對聯(lián)想學習任務進行的集中與分散測試對記憶水平影響的有關(guān)研究。
  2.2.1配對聯(lián)想測驗中的測試效應
  Allen等(1969)讓兩組被試分別學習配對聯(lián)想詞表5次或10次,然后分無測試,一次測試,五次測試三種測試情況,一天后進行最終測試(形式為horse-?),結(jié)果發(fā)現(xiàn)學習10次的效果僅稍好于5次,但進行一次測試后則使10次學習組的成績遠高于5次學習組;學習5次測試1次的被試在最終測試中的成績相當于學習10次無初始測試的被試,也即單次測試對長期記憶保持的效果相當于5次學習。
  Jacoby(1978)著名的殘詞補全實驗也證明了配對聯(lián)想學習中的測試效應,實驗采用了2(重學、測試)×2(即時、延時)的實驗設計。讓被試先學習聯(lián)想詞對(如,foot-shoe),再學時分兩種條件:一是重學完整詞對;一是給被試提供詞對左邊的單詞,要求將右邊的殘詞補全,如(foot-se)。這兩種條件又各分兩種情況,一是學習后立即進行(即時),一是插入20個詞對(延遲)。最終測試的形式“foot-????”。結(jié)果表明,殘詞補全測試比重學完整詞導致了更好的記憶保持水平,延時測試的效果要好于即時測試,Jacoby認為這是由于學習之后的即時測試減小了記憶提取過程中努力加工的程度,從而削弱了測試效應。Jaeoby的這一實驗往往被看作是研究生成效應(generation effect)的先驅(qū),生成效應指學習某一材料時,生成相關(guān)知識比閱讀材料將導致更好的回憶或再認水平),而生成效應從某種程度上來說是測試效應的一種。
  Jocoby的實驗中殘詞補全測試導致了極高水平的回憶率(大于90%),雖然Carrier和Pashler(1992),Kuo和Hirshrnan(1996)使用標準的線索一回憶測驗作為測試任務并未產(chǎn)生如此高水平的回憶成績,但總的來說都發(fā)現(xiàn)了測試對配對一聯(lián)想詞對的記憶保持的積極作用。Cull(2000),Pashler等(2005)的研究還發(fā)現(xiàn),對測試中未能回憶出的詞對給予反饋將增強測試效應。
  2.2.2配對聯(lián)想學習的集中與分散測試效應
  由于配對聯(lián)想學習任務易于控制學習與測試之間的時間間隔,便于研究者探討集中或分散測試對學習的不同影響,因此配對聯(lián)想學習任務成為研究集中或分散測試效應的主要任務形式。
  雖然早在19世紀初Ebbinghaus等就探討集中學習與分散學習的關(guān)系,但對提取是否也具有集中和分散效應的研究則以Landauer和Bjork(1978)的研究為標志。Landauer和Bjork(1978)通過兩個 實驗比較了配對一聯(lián)想學習中,擴展式測試與等間隔測試對學習的不同影響,實驗1采用“名-姓”詞對,實驗2采用“名字-人面”詞對。實驗中的擴展式測試的形式為1―5―9(數(shù)字代表學習某一詞對A-B后進行測試之前插入的學習或測試的次數(shù)),等間隔測試的形式即為5―5―5,二者的平均間隔數(shù)相等,實驗另外還設立了集中測試組,即學完之后連續(xù)測試,0-0-0;各條件下的測試都不提供反饋。結(jié)果表明,擴展式測試組在最終的延時測試上的回憶成績好于等間隔測試組,而等間隔測試組的成績好于集中測試組。雖然集中測試使被試在學習的開始階段幾乎不發(fā)生錯誤,但在最終測試上擴展式測試和等間隔式測試的成績比集中測試更好,擴展式測試組的成績略好于等間隔式測試。
  Landauer和Bjork的研究引發(fā)了一系列相關(guān)研究,大多數(shù)研究都發(fā)現(xiàn)兩種分散測試形式在延時測試中的成績都好于集中測試,但對于擴展式測試在促進長時記憶上是否優(yōu)于等間隔測試的問題則存在較大的爭議。Balom等(2006)比較了擴展性測試、等間隔測試和集中測試對三組被試(年輕成人、健康的年長成人、Alzheimer病的年長成人)的不同影響。被試學習材料(低關(guān)聯(lián)度詞對)后分三種實驗條件進行初始測試:集中測試(0-0-0),等間隔測試(3-3-3),擴展式測試(1-3-5),最后進行最終測試。結(jié)果發(fā)現(xiàn),在學習階段,三組被試在集中測試的情況下均表現(xiàn)了最好的水平,在擴展式測試情況下其次,而在等間隔測試情況下表現(xiàn)最差。但在最終測試中,三組被試在等間隔測試和擴展式測試情況下并無差異,但都好于集中測試情況下的成績。Carpenter和Delosh(2005)以“姓名-人面”配對為實驗材料的研究也發(fā)現(xiàn)了類似的現(xiàn)象,但研究發(fā)現(xiàn)在最終測試上等間隔測試組的成績略好于擴展性測試組。
  Karpieke和Roediger(2007)讓被試學習“詞匯一釋義”類型的詞對,然后分別在三種測試形式下學習:集中測試(0-0-0),等間隔測試(5-5-5),擴展式測試(1-5-9),最后分別在10分鐘或2天后對被試進行測試。結(jié)果發(fā)現(xiàn),在兩種最終測試條件下,分散測試的成績都優(yōu)于集中測試。在10分鐘后的測試中,擴展性測試組的成績略好于等間隔測試,但在48小時之后的測試中,等間隔測試組的回憶成績高于擴展式測試組。這一研究表明,等間隔測試可能比擴展式測試能更好地促進長時記憶,研究者認為初次提取嘗試的時間間隔是關(guān)鍵因素,即初次提取的間隔越長將導致提取的難度越大。這與Bjork(1992)的提取難度理論一致,該理論認為提取時一定的難度將導致更好的記憶保持。Pashler等(2003)以配對聯(lián)想詞為材料的研究也表明,雖然隨著學習之后進行首次測試的間隔時間的增大,被試在初次測試中的成績往往是呈下降趨勢的,但延長首次測試的時間間隔促進了長時記憶。
  
  2.3再認任務中的測試效應
  有關(guān)測試效應的研究大都使用自由回憶或配對聯(lián)想學習任務,而較少采用再認任務,這可能與采用再認任務探討測試效應時結(jié)論不盡一致有關(guān)。如,Roediger和McDermott(1995),Hicks和Stams(2004),以及Verde(2004)等的研究讓被試在學習之后進行回憶測試,而最終測試為再認測試,發(fā)現(xiàn)回憶測試提高了再認測試的成績。但Jones和Roediger(1995)的研究采用類似的實驗程序卻未發(fā)現(xiàn)測試效應。
  Chan和McDermott(2007)為澄清再認任務中的測試效應,借用了Sacoby(1991)的再認的雙過程理論,Jacoby認為再認水平由有意識控制下的回憶過程(recollection)和自動加工的熟悉性(familiarity)共同決定。Chan等假設,當最終測試任務為回憶任務時總能出現(xiàn)測試效應是因為回憶測試對隨后的有意識回憶產(chǎn)生了促進作用,而當最終測試為再認任務時,雖然測試也提高了再認中的有意回憶成分,但這一作用被起更大作用的熟悉性所掩蔽。Chan等用三個實驗探討了初始測試在有意識回憶和熟悉性上對最終測試的影響作用,結(jié)果發(fā)現(xiàn),測試雖然未影響再認擊中率,但它改變了做出再認判斷的內(nèi)在過程,初始測試提高了再認中的有意回憶成分,但不改變其中的熟悉性。Chan等的研究對于探討測試效應的機制有重要啟示,如,有關(guān)自由回憶的測試效應的研究表明測試促進了長時記憶,而重學則促進了短期內(nèi)的記憶水平,這一現(xiàn)象是否由測試促進了有意回憶、重學增強了熟悉性所導致?也即,正是由于測試促進了有意回憶并因而促進了長時記憶,重學增強了熟悉性并因而僅促進了短期內(nèi)的記憶水平?
  
  2.4對真實教育情境中的測試效應的探討
  關(guān)于測試效應的研究大部分是通過實驗室實驗進行的,為便于實驗控制,實驗材料多采用詞表或無關(guān)詞對,但真實教育情境中的學習材料與詞表或無關(guān)詞對畢竟是不同的,當以教育實踐中的學習材料為實驗材料時是否仍然產(chǎn)生測試效應呢?現(xiàn)有的相關(guān)研究主要通過操縱材料和測試形式探討真實教育情境中的測試效應。
  2.4.1不同學習材料和測試形式的測試效應
  當前以真實教育材料作為實驗材料探討測試效應的有代表性的研究主要有Carrier和Pashler(1992)年以外語詞匯為實驗材料的研究,Karpicke和Roediger(2006)以GRE備考書中的材料作為實驗材料的研究,以及Roediger和Karpicke(2006)以科學小品文為實驗材料的研究等1221,這些研究總體而言都發(fā)現(xiàn)了顯著的測試效應。下面以Roediger和Karpieke(2006)的研究為典型進行介紹。
  Roediger和Karpicke的研究中的第一個實驗讓大學生被試在兩種實驗條件下學習科學小品文,一組為重學組,即被試在首次學習之后重復學習整篇文章,另一組為自由回憶組,即在首次學習后要求被試盡可能地將其所能回憶起的文章內(nèi)容寫下,但不提供反饋。重學和自由回憶的時間都為7分鐘。最后考查各實驗條件下的被試在5分鐘、3天、1周后的測試成績。結(jié)果發(fā)現(xiàn),5分鐘后的測試中,重學組的回憶率稍好于測試組;但在2天后的測試中,測試組和重學組的回憶率分別為68%和54%,一周后兩組的回憶率分別為56%和42%,測試組明顯高于重學組。為進一步探討重復學習和重復測試對記憶保持的影響,Roediger和Karpicke進行了第二個實驗。實驗條件為SSSS、SSST、STTT。分別在5分鐘和1周后進行最終測試。結(jié)果表明,在5分鐘后的測試中,回憶率與重復學習呈正相關(guān),即SSSS組好于SSST組,而SSST組好于STTT組;在1周后的測試中,回憶率轉(zhuǎn)變?yōu)榕c測試次數(shù)呈正相關(guān),即STTT組的回憶率要好于SSST組,SSST組好于SSSS組。
  2.4.2不同測試形式之間的相互作用   真實教育情境中充滿各種不同形式的測試,是否某種測試形式比其他的形式更能促進記憶保持,或是否某一特定的測試形式只能對后來的測試中的相同形式起促進作用?Duchastel(1981)的一個實驗對不同測試形式的作用做了初步探討。實驗將被試分三組,一組在學完之后進行簡答式測試,一組進行選擇題測試,另一組只繼續(xù)學習。兩周后進行簡答式測試,結(jié)果發(fā)現(xiàn)進行測試的兩組被試比繼續(xù)學習組被試表現(xiàn)了更好的記憶保持力,而簡答式測試組比選擇題測試組表現(xiàn)了更好的記憶保持水平。
  Kang等(2007)的一個實驗進一步考查了簡答式測試和選擇題測試的測試效應。實驗讓被試先學習文章,實驗組每學完一篇文章后進行一次簡答式測試或選擇題測試,測試之后提供反饋;控制組被試讀完文章后接著閱讀一些選自文章的句子,它們與選擇題測試和簡答式測試中所涉及的內(nèi)容相同。三天后進行測試,測試形式包括簡答式測試及選擇題測試。結(jié)果發(fā)現(xiàn),初始測試為簡答式測試的被試在兩種測試形式中都表現(xiàn)出最好的記憶保持水平。Butler和Roediger(2007),MeDaniel等(2007)采用類似的實驗設計也報告了相似的結(jié)果。
  
  3 對測試可能存在的消極效應的研究
  
  狹義的測試效應往往指測試對學習的積極作用,但研究發(fā)現(xiàn)測試還可能對學習產(chǎn)生消極影響,當前的相關(guān)研究主要集中在兩個方面:一是先前測試時的提取可能會干擾或削弱個體在后來測試時對材料的回憶;二是某些類型的測試會對個體掌握知識產(chǎn)生消極作用。
  
  3.1提取導致遺忘
  有關(guān)提取導致遺忘的(Retrieval induced forgetting,RIF)研究揭示了之前的提取對后來回憶的抑制作用。Roediger(1978)早期的一個實驗說明了回憶的抑制作用。實驗材料為10個類別性詞表,每一類包括5個詞,實驗有四種條件,分別為不提示類別名稱,提示3個、5個或7個類別名稱。最終測試要求被試回憶所有詞。結(jié)果發(fā)現(xiàn),提示類別名稱組比無提示組的回憶成績更好,但當要求被試在無提示的情況下回憶時,提示組的成績反而比無提示組差。研究者認為這是由于提示組被試借助各類別線索進行回憶,從而限制了在各類別間的儲存和提取,而類別名稱的提示越多,這種限制就越大。
  Anderson等(1994)采用提取練習范式(retrieval practice paradigm)對RIF進行了研究。實驗包括三個階段:學習,提取練習和最終測試(類似于測試效應的實驗設計)。學習階段,被試學習“類別名稱一所屬項目”形式的詞對,如“fruit-orange”;練習階段,形式為“fruit-o_____”,要求回憶缺失部分,但只對其中的部分項目進行測試。最后測試形式為提供類別名稱,要求回憶出該類別下的所有項目。采用提取練習范式的實驗結(jié)果都表明,學習階段得到提取練習的項目在最后測試中的回憶水平得到了明顯的提高(測試效應),但未得到練習的另一部分項目的回憶水平卻受到抑制。
  
  3.2測試的消極暗示效應
  測試的消極暗示效應(hegative suggestion effects)指由于測試時的提取行為強化了后來的提取過程,而如果個體在測試過程中出現(xiàn)錯誤,則可能因此而習得錯誤的信息。例如在選擇題或是非判斷題形式的測試中,學生有可能將錯誤的選項看作是正確的,甚至即便學生在閱讀一個錯誤的句子時知道它是錯誤的,他們在將來也可能會把錯誤的句子看作是正確的。早在20世紀八九十年代研究者就對這一現(xiàn)象做了探討。Toppino和Brochin(1989)讓學生完成是非判斷題,測試結(jié)束后,將之前出現(xiàn)過的錯誤句和未出現(xiàn)過的與之相似的錯誤句混在一起,要求被試判斷正誤,結(jié)果發(fā)現(xiàn)重復出現(xiàn)的句子比未出現(xiàn)過的新句子更容易被判斷為正確。Tippino和Luipersbeck(1993)以選擇題的錯誤選項為材料也得到類似的結(jié)論。Brown等(1999)的實驗在被試完成測驗后呈現(xiàn)錯誤信息,結(jié)果發(fā)現(xiàn)被試在隨后的“線索一回憶”和選擇題測驗中都受到消極影響,而且即便研究者告知被試那些信息是錯誤,仍然出現(xiàn)這種消極作用。
  Roediger和Marsh(2005)以選擇題為實驗材料,探討了是否測驗的消極暗示效應大于測驗的積極效應。實驗的基本程序為“閱讀短文一選擇題測試一視覺空間推理任務(分心任務)一線索回憶測試”。結(jié)果發(fā)現(xiàn),選擇題測試(未提供反饋)對隨后的線索回憶任務有促進作用,但也可能會使被試將錯誤選項誤認為是正確的(當材料陌生時這種效應更明顯),而且選項越多,積極的測試效應越小。增加干擾選項不僅降低了線索回憶的正確反應率,還提高了被試在線索回憶中用干擾選項回答的概率[27]。 Butler等(2006)對選擇題測試中出現(xiàn)消極暗示效應的原因進行了探討,認為被試在選擇題測試中的表現(xiàn)水平是決定選擇題測試起積極還是消極作用的關(guān)鍵因素,如果測驗非常簡單,被試幾乎都能選擇正確答案,那么測驗的干擾題項數(shù)就能起積極作用;而如果選擇題較難,被試容易出錯,則易導致消極暗示效應,并且隨選擇題干擾項的增加而增加。
  此外,消極暗示效應并不只限于選擇題或是非判斷題。Henkel(2004)讓被試觀看一些圖片并進行想象,然后進行一系列回憶測試,結(jié)果發(fā)現(xiàn)測試將使被試更有可能錯誤地將之前所想象的圖判斷為是原來觀察過的圖,Henkel認為“識記時的反復嘗試……可能為來源誤判提供了豐富的土壤”,包括將自認為的、推測的或想象的內(nèi)容記作是確實出現(xiàn)過的,“個體為更好地記住某些信息而進行提取練習的過程包含了多個不同的認知過程,如提取最易提取的信息,搜索額外信息,對信息進行評價等,每一過程都融合了個體的想象、修飾和重構(gòu)的過程。多次的重復提取可能同時增強了個體正確地或錯誤地回憶起信息的信心,以及鮮明程度”。Meade和Roediger(2006)的實驗研究也表明,被試在一次測驗中錯誤回憶的信息很可能在下一次測驗中再次出現(xiàn)。
  
  3.3測試與錯誤記憶
  Roediger和McDermott的系列研究表明,測試將可能增強錯誤記憶(false memory)。Roediger和McDermott(1995)采用DRaM(Deese-Roediger-McDermott)范式的研究發(fā)現(xiàn)在并無明顯誤導信息的情況下,測試也將導致錯誤再認。實驗采用被試內(nèi)設計,被試學習16份詞表,每份詞包含15個語義關(guān)聯(lián)詞對(如,hill,valley),每學完一份詞表后提示被試回憶詞表或解數(shù)學題,5分鐘后進行再認測試。結(jié)果表明,與學習后解數(shù)學題的情況相比,進行初始測試既提高了對已學詞的擊中率,也提高了對關(guān)鍵誘餌(critical lure,如mountain)的虛驚率。 且“記得-熟悉”(remember-know)判斷的結(jié)果表明測試還使被試更堅信自己記得關(guān)鍵誘餌呈現(xiàn)時的具體信息。由于后來的相關(guān)研究發(fā)現(xiàn)該研究的可重復性不穩(wěn)定,McDermott(1996)對DRM范式做了適當變式,即讓被試先進行學習或測試,然后分別在2天后進行自由回憶測試,結(jié)果發(fā)現(xiàn)在學習后進行測試的情況下,被試回憶出關(guān)鍵誘餌的可能性是未進行測試情況下的2倍,因此,以自由回憶代替再認作為最終測試任務將導致顯著的錯誤記憶。McDermott(2006)還探討了不同測試次數(shù)對錯誤記憶的影響,實驗讓被試學完每份詞表后分別進行0、1或3次的初始測試,最后進行自由回憶測試。結(jié)果發(fā)現(xiàn),測試提高了正確回憶的可能性,但同時提高了錯誤回憶某的可能性,進行3次初始測試的被試對已學詞的回憶隨著測試次數(shù)的增加出現(xiàn)遺忘,但對關(guān)鍵誘餌的回憶則隨著測試次數(shù)的增加而增加。
  
  4 測試效應的有關(guān)理論及其發(fā)展
  
  在某些條件下測試對學習既可能有積極的促進作用,也可能產(chǎn)生消極影響,狹義的測試效應主要指測試的積極效應。關(guān)于測試的消極影響,如提取導致遺忘,錯誤記憶等,已形成相應的理論解釋。這里主要介紹對狹義層面上的測試效應進行解釋的五種理論的發(fā)展沿革:(1)信息額外呈現(xiàn)理論(additional exposure),(2)過度學習理論(over-learning),(3)提取努力理論(effortful retrieval),(4)必要難度理論(desirable difficulties),(5)遷移適當加工理論(transfer-appropriate processing,簡稱TAP)。
  
  4.1信息的額外呈現(xiàn)理論
  Thompson等(1978)認為,測試材料相當于為學習者額外地呈現(xiàn)了相關(guān)信息,而正是這種額外的呈現(xiàn)導致了測試效應。這一解釋主要與當時研究測試效應的實驗操作有關(guān)。當時的實驗往往設計兩種學習條件,一種是讓被試先學習材料,一段時間后進行測試;另一種是讓被試先學習材料,接著再進行一次初始測試,最后再進行與前一實驗條件相同的測試。這種設計混淆了測試效應與信息額外呈現(xiàn)的作用,因為此時的測試效應可能是由初始測試時材料的額外呈現(xiàn)或者額外的學習時間而促成的。后來的研究者通過簡單的實驗操作分離了這一混淆效應:讓控制組被試在實驗組進行初始測試時再學材料,從而使兩組被試在材料上的學習時間等同。實際上這種設計使得控制組比實驗組更多地接觸了材料(而不是等同),因為實驗組被試在進行初始測試后未加以反饋,因此他們實際上只接觸了那些測試時能回憶出的內(nèi)容,而此時實驗組仍然出現(xiàn)顯著的測試效應。這表明除了在材料上的額外學習外,應該還有其他因素導致測試效應的產(chǎn)生。
  
  4.2過度學習理論
  Slamecka和Katsaiti(1988)認為測試效應只是反映了測試項目得到過度學習,因此是由于提取使被試對部分材料的過度學習,而不是提取過程本身促進了后來的回憶。這一理論實際上與上述的信息額外呈現(xiàn)理論有相似之處,二者都認為測試效應的產(chǎn)生有賴于額外的或過度的編碼過程。這一解釋也遭到許多研究者的置疑。如,Wheeler等(2003)以及Roediger和Karpicke(2006)的研究都發(fā)現(xiàn),如果在重復學習或重復測試之后的短時間內(nèi)進行測試(如5分鐘或10分鐘后),重復學習很明顯地導致了“過度學習”,但從延時測試(3天或1周后)來看,這種“過度學習”并不能促進長時記憶,相反,測試導致了更好的長時記憶。因此,額外呈現(xiàn)或過度學習可以解釋各種回憶間隔下的主效應,但不能解釋它們之間的交互作用。Chan等(2006)的一項研究發(fā)現(xiàn),提取練習不僅能促進對測試內(nèi)容本身的記憶,而且還在一定程度上促進了未進行測試但與測試內(nèi)容相關(guān)的內(nèi)容的記憶,而這一促進作用卻未發(fā)生在提供了額外學習的被試身上。這種測試效應用額外呈現(xiàn)或過度學習的觀點是無法解釋測試的,測試效應的產(chǎn)生包含了更為復雜的內(nèi)部過程。
  
  4.3提取努力理論
  由于上述理論無法很好地解釋測試效應,研究者們從更深層次對這一問題展開探討:是否測試時的提取過程導致測試效應?Jacoby的一系列研究探討了這一問題。Jacoby(1978)的一個實驗中,被試在兩種條件下學習,一是解決問題,一是記住答案,結(jié)果發(fā)現(xiàn)前者的學習水平好于后者,Jaeoby認為這是由于前者需要個體付出提取努力。Jacoby等(2005)和lacoby等(2005)采用記憶新詞范式(memory-for-foils paradigm)考察了不同提取深度對記憶的影響,結(jié)果發(fā)現(xiàn)在大學生被試中,與淺層加工相比,深層加工之后進行再認測試提高了隨后測驗中對新單詞的再認,首次測驗的提取深度影響了隨后測驗中對新單詞的再認。Pashler等(2003)的研究發(fā)現(xiàn)增大初始測試的間隔(即增大提取所需努力)將導致更好的回憶成績,也支持了這一理論。
  
  4.4必要難度理論
  Bjork和Bjork(1992,1994,1999)在提取努力理論的基礎上進一步提出必要難度理論來解釋測試效應。Bjork區(qū)分了存儲力(storage strength)和提取力(retrieval strength)兩個概念的不同,前者指記憶痕跡的相對持久性,后者指記憶痕跡的即時可獲得性,類似于提取流暢性(retrieval fluency)的概念。必要難度理論認為,提取力與存儲力的增長呈負相關(guān),即提取容易(高提取力)并不能促進存儲力,而更為努力的提取卻能提高存儲力,使記憶保持更持久,能促進學習的長期保持力。而Jacoby,Bjork和Kelly的研究發(fā)現(xiàn),學生往往根據(jù)當前加工的流暢性(提取力)來衡量當前學習水平,因此學習時往往傾向于選擇可促進當前加工流暢性的策略,如集中學習,而實際上不流暢加工更有利于長時學習,如分散學習,延遲反饋或進行自我測試等。
  這一理論得到許多研究的支持。Bjork(1999),Koriat和Bjork(2005,2006)的研究讓被試在重復學習之后對回憶水平做判斷(JOL),發(fā)現(xiàn)以當前加工的流暢性來監(jiān)測和指導學習容易使被試對自己的學習水平的判斷產(chǎn)生錯覺,認為在隨后的測試中可以表現(xiàn)得很好,且由于測試相對于重復學習需要一定努力,使學生可能不傾向于選擇自我測試。Roediger和KarDicke(2006)的研究發(fā)現(xiàn)重復測試相對于重復學習減緩了最初階段的學習,但卻大大地提高了長時記憶保持,研究者認為這時由于相對于“重復學習”而言,測試提供了“必要的難度”。
  
  4.5遷移適當加工理論
  TAP理論也被用于解釋測試效應。根據(jù)TAP理論,某種學習策略或編碼加工可能只能促進某種測 試類型,而對另一種不同信息類型或加工類型的測試不起作用,甚至起反作用。如,Roediger和Karpicke(2006)的研究發(fā)現(xiàn)測試時的提取練習比重復學習中的額外編碼更能促進記憶保持力,研究者認為用TAP來解釋即為:測試使被試在學習時進行提取加工,不斷地對促進后來的提取所必需的相同技能進行練習。Thomas和McDaniel(2007)的實驗發(fā)現(xiàn)如果讓被試在學習時采用學習策略(對學科的核心概念進行深入理解,并弄清各概念之間的相互關(guān)系等),而在最后測試時進行選擇題測試(對各獨立知識點進行再認),則被試的測試成績相對較差,這是因為加工策略雖然可能有利于長時記憶保持,但對于某些具體測試而言卻作用甚微。
  但有些研究用TAP理論則無法解釋。Kang等(2007)的研究采用兩種測試形式(選擇題測試和簡答式測試)作為初始測試,考察被試在初始測試形式與最終測試形式相同和不同時的成績,結(jié)果發(fā)現(xiàn),相對于無測試組,兩種測試形式都產(chǎn)生測試效應,簡答式測試比選擇題測試更好地促進了被試在最終測試(不論形式如何)上的成績。
  綜觀上述有關(guān)測試效應的理論我們可以明確,測試效應不能被解釋為是學習材料的額外接觸,而測試中的提取過程,如精致化編碼,需要努力的或更深層次的編碼,以及更多的提取通道等應是對測試效應的更好的解釋。此外,雖然遷移適當加工理論也能從一般意義上解釋測試效應,但它無法解釋一些研究結(jié)果。
  
  5 測試效應的研究展望
  
  已有研究從實驗材料(如,無關(guān)詞對或聯(lián)想詞對),測試任務的性質(zhì)(如自由回憶、配對聯(lián)想學習、再認),各次學習或測試之間的時間間隔(集中或分散),積極的測試效應及測試可能存在的消極影響等各角度對測試效應進行了探討,同時提出了相應的理論解釋,并通過實證研究不斷對理論進行驗證更新,F(xiàn)有的研究使我們認識到,測試不僅是一種衡量學習掌握程度的工具,它還是一種促進學習的手段,在某種條件下它與“學習”(編碼)相比能更好地促進記憶的長期保持,采用自我測試策略學習應是一種高效率的學習方式。但要更深入地認識測試效應,當前的研究在一些問題上尚待進一步的回答和解釋。
  
  5.1測試效應的發(fā)展研究
  測試效應是否具有發(fā)展特點?自我測試策略對不同年齡階段或不同成績水平個體是否有不同影響?已有研究大都以大學生為被試對測試效應進行探討,尚缺乏對測試效應的年齡特點的研究,而只有弄清這些問題才能根據(jù)不同年齡特征指導教學實踐。Komell和Son(2006)的研究發(fā)現(xiàn),選擇進行自我測試的成人被試在最終測試中的成績顯著高于選擇再次學習的被試,而在兒童組被試中卻未發(fā)現(xiàn)這一現(xiàn)象。這說明測試效應可能存在某些發(fā)展特點,或者說自我測試策略對不同年齡階段的或不同學習水平(如學優(yōu)生、學困生等)將可能產(chǎn)生不同的作用。
  
  5.2具體的學習過程中的學習策略選擇
  現(xiàn)有研究更為關(guān)注測試效應本身,而對于個體在具體學習過程中是如何做出學習選擇的(反復學習或自我測試)研究較少,且已有觀點也不盡一致。如,Jacoby等(1994)認為學生會因傾向于根據(jù)加工流暢性來衡量當前學習水平而選擇可促進當前加工流暢性的策略,如集中學習或重復學習。但Komell和Son(2006)在他們的一項研究中卻發(fā)現(xiàn)大學生被試中的70%,兒童被試中的83%都選擇進行測試?疾檫@一問題對指導學生掌握科學的學習策略有重要意義。
  
  5.3測試效應的內(nèi)在機制的研究
  現(xiàn)有理論對測試效應做了不同的解釋,雖然Bjork等的必要難度理論為較多研究者接受,但它仍然需要進一步驗證,如,它無法很好地解釋再認任務中的測試效應。因此,有待完善理論以更深入地理解測試效應的機制。
  
  5.4關(guān)于最優(yōu)化的自我測試策略
  測試效應的存在是確證的,但對于何種自我測試策略才是最優(yōu)化的問題尚有爭議,是擴展式還是等間隔式?是否依不同個體而不同?不同的自我測試策略促進學習的內(nèi)在因素是什么?對這些問題的回答才能真正使學生掌握有效的策略實現(xiàn)高效率學習。

相關(guān)熱詞搜索:概述 效應 國外 國外關(guān)于測試效應的研究概述 抽樣效應 時間效應

版權(quán)所有 蒲公英文摘 m.newchangjing.com