Re: [疑問] 關於心理測驗的書籍

作者juztrue (榮)

看板PSY

標題Re: [疑問] 關於心理測驗的書籍

時間Fri Dec 3 08:15:58 2010

前文吃光光想說回應一下skylikewater的問題，也整理一下手邊有的心測書籍(周文欽那本其實是研究方法的書，心測只有稍微提到)有關建構效度的部分。王文中的雙葉心測是2008出的沒錯，但是該書所翻譯的原文書是2001年出的…，列一下各本書籍內容，應該能看得出來 Murphy版的真的很特別…吧。Murphy版除了多特質多方法矩陣講的比較詳細以外，並沒有講甚麼效度驗證的策略，只有在”建構”這個概念上以其他書本少見的方式，多加著墨而已。朱錦鳳(2010)。心理測驗理論與應用。台北：雙葉。建構效度：是指測驗的編製過程中，以客觀方法來驗證一份測驗是否符合理論假設，以反映該測驗在建構結構上的有效程度。…一份測驗所有驗證測驗結構及測驗理論的分析，都稱為建構校度。 <驗證建構效度的8種方法> 1.發展上的改變(development Change)：一份測驗的分數結果及表現，會隨著發展階段的演化或隨著年齡的增長而增加的狀況。 2.因素分析(Factor Analysis)：藉由統計方法，分析出最少數量且互相獨立的行為特質 3.內部相關分析(Internal Correlation)：又稱內部一致性分析，也就是各分測驗的相關分析。各分測驗的相關分析可呈現各分測驗的結構與關聯性。 4.聚歛效度(Convergent and Discriminant Validation)：以聚合效度(Convergent Validity，或稱輻合效度)與區辨效度(Discriminant Validity)的方式來驗證一份測驗的理論架構。聚合效度是指用不同方法測量相同特質的效度係數，區辨效度是指用相同方法測量不同特質的效度係數。理論上，聚歛效度是以多特質-多方法矩陣(Multi-Trait Multi-Method Matrix)來驗證據陣中各種效度係數的適切性 5.差異效度(Differential Validity)：一份測驗針對不同效標，各分測驗具有區辨受試者能力差異的程度。差異效度主要目的，是幫助篩選或分類的決策時，能夠有效分辨不同族群的差異，以提高決策效益。 6.前後測實驗的介入(Experiment Intervention)：一份測驗經過前側及後側之分數結果的變化，來驗證一份測驗的有效性；通常因為學習的效果，後測會比前測高分。 7.結構方程模式(Structure Equation Model, SEM)：以多元回歸概念為基礎，將進階的統計中的結構方程模式應用在驗證測驗架構與理論的契合度。 8.項目反應理論(Item Response Theory, IRT)：針對電腦化是應測驗發展出來的選題理論。…編制一個能偵測偵測受試者作答歷程及思考過程的適性測驗，IRT是必須配合的理論效度分析之一。 =============================== 葛樹人(2001)。心理測驗學(三版)。台北：桂冠與構念有關的效度證據：此一驗證再決定測驗分數所代表的意義是否與其所欲測的構念相符合。…構念都是由理論上所創造出來以理解人類行為或心理特質的概念，具抽象性。… 如果效度良好，則測驗所產生的分數即可真實反映受測者的特質，測驗者可依該構念之理論對所測得的結果加以詮釋。 <以構念為考量的驗證法> 1.內部凝聚性檢驗：此類方法旨在檢驗測驗內部之品質(如試題、分測驗、反映過程)是否測量同樣的心理構念。使用此法時以測驗總分為效標並計算各試題或分測驗與總分之關係，所得之相關係數即代表測驗內部之凝聚程度，凝聚程度越高即表示越傾向於測量同一心理構念。 2.外在相關係數檢驗：驗證對象測驗與其他測驗工具間之關係。…選用一已具有效度之測驗來做為效標，然後計算對象測驗與此效標測驗間之相關係數，即得測驗的效度，此一係數又稱符合效度(Congruent Validity)。…除此以外，相關法有包括以對比樣本 (contrasted groups)為效標之效度檢驗，在使用此法時其主旨是衡量測驗對不同樣本之辨別能力。…例如一組為患有抑鬱症組，另一組為非患有抑鬱組，若要檢驗某一憂鬱量表之構念效度，若該量表能有效區別出兩樣本，即證明其能準確地測量心理特質。 3.因素分析：為驗證已夠念為中心的效度最常用的方法，它是一種多變數統計方法，可同時分析大量變項間之關係並找出他們在測量上的共同性。…如果測驗原來產生的分數結構符合因素分析所產生的特質結構，則表示該測驗具有良好的因素效度(Factorial Validity)。 4.幅合效度與辨別效度檢驗：前者表示一測驗與其理論上同類之變項具有高相關，後者表示它與其在理論上並不相干之變項應不具相關。…並由多元特質-多重方法矩陣來同時檢驗這兩種效度。 5.發展現象與實驗效果之檢驗：在心理學研究中有少數特質其發展過程與成長年齡或階段具有密切關係(例如智力、成就)。…因此在檢查這類測驗的效度時，便可以比較不同年齡階層的受試樣本在測驗上的表現是否呈現如預期之顯著差異，如果結果確實如此，責次驗之效度即獲得肯定。…最後，與構念有關的效度亦可藉著分析實驗變項對測驗分數影響之方法加以衡鑑。…如果用來測驗此依變項之測驗具有效度，則其分數應能正確地反映研究假設中所推論的效果。 =============================== 周文欽(2004)。研究方法實徵性研究取向(二版)。台北：心理。建構效度：一個測驗能夠測量到它所欲測量之建構的程度。易言之，一個測驗能夠符合其賴以編製之理論的程度。依此論之，凡是從心理學的建構或理論來分析或解釋測驗分數所代表的意義，就是在驗證建構效度。…建構是指一種理論上的構想或概念，它是看不見也摸不著，甚至可說是存不存在都有待求證，但為了研究或實務上的需要，我們假設它是存在的。所有的建構都包含兩種特質：第一個特質是在本質上，它們是某規則的抽象摘述；第二個特質是，它們與具體的可觀察的實體或事件有關或相關聯。 <驗證建構效度常用的統計方法有下述諸種> 1.相關檢定：某測驗是依據現有的優良之理論所編制，這時可將受試者在這兩個測驗上的得分，求其積差相關，如這個相關係數達到顯著，就可說某測驗具有理想的建構效度。 2.差異檢定：有許多理論都證實有年齡、性別或實驗前後、考試前後等有顯著差異，這些現象都可以運用差異檢定的方法來驗證測驗的建構效度。 3.因素分析：驗證建構效度最常用的統計方法之一。測驗分數透過因素分析的結果，可以讓我們了解該測驗所欲測量之特質的層面為何。…層面一致，則該測驗具有良好的建構效度，獲得了支持的證據。. =============================== 游恆山(2010)。心理測驗(Robert. J. Gregory原著)，台北：五南。 Gregory, R. J. (2007). Psychological Testing: History, principles, and application (5th ed.). Boston, MA: Allyn and Bacon. 構念是指某一理論上的、不具實體(無形)的特性或特質，隨不同人們而異。…構念從行為推論出來，但不只是行為本身。一般而言，構念在理論上被認為具有某些形式獨立存在，而且對人類行為施加廣泛但在某種程度上可以預測的影響力。當某一測驗立意於測量某個構念時，它必然是根據有限樣本的行為預估某一推斷的、基礎的特性的存在。構念效度是指對基礎構念的這些推斷的適當性。所有的心理構念有兩個共通特性： 1.沒有單一的外在指涉事項(external referent)足以驗證構念的存在；也就是說，構念不能被操作性地界定。 2.儘管如此，一連串聯動式的假設可以從現存關於該構念的理論中被推衍出來。構念效度的證明始終建立在研究方案上。…為了評估某一測驗的構念效度，我們必須累積得自許多來源的各種證據。 <構念效度的驗證法> 構念效度的證據可以覓之於實際上任何實徵研究，只要它們是針對適當的受試者團體檢視測驗分數。大部分構難效度的研究落在下列範疇之一： ‧從事分析以決定測驗題目或分測驗是否同質，因此是在測驗單一構念。(測驗同質性) ‧探討發展上的變化，以決定這些變化是否符合該構念的理論。(相稱的發展變化) ‧從事研究以確認測驗分數上的團體差異是否跟理論保持一致。(理論-符合的團體差異) ‧從事分析以決定測驗分數上的干預校應是否跟理論保持一致。(理論-符合的干預差異) ‧該測驗與其他有關和無關的測驗及量數之間相關情形。(幅合效度和辨別效度的檢驗) ‧就測驗分數與其他來源訊息的關係進行因素分析。(因素分析) ‧從事分析以決定測驗分數是否容許對受試者作正確的分類。(分類準確性) 1.測驗同質性（Test Homogeneity）：假使某一測驗測量單一構念，那麼它的組成題目( 或分測驗)可能將是同質的，也稱為是內部一致的。…各試題或分測驗與總分數之間的相關係數即代表測驗內部的凝聚程度；凝聚程度越高就表示越傾向於測量同一心理構念。 2.相稱的發展變化（Appropriate Developmental Changes）：許多構念可被假定將會從早年兒童期到成熟成年期(或許還超出這個範圍)顯現有規律之年齡等級的變化。 3.理論-符合的團體差異（Theory-Consistent Group Differences）：個人當被認為在測驗所測量的構念上傾向偏高時，他就應該拿到高分數，至於個人當被認為在該構念上擁有偏低的數量時，他就應該拿到低分數。 4.理論-符合的干預差異（Theory-Consistent Intervention Effects）：測驗分數將會隨著預定或非預定的干預而以特定的方向及數量發生變動。例如就一份空間定向的測驗而言，受試者在給予空間認知訓練後，在此測驗的分數應該比訓練前來得高。 5.幅合效度和辨別效度的檢驗（Convergent and Discriminant Validation）：當某一測驗與其他也擁有同一構念的變項或測驗之間有高相關時，這就證明了該測驗的輻合效度；當某一測驗與其他所測量構念互異的變項或測驗之間沒有相關時，這就證明了該測驗的辨別效度(或稱區別效度)。多元特質-多元方矩陣是一系統性的實驗設計，以便同時驗證心理測驗的輻合效度與辨別效度。 6.因素分析（Factor Analysis）：一種專門化的統計技術，特別有益於研究構念效度。 …因素分析的目的是鑑定在解釋成套測驗間的交互相關上所需要最少數目的決定因子(因素)。換句話說，因素分析的目標是找出最少一組維度，稱之為因素，這些維度可以解釋所觀察之個別測驗間一系列的交互相關。 7.分類準確性（Classification Accuracy）：許多測驗是為了篩選目的而被使用，以便鑑定出符合(或不符合)若干診斷標準的受測者。對於這些工具而言，準確分類是效度的必要指標。…研究人員應特別注意跟效度有關的兩項心理計量特徵：靈敏性(Sensitivity) 與專對性(Specificity)。靈敏性與準確鑑定出具有某一症候群的病人有關(例如每一百位病人中可準確檢定出79位病人有該症候群，其靈敏度即79%)；專對性則與準確鑑定出正常人有關(例如每一百位正常人中可準確鑑定出83人沒有該症候群，而有17人被誤判為有該症候群，即專對性即83%%)。…當選定一個截切分數而提升靈敏性，這必定將會降低專對性，反之亦然。 =============================== 王文中、陳承德譯(2008)。心理測驗(Kevin R. Murphy、Charles O. Davidshoferm原著) 。台北：雙葉 Kevin R. Murphy、Charles O. Davidshoferm(2001). Psychological Testing: principles and application(5th ed.).Prentice Hall. 建構是某種規則性的抽象總結，而且建構與具體、可觀察的實體或事件有關。…雖然建構是假設性的抽象概念，不過所有的建構都跟真實、可觀察的事物或事件有關。建構說明(construct explication)：詳細描述特定行為與抽象建構關係的歷程。 1.找出與所欲測量之建構有關的行為 2.找出其他建構，並決定它們是否與所欲測量的建構有關 3.找出跟這些其他建構有關的行為，並根據這些建構的關係，判定每個行為是否與所欲測量的建構有關。 <驗證建構效度的方法> 雖然任何方法都可能可以用來評估建構效度，不過有些方法似乎比較常見。最基本的方法，是計算該測驗分數與其他測驗分數的相關。…另一種常用的方法是因素分析。…第三種方法則是對所欲測量建構的實驗操弄。...還有一種常用於評估建構效度的方法，是如果我們使用多種方法來測量一種以上的特質或建構，這些測量間的相關就形成了多特質-多方法矩陣…。 =============================== 危芷芬譯(2006)。心理測驗(Anne Anastasi & Susana Urbina原著)。台北：雙葉。建構效度：表示測驗可以測量理論建構或特質的程度。…建構效度的建立必須逐漸累積各種來源的訊息。任何資料若是有助於了解該特質之性質，以及對其發展和形成條件產生影響，都可以作為建構效度的適當證據。 <建構確認程序> 1.發展變化：許多傳統智力測驗所使用的主要效標就是年齡區辨。我們預期某種能力在兒童時期會隨年齡而增強，因此如果測驗是有效的，測驗分數應該顯示出同步的增進。 2.與其他測驗的相關：新測驗所測量的行為領域類似於其他同樣稱為「智力測驗」或「機械性向測驗」的既有測驗。…與效標預測效度不同的是，此時相關只須達到中等程度即可，不可以太高。如果新測驗與現有測驗的相關太高，但是又缺乏簡潔或易於施測等其他優點，則新測驗就是多餘的 3.因素分析：是ㄧ種確認心理特質的方法，尤其與建構確認的程序有十分密切的關連。 4.內部一致性：這種方法的特徵是，效標就是測驗分數本身。…分測驗與總分的相關也是此技術的另一種應用。 5.聚合效度和區辨效度：測驗分數與理論上應該有關的其他變項呈現高相關(即聚合效度) ，而且它不應該與無關變項產生顯著相關(即區辨效度)。…使用多重特質-多重方法矩陣來獲得聚合效度與區辨效度的證據。 6.實驗介入：例如要檢驗使用於個別教學計畫之測驗的效度，則可行的途徑之ㄧ是比較測試前和測試後的分數。 7.結構方程式模型：建立因果關係模型的基礎在於非常熟悉各變項以及所研究之情境的現有知識，模型中所假設的關係應該具備合理的理論基礎。…在因果模型中，方程式的數目通常多於未知數，所以可能同時產生數個模型。然後再根據原先實徵數據所形成的相關矩陣，以檢定其適合度。 =============================== 總結來說，建構是一抽象概念，卻是心理學家想要測量到的目標。而測驗工具究竟測得此抽象概念到甚麼程度，即為建構效度；因為建構是抽象的，而可觀察行為、測驗分數等是具體的，以具體的測量去推敲建構是否測得，此歷程並沒有簡單又顯而易見的方式。於是心理學家便如同偵探一般，運用各種”手段”，提供(間接)證據去證明測驗工具測量到該建構的程度如何。至於這些”手段”，便是上述種種效度驗證的策略。 <比較各書多種建構效度驗證的異同> 朱錦鳳葛樹人周文欽游恆山王文中危芷芬因素分析 ◎ ◎ ◎ ◎ ◎ ◎ 實驗介入 ◎ ◎ ◎ ◎ ◎ ◎ 發展改變 ◎ ◎ ◎ ◎ ◎ 聚合效度和區辨效度 ◎ ◎ ◎ ◎ ◎ 測驗同質性 ◎ ◎ ◎ ◎ 與其他測驗的相關 ◎ ◎ ◎ ◎ 團體差異 ◎ ◎ ◎ 結構方程模式 ◎ ◎ 項目反應理論 ◎ 分類準確性 ◎ -- ※ 發信站: 批踢踢實業坊(ptt.cc) ◆ From: 114.45.108.180

推 CrazyCharlie:請接受小弟一拜!! 12/03 12:48

推 afu321:非常完整的整理啊!!高手!! 12/03 22:35

→ chaos0807:怎會只有四銀XDDDDDDDDDDDDDDDDDDDDDDDDDDDDDDDDDDDDDDD 12/03 22:57

先在word上打完複製貼上壓

推 skylikewater:熱心大推我是看陳承德老師的學術著作列表的 12/04 00:37

→ skylikewater:不過查了Amazon，他自己寫錯了XD 12/04 00:38

推 nxdwx:推朱錦鳳老師XDDD 12/04 18:26

推 s19880831:推朱錦鳳老師~~ 12/06 01:30

※ 編輯: juztrue 來自: 114.45.103.40 (12/06 17:56)

推 polb:朱錦鳳老師阿....這樣好嗎 12/13 00:40