就事論事看基測

(2007/07/02 補充) 今年基測之後,已經連續寫了三篇東西,原本不想再針對這個主題寫什麼了,今天拜讀Taiwan 2.0 的文章「國中基測還有救嗎?」,對蔡先生的觀點覺得深以為然,也覺得自己原先的想法還可以再做些補充。不過最近幾天忙著趕學校專案的系統分析報告,恐怕沒有時間作更進一步的分析,所以先作個補充註記。 相關的連結: 下載研究報告「國中基測量尺及等化程序缺失」 教育部的「國中基本學力測驗、技專統一入學測驗、大學學科能力測驗、指定科目考試、全國各研究所考試等考試相關問題檢討與規劃專案報告」 中央研究院統計科學研究所 國民中學學生基本學力測驗推動工作委員會 (2007/06/23 原稿)基測量尺 計分不公的新聞出現後,果然出現對於公布時機和政治動機的臆測,雖然在意料之中,但是對於這樣的狀況,還是很失望。在這個政治狂熱的國度,要理性討論問題真的有那麼難嗎? 在沒有閱讀完畢林女士的研究報告之前,筆者個人不敢妄言研究結果的正確性和心測中心的「答辯」究竟有沒有道理,但是從常識的角度,和作學問的基本要求來看,我只在乎資訊的透明和程序正義。 資訊不透明 今年(2007)第一次基測結束後,媒體出現『參加次兩次基測,平均分數相差不到一分』的報導,類似的新聞也可以在前年(2005年)六月的新聞中找到,所以我們應該可以推論,不鼓勵參加第二次基測是教育部和心測中心對於這個議題的基本立場。 但是在尋找佐證資料的過程中,筆者發現心測中心的研究員曾在不同的場合(座談會、報紙訪問等)發表矛盾的意見。尤有甚者,心測中心和教育部並沒有交代「前後相差不到一分」的統計結果是怎麼做出來的。 奇怪的決策時機 剛開始追蹤基測新聞的時候,因為資訊的稀有和不透明,我是質疑「前後只差一分」究竟是誰作的統計,怎麼作出來的(找資料的過程和筆者的心得,請參考拙作第二次基測和究竟要不要考第二次基測)。但6月下旬量尺不公的新聞發表後,問題變得更複雜了。 我們看到,國內媒體披露心測中心將基測資料以國家機密為由,不願對大眾釋出的離譜情況。然後我們又看到心測中心指責林博士不懂統計,所以才會做出那種結論。我個人的看法是,如果媒體報導屬實,心測中心的反應實在是沒風度又不專業。 首先,參照筆者自己在找相關資料所遇到的困難,教育部和心測中心對資訊透明度的立場和處理方式,是極不恰當,應該被譴責,而且必須立即修正的。 其次,林女士既然公開自己的所做的研究,這個研究方法與結果究竟是否合理,本就是應該被檢驗的命題。從新聞中我們看到,林女士本人歡迎公開的檢驗,我覺得這是相當正面的態度,心測中心面對這個問題的第一個反應,竟然是質疑持不同意見的人的基本學力素養,既顯示出心測中心的老大心態,也讓人質疑他們是否慌張失措。 而教育部針對這個事件的反應,也實在不能不令人懷疑。根據 6月22日中時電子報,教育部中教司長宣布基測轉型(可參閱yam天空的文教新聞專輯基測將轉型 家長更憂心的系列新聞報導)為「入學門檻」,不再是入學唯一標準。新聞稿中有一段話,相當耐人尋味。 國中基測最先的設計就是「入學門檻」,高中職五專招生,除了基測量尺分數,還尊重各校招生自主權,擁有參採考生其他表現的空間。不料基測實施後,量尺分數變成登記分發入學的單一依據,讓心測中心負擔沈重。 從以上的文字裡,我實在忍不住大膽假設,教育部對於量尺這件事,實在是很心虛的。至於為什麼會心虛,是因為教育部內也認同林博士的研究價值與結論,或者教育部的專家們發現了更完整翔實、更有道理的學理根據,我們不得而知,但是這整件事的過程,讓我們對於教育部的決策品質,更加沒有信心。 回溯這些年來的教育政策的變動和相關的辯論,無論是教育政策的規劃者、執行者、批評者,對於教育政策的討論(甚至辯論),都是憑著常識、猜測和各自的立場,在瞎攪和、打爛仗。 我在6月1日的文章裡提到,兩次基測之間究竟有沒有成績的差異,我們聽不到一個統一的說法,而且我們也看不到相關的資料和研究報告。尤有甚者,2009年還會不會有基測,我們也聽到政 務委員有不同的說法。擬定政策的人,講不出政策的依據和理念;為政策辯護的人,講不出政策好在哪裡;已經實行的政策,我們看不到檢討的動作和報告。 回顧這件事的發展,現在我只想說,這實在是太離譜了。懲罰粗心的考生?? 我個人的信念很簡單,沒有公開、透明的資訊,沒有公開而理性的檢驗與辯論,不可能也不應該對林博士或心測中心的主張,輕易的作對與錯、0與1模式的判斷。但是教育部與心測中心在資訊透明與程序正義上的錯誤,是應該首先被提出來,且立即修正的。 至於林博士的研究報告,是不是完美無暇,完成站在正義的一邊,也是值得斟酌的。比如說,新聞稿中說林博士認為有些考生只因粗心而答錯,也扣那麼多分,是不公平的。不知道這是不是林博士的本意,但是個人覺得這個訴求實在沒有道理。 林妙香質疑量尺計分的公正性,首先是各考科只答錯一題的扣分太多。她說,有些考科答錯一題的扣分高達五、六分,這是不合理的。她解釋,只答錯一題的考生,如果答錯的都是最難的一題,扣那麼多分還有道理。但從她的研究中發現,只答錯一題的考生,平均分布在每一個試題,有些考生只因粗心而答錯,也扣那麼多分,這是不公平的。 考試的公平性,必須立基於每一份試卷都以同一個標準評分,評分的依據必須是可取得且可重複驗證的資訊,在為基測考卷評分的時候,答錯題目的原因顯然是無法取得的資訊。以「不應懲罰粗心」為理由,質疑評分基準不公,顯然犯了邏輯上的錯誤。 從以上的分析來看,林博士的研究過程與推論邏輯,絕對不是完全沒有瑕疵的。所以個人的想法很單純,公開的、理性的、完整的檢驗與辯論,是解決這個問題的唯一方法。 不幸的,透明完整的資訊、公開理性的辯論、全面慎重的檢討,正是過去這些年來我們在擬定、執行教育政策時所最需要,但也是我們最欠缺的基本要素。 先報名再說 據筆者熟識的國中教師們透露,通常學校對於二次基測的態度,都是叫學生「先報名再說」,無論有沒有這篇新聞,學校「絕對」不會不鼓勵考第二次基測。所以專家們和現實總是有點距離的 (大笑三聲):D

究竟要不要考第二次基測

每年國中基測結束後,國內新聞媒體照例都要發表些應景文章,在這其中,教育部和師大心測中心連著兩年強調根據統計,考生參加兩次基測之間的分數差距不超過一分,因此不鼓勵學生考第二次基測,是所謂官方意見的基調。 我在6月1日,針對這個統計數字的說法,寫下我的意見,對於這個沒有憑據,不知道如何驗證的數字,我的基本想法是懷疑,寫論文要把參考文獻說清楚講明白,為什麼在心測中心及基本學力測驗推動工作委員會的網站,都找不到相關的統計報告。 今天(2007/06/20)聯合晚報的頭條新聞─「不考二次基測 吃悶虧」公布了中研院統計科學研究所研員究林妙香博士所作的研究,她的研究結果認為,參加二次基測考生平均進步0.1~8.7分,在競爭激烈的基北區考生,只考一次基測就參加登記分發,名次最多往後掉4000名。不考二次基測簡直是「大吃悶虧」。 在沒有看到研究報告之前,我們沒有辦法確認究竟哪一方的說法比較接近事實。以我先前找到的資料為例,即便是心測中心的研究員,在對外談到對於兩次基測間分數差距,都有不同的結論(參考拙文第二次基測)。更何況不同的研究單位,以不同的切入方式作的研究。雖然就目前所能掌握的資料來看,還不能斷定究竟研究的正確性和考靠度;但是我個人非常認同同林博士所強調的程序正義主張,至少,這是理性討論的基礎。 林妙香本人也在研究中呼籲基測中心的資訊應更透明化,符合三個程序正義,一是正確的學理應用,二是內部計分流程應與公布於大眾的「計分遊戲規則」相符相合;三是擇優政策隱含的名次排擠效應的資訊,應該透明化。 就我個人找資料的經驗,相關資料的缺乏,是繼續追蹤瞭解這個問題的最大障礙,為什一個關心教育政策的公民,很難找到教育政策的研究報告,這是我心頭最大的質疑: 從十年前所謂教改開始,我們可以發現一個現象,無論是教育政策的規劃者、執行者、批評者,對於教育政策的討論(甚至辯論),都是憑著常識、猜測和各自的立場,在瞎攪和、打爛仗(恕我用這麼激烈的字眼)。 兩 次基測之間究竟有沒有成績的差異,我們聽不到一個統一的說法,而且我們也看不到相關的資料和研究報告。尤有甚者,2009年還會不會有基測,我們也聽到政 務委員有不同的說法。擬定政策的人,講不出政策的依據和理念;為政策辯護的人,講不出政策好在哪裡;已經實行的政策,我們看不到檢討的動作和報告。 這個議題,很快就在媒體的大量資訊中「滅頂」,離開大眾的眼光。但是這則新聞所揭露的問題,無疑還會影響我們的下一代很久很久。

第二次基測

今年度的第一次國中基測剛結束,媒體的文教版和社會版,一如往年,馬上就有分數預估和「要不要」參加第二次基測的「攻略」建議等等的文章。原本認為這些都是每年照例的應景文章,無非就是些老生常談而已,比如可以補償意外或是臨場失常,或是多一個月時間可以準備,成績應當會有所提升;也有人從心理的疲乏著手,覺得不必讓考生這麼辛苦,再來一次,結果未必會更好等等。 不過,在國語日報看到一篇關於過去統計資料的報導後,突然覺得這是個有趣、值得琢磨的問題。因為自己的迷糊,竟然把報紙丟到回收紙箱裡,再也找不回來。所以透過網路,想找到文章的原始依據,順道看看還有沒有更深入的資料和探討。 讀了些網路上找到的資料之後,越看越覺得這個問題的深度,遠超過自己原先的考慮。 再給自己一次機會 既然是要不要的命題,當然有正反兩種意見。贊同的大致以「再給自己一次機會,為什麼不好好把握」為主軸,有些名為新聞,骨子裡實則為補習班張目的置入性行銷,當然也充分表達了他們的立場。 我覺得真正有意思的,是在網路城邦找到一篇文章,是一位家長的現身說法,還提出了武陵高中的統計資料,作為佐證。我不知道武陵是否有公開這樣的資料,所以我對這位家長的背景有點好奇。 Dear bju, 非常贊成您的說法,我女兒第一次考了268,原本想90%可以上武陵 (學校老師們,報上社論,也都認為今年錄取分數會降低,加上她國英都滿分,要比分數應也佔優勢),因此她不願再考第二次,我們也就尊重她的選擇!哪知,第 二次會考得如此簡單,說會等化計算,似乎也並沒如此!放榜結果,是上了桃中,雖第二次基測PR值公佈後,已有心理準備,但真的是好失望,也很難過!! 第一次 176 35% 第二次 323 65% 總計 499 宜蘭縣立文化國中,則在學校的網站,公布了一份『從學測及寫作命題趨勢分析談教師效能教學』歷程記錄,主講人是台灣師大心測中心張道行研究員,在會議過程中有一段關於第二次基測的問答: (3)第二次基測會比較簡單還是比較難?答:不一定,但是第二次基測的平均分數通常比第一次高,推測原因是第二次基測的準備時間較長,唸得比較熟。(4)要不要鼓勵學生考第二次?答:視學生經濟狀況及鬥志而定。(5)PR值與量尺分數有何不同?答:第二次PR值沒有意義,僅供參考(由於部份考生未參加第二次基測);考生個人可以「總分」來比較是否進步。 這份資料,比較值得關注的是這份資料的權威性,因為第三點的回答,究竟是不是心測中心的研究成果,是一個關鍵問題。 兩次成績差距不大 雖然不小心丟了國語日報的原始資料,在聯合新聞網的校園博覽會裡,找到『準備二次基測》四種狀況可考慮』,我相信這篇文章裡所提到的師大心測中心的統計,應該是我原先看到報導的根據。 國中基測諮詢委員、北縣教育局長劉和然說,四種學生可審慎考量,第一種是因緊張或高溫表現失常者,「如果跟平常成績差不多的同學相比,基測分數明顯偏低, 就算失常。」第二種是首次基測時感冒、身體不適者,第三種是下學期以來每次模擬考都持續進步者,第四種是考生本身極有意願者,「而不是因家長有強烈意願再 考一次!」 …… (省略) 劉和然也表示,根據師大心測中心所做的統計,將所有參加二次基測的考生前後成績加以比較,發現平均分數相差不到一分,「不鼓勵學生考兩次。」 除了今年(2007)聯合新聞網的新聞外,我還發現 2005/06/24 的東森新聞報,也有類似的報導,只是劉和然先生當時的身份是教育部國中基測指導委員、台北縣義學國中校長。 這個在 2005 和 2007 年都被引用的數字,究竟是哪裡來的,我們能不能一窺究竟。這個說法,和文化國中舉行的研討會的討論,有很大的差異,到什麼才是我們能相信的說法。 要不要參加第二次基測,是家長和考生的共同抉擇,每個人走的路和後果,都是自己和家庭要共同承擔的,作為外人,當然沒有發言權。關於第二次基測,補習班怎麼說,是商人的觀點,也不是我關心的重點。國家教育政策的統計數字,怎麼會有不同的版本,才是我關注的重點。 統計資料難得 套一句一個老朋友的口頭禪,依小弟愚見,這個「「平均分數相差不到一分」的研究,延伸下去,有很多後續的題目可作。從考試的效度、統計方法、考生心理、試題設計出發,就有很大的討論空間;兩次基測之間,家長、學校的配合;若是不考第二次基測,應該有孩子怎樣的輔導和幫助,讓他們更順暢的走入下一個學校。 不過,在心測中心及基本學力測驗推動工作委員會的網站,都找不到相關的研究報告和統計資料,這是相當令人遺憾的事。 從十年前所謂教改開始,我們可以發現一個現象,無論是教育政策的規劃者、執行者、批評者,對於教育政策的討論(甚至辯論),都是憑著常識、猜測和各自的立場,在瞎攪和、打爛仗(恕我用這麼激烈的字眼)。 兩次基測之間究竟有沒有成績的差異,我們聽不到一個統一的說法,而且我們也看不到相關的資料和研究報告。尤有甚者,2009年還會不會有基測,我們也聽到政務委員有不同的說法。擬定政策的人,講不出政策的依據和理念;為政策辯護的人,講不出政策好在哪裡;已經實行的政策,我們看不到檢討的動作和報告。 誰來告訴我,作為關心教育政策的公民,要到哪裡去找這些不應該是秘密的統計數字。如果我們要有一個更好的台灣,更好的教育政策,給孩子更理想的成長環境,除了打嘴砲,我們有更多該作的事啊…

Hat Problem: why you should care ?

這是一篇舊聞了,是紐約時報 2001年4月10日,科學版上的一篇文章。但是剛在 Digg 上發現,看到有超過七百人次「頂」這篇 Why Mathematicians Now Care About Their Hat Color,連上紐約時報仔細拜讀,才真正認識了這個不簡單的策略遊戲。 遊戲規則 數學界一般認為猜帽子顏色的遊戲是由 Dr. Todd Ebert (DBLP)在1998年,他的博士論文中提出來的。 這是一個團隊參與的遊戲,參與人數從三人到更多人都可以,遊戲的勝負是以整個團隊的結果來決定結果。在遊戲過程中,參與者每人頭上都戴著紅色或藍色的帽子,參與者只能看到別人的帽子顏色,但是不能看到自己的帽子顏色。每個參與者必須猜測自己頭上帽子的顏色,參與者之間不能有任何形式的溝通,只能觀察別人的帽子,然後猜測自己的頭頂是什麼顏色。 猜測的選項有三個,紅色、藍色或棄權(pass),如果覺得自己無法下決定,可以選擇 PASS。當參與團隊中每個有作出猜測的人(棄權的人就不管了)的猜測結果都正確,則這個團體可以獲得獎金。 依照遊戲規則,在觀察和猜測時,遊戲玩家間不得有任何溝通行為,但是在遊戲開始前,這個團隊可以作「策略」討論,遊戲開始後,所有成員根據大家事先協商的策略,來決定自己的行動(猜測或放棄)。這個遊戲的核心就是 :有沒有一個「贏的策略」?這個策略的成功機率有多高? 三個人的策略 以最簡單的三人情況來說,三個人都是紅色或藍色的機率各是八分之一,所以有四分之三(扣掉全藍及全紅的情況)的機會,是兩個人的帽子顏色相同,第三個人是另外一種顏色。因此有個可能比較容易贏的策略,每個參與者觀察另外兩個人的帽子顏色,如果這兩個人的帽子顏色不同,則猜測者選擇放棄;如果另兩個人的帽子顏色相同,猜測者猜自己的帽子是另外一種顏色。 雖然當三個人的帽子顏色相同時,以上辦法是絕對沒有機會贏的, 不過這是參與者數目為三人的最佳解決方案(optimal solution),以下是從網路上找到的證明。 Each guess has a 50-50 chance of being correct. This means that when we consider possible outcomes there must be an equal number of correct and incorrect…

大學的理想和性格

這學期修了一門和大學教育有關的課,需要交兩份和高等教育有關的報告,所以從書裡和網路上找了一些資料,將大學的源流和理念的遞嬗,作個簡短的筆記。資料主要參考自金耀基先生的『大學的理念』,以及某些大陸的網站。交出去的報告,說穿了,只是資料的整理(說難聽點,就是剪貼啦),沒有任何有意義的「意見」。不過大學理念的嬗變,值得記下來作為參考。 以下是報告中大學起源和理念闡述部份的節錄: 大學自其出現始,就因為其在文化傳承和社會進步上的特別作用而有別於其它機構。特別是一些經歷近千年風雨仍巍然自立的大學,因為其獨特的風格和對人類的貢獻而閃爍光芒。所以,大學是有精神的,唯其精神,使之能經世而獨立,歷久而彌新。在近代以來的大學發展史上,我們總是可以看見一些光輝的名字,如 Newman、FIexner、Von Humboldt、蔡元培、梅貽琦、Kerr等,大學功能的發展也從單純的「傳道授業解惑」到「以研究為重」再到今日的「教研並重並須服務於社會」,而 Kerr 更是用 Multiversity 來形容今天的大學,以表明今日大學功能之復雜、目的之多元。 大學的起源可以溯到中國的先秦,西方的希臘與羅馬。《大戴禮‧保傳》中寫道,「束髮而就大學,學大藝焉,履大節焉。」據此,大學應當是學大藝、履人大節的地方。漢代的人學、隋朝的國子監都是中國古代意義上的大學。中國古代四書之一《大學》的開篇之語,「大學之道,在明明德,在親民。在止於至善」,則可說是從某個方面體現了中國古代大學的精神和理念。但現代大學之直接源頭則是歐洲中古世紀的大學。大學是中古的特殊產物,中古是宗教當陽稱尊的世紀,他對西方文化的影響向來是學術上纏訟不休的事,但沒有人否認大學是中古給後世最可稱美的文化遺產。 大學的理想和性格幾個世紀來以發生許多的變化。第一本給大學系統性地刻畫一個明確的圖像的重要專著也許是十九世紀(一八五二)的牛津學者紐曼 (John H. Cardinal Newman ) 的「大學的理念」( The Idea of a University )。紐曼認為大學是一個提供博雅教育 ( liberal education ) ,培育紳士的地方。簡言之,紐曼之大學理想著重在對古典文化傳統之保持,教育之目的則在對一種特殊型態之人的「性格之模鑄」 (character formation ) 。紐曼的大學之理念顯然是「教學的機構」,是培育「人才」的機構。 洪博德(Karl Wilhelm von Humboldt,1767-1835)是19 世紀德國著名的教育家,由他倡導創辦的柏林大學,追求教學和科學研究相統一,使得科學研究職能在大學中得以確立。洪博德強烈主張,大學不僅僅是一個教育機構,大學更應是一個研究中心。一改過去歐洲中世紀大學僅是保存和傳授知識的傳統,認為大學應重在發展知識而不在傳授知識,大學應是知識創新的源泉。 德國大學的新理念,在美國大學的先驅者佛蘭斯納 ( A. Flexner )成書於一九三0年的「大學」( Universities ) 一書中獲得系統性的闡揚。他特別強調「現代大學」,以別於早他七十幾年的紐曼之「大學」。佛蘭斯納肯定「研究」對大學之重要,肯定「發展」知識是大學重大功能之一,但他卻給「教學」以同樣重要的地位。他指出:「成功的研究中心都不能代替大學」;也即大學之目的不只在創發知識,也在培育人才。 自二次大戰之後,大學教育在世界各地都有蓬勃的發展。而在美國尤其獲得快速與驚人的成長。在一八七六年前,美國只有書院 ( college ),還談不上有真正的大學,而此後在吉爾曼 ( Gilman ) 與愛略特 ( C….