★ダイヤモンド・オンラインの記事「1学期の成績はどうなる?開成が行った「オンライン中間考査」の実態 ダイヤモンド・セレクト編集部 森上教育研究所 2020.5.26 4:25 」には、開成と武蔵のオンライン授業の成績の付け方について言及があります。
(開成の2013年から2020年までの海外大学の合格実績。データは同校サイトから。)
★新型コロナウイルスのパンデミックによる一斉休校が続き、ようやく分散登校へ移行する時期がきましたが、この3カ月間のオンライン授業による成績はどうするのか多くの学校で模索されています。
★そのような中で、同記事によると、武蔵はいわゆるペーパーによる「中間考査」はやらず、オンライン学習の成果物(課題プリントの痕跡や論述など)を「ルーブリック」で評価するということのようです。
★一方、開成は「中間考査」を行うようです。同記事にはこうあります。
「他校が次々と中間考査の中止を決める中、開成はきっちり行う方針だ。
3月末の段階で各学年から代表を得てICT委員会を発足、中間考査を行う前提で4月から授業を組み立ててきた。クラス単位だけでなく、グループごとに行うなどオンライン授業ならではの変化も持たせ、適宜アンケートを取り改善している。使用するシステムなどの検討もこの委員会で行っている。
中間考査の内容は学年や教員によってスタイルが異なる。小論文を読ませてレポートを提出するといった教科もあるが、オンラインで実施するものもある。高2生で見ると、前者は6科目、後者のGoogle Formなどを用いて実施するものが10科目とこちらが過半を占め、英数理社が多いという。」
★あれっと思われる方はいるでしょう。ペーパー試験かどうかでは、武蔵は、開成のようにいわゆる「中間考査」をやらないけれど、それは生徒のインプットの形態の違いであって、「評価」という観点からは同じではないかと。エっ!開成もルーブリック評価?
★実は同教育研究所の森上代表は、ご自身のfacebookでは開成も「形成的評価」をしているという認識をしています。しかし、メディアにはそこまでは書いていない。開成当局がそう言っているわけではないので、森上代表の意見になってしまうからでしょう。
★日本のメディアの教育関連記事は、世界標準の学問的見識をあえて持ち込まないので、当局がどう言ったかの文言を事実としてみなして書きますから、ややこしいのです。かりに武蔵が「ルーブリック評価」だと言おうが、開成が「ルーブリック評価」ではなく「中間考査」で、それ以上でも以下でもないといったとしても、世界標準の評価学の認識では、両方とも「形成的評価」です。
★武蔵の「ルーブリック評価」について、同記事ではこのように記載しています。
「 ルーブリック評価では、レベル分けされた学習者の到達点と評価観点のマトリクスを用いる。明確で公正な評価を、レポートや小論文、グループ活動など、日々の生徒のパフォーマンスに対して自己評価も交えて行う。脱ペーパー試験ともいえるもので、新しい評価のあり方でもある。」
★首都圏模試の「思考コード」と同じ発想ですね。というのも、この「レベル分けされた学習者の到達点と評価観点のマトリックス」の世界標準はブルームのタキソノミーのアレンジです。「思考コード」もそうです。新学習指導要領の「指導要録」も実はブルームのタキソノミーのアレンジ版です。
★ブルーム自身、「総括的評価」と「形成的評価」を分けています。いわゆる「中間考査」は「総括的評価」です。「ルーブリック」を使う評価を「形成的評価」といいます。
★しかし、開成の今回の中間考査は、いわゆる「中間考査」ではないのです。レポートなどの提出で付けるものは6科目で、10科目はグーグルフォームなどで行うとありますが、レポート提出の採点はそもそもルーブリックです。しかも開成もオンライン授業をやっているわけですから、教師と生徒の問答の軌跡は、実はリアルな授業と違い鮮明になります。思考のプロセスが1人ひとりリアルにみえてしまいます。開成の現場の教師はこのことについて明言しません。監視社会的なネガティブな風評のリスクマネジメントをしているから、それは当然です。
★だから、「形成的評価」とは明言しませんが、現場の教師の生徒を見る目は「形成的評価」です。つまり、頭の中に「ルーブリック」があるのです。暗黙知としての。
★でもそれは6教科の話で、残りの10教科はグーグルフォームでオンラインテストだから「総括的評価」でしょうと。それはそうなんです。しかし、グーグルフォームは選択肢問題だけでなく、記述式問題もOKなのはご承知でしょう。
★生徒が送信ボタンを押すや、300人の解答がスプレッドシートに即時反映します。
★スプレッドシート?要するにExcelという計算ソフトです。ついに学校現場が、この手法を手に入れたということが、実は今回のオンライン授業の革命的なところなのです!
★何万人も受験する模擬試験やセンター試験は、Excel表では間に合わないので、プログラミングしていますが、中身はExcelといっしょです。手作業の部分が自動化されているだけです。
★しかし、今までのように紙で試験を実施し、赤ペン使って採点していたのでは、一問一問の問いの意味を分析するのは、膨大な時間がかかります。ですから、総括的に点数加算だけで成績がついてきたのです。
★民間模擬試験やセンター試験は、一問一問に意味付けしますから、カテゴライズした成績表を出すことができます。ところが、そのカテゴライズが分野別どまりというところが多かったわけです。ブルームのタキソノミーのアレンジでやってきたところは、日能研と首都圏模試センターです。前者は「科目コード」、後者は「思考コード」です。前者はテストを作成するソフト部署が主にテストをブラッシュアップするエビデンスとして活用し、後者は生徒が自ら自分の学びを改善できるように公開されています。
★評価測定学では、3つの評価と呼ばれています。「総括的評価」「形成的評価」「メタ認知評価(モニタリング評価)」です。日能研は、テスト作成者のモニタリング評価として主に活用されているし、首都圏模試では、テスト作成者と生徒の学びの両方のモニタリング評価として使われています。もちろん、「総括的評価」を偏差値として生徒に提供してもいます。
★開成の話に戻りましょう。スプレッドシートに生徒の答案が集計されるということは、列や行にコードを振っておけば、簡単にカテゴライズできるのです。日能研や首都模試レベルのモニタリング評価を現場教師ができてしまうのです。
★エッ!開成が模擬試験会社と同じようなことをしようとしますかねえと思われる方もいるでしょうが、そうじゃないんです。日能研は、米国のSATを実施しているETSというテスト測定NPOの仕組みをちゃんと学んでいます。首都圏模試もそのような知恵のあるスタッフが「思考コード」を作成・運営しています。
★いったいどういうこと?と思われるでしょう。SATは、米国の大学を受験するときに必要な試験の1つです。その仕組みは当然ブルームのタキソノミーがアレンジされています。ETSは生徒の評価を当然分析して、大学のコンサルティングをするわけですから、総括的評価の分析を大学に持ち込むわけではありません。
★このかつてハーバード大学の総長がたちあげたETSの流れが、テスト測定学という教育心理学や認知心理学の学問を生み出します。最近日本でも教育もデータエビデンスをと言われるようになりましたが、それはこのテスト測定学が集積した膨大だデータによるエビデンスも入っています。
★なんで、テストに心理学?と思われる方もいるでしょう。もともと心理学はアンケートをよくとりますよね。アンケートって問いと回答の応答です。その応答のことを「反応」と心理学では呼びます。
★もうおわかりでしょう。テストも問いと解答の応答です。ですから、模擬試験会社では「正答率」と表現することが多いですが、あれは「反応率」と同じなのです。
★したがって、膨大な反応率データを分析するテスト測定学の中で多く活用されている理論が「項目反応理論」です。「IRT」と呼ばれているものです。そういえば、センター試験やあのPISA、英検などで「IRT」という文字がでてくるとピンと来た人もいらっしゃるでしょう。
★「IRT」とブルームのタキソノミーは結合しやすいのです。IB(国際バカロレア)は、総括的評価と形成的評価を使い分けしています。しかし、それを結合しようとしています。どうやって、ブルームのタキソノミーをつかってです。選択式問題も出題されるので、IRTは当然活用しているでしょう。
★スプレッドシートにタキソノミーの観点をふれば、総括的評価を出す目的の試験が、形成的評価もできてしまうのです。この考え方はもともとブルームが考案しています。テストの形態と評価を区別する文化が日本にはなかったので、ここらへんの話はややこしいと思われがちです。
★今まで日本の教育は、テスト=総括評価だったのです。平均点とか偏差値とかをだしてきました。これによって、生徒のランキングやポジショニングがだされ、もっぱら競争のためにだけ、テスト=総括的評価が使われていたので、わざわざ総括的評価と言う必要がなかったのです。むしろ、テスト=偏差値となってきたわけです。
★しかし、一つのテストは問いの意味のカテゴライズによって、総括的評価、形成的評価、モニタリング評価の3つの側面からアプローチできます。開成や武蔵は、中間考査を実施するしないという文言はともかく、この3つの評価のアプローチを現場の教師が自ら使えるようになってしまったということなのです。もちろん、伝統的に暗黙知として現場の教師は知っていたことです。
★しかし、欧米では教育測定学として学問として見える化されてきているわけです。
★開成は、特に2013年から海外大学に進学する生徒が増えています。この流れが継続されてきたということは、学校当局が全く海外大学進学指導をしていないとはいえないでしょう。海外大学の進学を射程に入れると、この項目反応理論とかブルームのタキソノミーは、これらの言葉をつかうかどうかはともかく、そのエッセンスを無視することはできないのです。
★ですから、今回中間考査にグーグルフォームを活用して総括的評価を出せるようにしたという行為こそ、3つの評価のアプローチを現場に持ち込むことになったという画期的な教育を生み出したといえます。
★この動きが加速すれば、入試問題は学校の顔です。オンライン入試も広がっていくでしょう。
★もちろん、本間がいうことなんてといわれる方も多いでしょう。でもオンライン入試がはじまって、グーグルフォームを使い、思考コードを合体させると、3つの評価の有効性を認識し、現場の授業もそれによって変わるということが起こるかもしれません。
★教育ジャーナリスとやメディアの方の多くは、テストデータ=偏差値ですから、なかなか教育測定学をみようとしないでしょうが、これからのICTに長けた新しいジャーナリストに期待しようと思います。
最近のコメント