Brezina, V., & Gablasova, D. (2015). Is There a Core General Vocabulary? Introducing the New General Service List.

Brezina, V., & Gablasova, D. (2015). Is There a Core General Vocabulary? Introducing the New General Service List. Applied Linguistics, 36(1), 1–22. https://doi.org/10.1093/applin/amt018

Abstract

本研究では,New General Service List (new-GSL)を紹介する。このリストは,合計で120億語の語彙tなる4つの言語コーパス(LOB, BNC, BE06, and EnTenTen12)の厳密な比較の結果としてできたものである。コーパスサイズ,そして,代表性やサンプルへのアプローチの違いを示すために4つのコーパスが選ばれた。特に,本研究では,語彙項目の頻度と分布を考慮に入れたAverage Reduced Frequency (ARF)を基にした上位3000語において,コーパス間の語彙的重なりを調査した。結果として,4つのコーパスの間で,2,122 items (70.7%)の安定した核となる語彙(vocabulary core)が存在することが分かった。さらに,これらの語彙は個々の語彙リストにおいて同じような順位で出現している,new-GSLを作成する中で,核となる語彙は,現在的な言語使用を反映したコーパス(BE06 and EnTenTen12)にみられる新しい語彙と組み合わされた。最終的な成果物として,new-GSLは2,494のレマにより構成され,元となったコーパス内のテキストにおいて,80.1~81.7%のカバー率を示した。

The current study presents a New General Service List (new-GSL), which is a result of robust comparison of four language corpora (LOB, BNC, BE06, and EnTenTen12) of the total size of over 12 billion running words. The four corpora were selected to represent a variety of corpus sizes and approaches to representativeness and sampling. In particular, the study investigates the lexical overlap among the corpora in the top 3,000 words based on the average reduced frequency (ARF), which is a measure that takes into consideration both frequency and dispersion of lexical items. The results show that there exists a stable vocabulary core of 2,122 items (70.7%) among the four corpora. Moreover, these vocabulary items occur with comparable ranks in the individual wordlists. In producing the new-GSL, the core vocabulary items were combined with new items frequently occurring in the corpora representing current language use (BE06 and EnTenTen12). The final product of the study, the new-GSL, consists of 2,494 lemmas and covers between 80.1 and 81.7 per cent of the text in the source corpora.

広島大学附属中・高等学校 教育研究大会@広島大学附属中・高等学校 講演「自律的な学習者の育成を目指した英語語彙指導」

ご縁あって,10月15日に広島大学附属中・高等学校 教育研究大会にて,「自律的な学習者の育成を目指した英語語彙指導」という講演をさせていただいた。

最初のご依頼は研究大会のテーマにであるアクティブラーニングに絡めた語彙指導ということだったのだけれど,私のアクティブラーニングに対する勉強不足で,少し変更していただき,「アクティブ・ラーニング型の授業における教科固有学力の保障」ということにさせていただいた。

内容としては,2015年12月20日に関西英語教育学会第37回KELESセミナーで一緒に登壇させていただいた関西大学の水本篤先生の語彙方略の話を自分なりにまとめ直したものから始め,2016年8月6日に外国語メディア教育学会のワークショップで勉強させて頂いた武蔵中・高等学校の手島良先生の指導を手本に新出語彙の読み方の指導,最後に,ここしばらく勉強している接辞の付与の活動を通して形態論的気づきを向上させる指導の話をした。よくよく考えると,他の先生方から教えて頂いたことをそのまま話しているだけのような気もするけれど,私個人でお話できることなど限られているので,勉強したことを共有するという形でお話をすることしかできないのですね。

そもそも話としては,アクティブラーニングは良いけれど,それに伴って,語彙(と語彙方略)を明示的に教える時間的余裕がないのは本末転倒で,語彙の提示や課題の与え方で,語彙への向き合い方を学習者に教えましょうということ。アクティブラーニングとして,意見の交換などをさせるときに,語彙リストだけ渡して,これで教材読んで,意見をまとめて,それを話せるようにしましょうというのは無理な話なので,どの段階で,どのように,語彙を紹介するかを考え,そこで学ぶ方法も提示してあげたいですよね…という「言うは易し,行うは難し」だけど,聞けば「そうりゃそうだ」と言うことをお伝えしたかったわけです。

教育研究大会で個人として学びが大きかったのは,午前に行われた研究授業。アクティブラーニングを勉強していらっしゃる先生方が,「先ずはこんな形でやってみた!」という感じで実践されていて,すごく良いところと,疑問符がついてしまうところが混在してた。他の参加者と話していても,「自分だったらこうしよう」とか,「あそこは真似できそう」と言うのが多かったので,研究授業を通したアクティブラーニングという感じでした。

個別にフィードバックをPDFで返却する

受講生のスピーチについては,他の受講生からのピア・フィードバックがあったほうが良いと思うので,Google Formを使って評価やコメントをしてもらい,それを後日,エクセルでまとめ,ワードの差し込み印刷で印刷したものを個別に配布している。授業の中で時間がないなどで個別に配布できない場合には,PDFにして,メールで送信している。Bb9上でやり方があればそれに移行したいのだけれど。さておき,その方法のメモ。

  • エクセルでまとめて,差し込み印刷まではこれまで通り(今後,時間があれば,メモを書くかも。)
  • 差し込み印刷時にPDFで印刷すると,個別の評価表はいった1つのファイルができる。受講生が20人であれば,20ページのPDF(例:SpEva.pdf)ができる。
  • できたファイルは,Acrobat DCでファイルの分割を行う。
  • するとSpEva_Part1.pdf~SpEva_Part20.pdfの20のファイルができる。
  • SpEva_Part1.pdfを「学生番号.pdf」にする
  • テキストファイルで,以下のように記述
    • ren SpEva_Part1.pdf 学生番号1.pdf
    • ren SpEva_Part2.pdf 学生番号2.pdf
    • pause
  • 保存後に,.txtを.batに変更
  • できた.batをSpEva_Part1.pdf~SpEva_Part20.pdfの入っているフォルダ内でダブルクリックすると,ファイル名が,学生番号1.pdf~学生番号20.pdfへと変わる。

とりあえず,この状態で,メールを作成して添付しまくる方法で配布。学生数が多い場合には,自動でできるように考えよう。

Bb9でアップロードしたテストのオプションを一括で変える

やりたかったことは,Bb9にテキスト形式でアップした選択問題で,その解答をランダムに配置することと,水平に配置すること。Bb9では,質問や問題をランダムに出すことができるけれど,解答をランダムにするには,質問や問題を1つ1つ編集しなければいけない(「ランダムな順序で解答を表示」にチェックを入れる。)

なぜこれが必要かと言うと,テキストファイルで,

|質問|選択肢1|correct|選択肢2|incorrect|選択肢3|incorrect|

とすると,答えがいつも一番最初の選択肢の位置に来てしまうから。これを出題するたびにランダムに変えたい。

どうしてもわからなかったので,情報メディア教育研究センターに問い合わせをしたところ,丁寧な解答をいただいた。以下,引用:

 1. テストをエクスポート
     (複数のXMLファイルをZIPしたものがダウンロードされます)
  2. エクスポートされたファイルを編集
  (「ランダムな順序で...」の設定を記述しているところを一括置換)
  3. テストをインポート
  (同名のテストが2つできますので、新しい方の内容を確認した上で古い方を削除)

という手順になります。以下、具体的な操作手順を書きます。

 1. テストをエクスポート
 1.1 [コントロールパネル]→[コースツール]→[テスト/アンケート/プール]→[テスト]
 1.2 処理したいテストのアクションリンク (v) をクリックし[エクスポート]
 
 2. エクスポートされたファイルを編集
  2.1 zipファイルがダウンロードされてくるので、それを展開
  2.2 展開されたファイル群のうち、res00001.dat をエディタ(メモ帳, TeraPad, 秀丸とか)で開く
  2.3 render_choice shuffle="No" をすべて render_choice shuffle="Yes" に置換する
  2.4 エディタでファイル保存し、終了
  2.5 展開されたファイルをすべて選択して右クリック、[送る]→[圧縮(zip形式)フォルダ] を選ぶ
  
 (注) 2.5 でzipファイルを作成するさい、res00001.dat と同じフォルダ内にあるものを全部選択して行ってください。これらを含むフォルダを選択してzipファイルをつくるとうまくいかないので注意してください。

  3. テストをインポート
  3.1 [コントロールパネル]→[コースツール]→[テスト/アンケート/プール]→[テスト]
  3.2 [テストのインポート]をクリック、2.5 で作成したzipファイルを選択して[送信]
  3.3 元のものと同じ名前のテストができる。最終更新日を見て、新しくできた方の中身を確認してください

ちなみに,選択肢はデフォルトでは垂直に配置されるので,それを水平に配置したい場合には,

<bbmd_orientationtype>vertical

<bbmd_orientationtype>horizontal

と置き換える

Excelである範囲から適当に単語などを持ってくる

分かりにくいタイトルですが,やりたいことは,

1)Sheet1に問題文として「I have a (  ).」がある.

2)Sheet2のA1~A90に単語が適当においてあるので,A1~A10で1つ,A11~A20から1つ…と言うように,A1~A90から9つの単語を選びたい。

3)正解の単語は,Sheet1のA2に”pen”として入れてあり,A3~A12までに選んだ単語を入れる。

【方法】

・A3に以下を入れる。

=INDIRECT(“Sheet2!A”&INT(RAND()/0.1)+1)

  • INDIRECTは,セルの参照を返す
  • INTは整数を返す
  • RAND()で乱数を発生させて,0.1で割ると0~10の乱数が発生する。0だと困るので,+1をして,必ず1以上が出るようにする。

・A4には以下を入れる(注:10*RAND()の部分は,RAND()/0.1と同じ意味になる)

=INDIRECT(“Sheet!A”&INT(10+(10*RAND())+1)

・A5は20,A6は30を入れていけばよい。


7月5日追記

INTを使うと小数点以下が切り捨てられてしまうので,場合によっては,最大値が出ないことになるので,例えば,round関数を使って,小数点第1位を四捨五入すると良いかもしれない。

=INDIRECT(“選択肢プール!A”&ROUND(11+10*(RAND()),0))

とする

 

Hernández, Costa & Arnon (2016). More than words: multiword frequency effects in non-native speakers

Hernández, Costa & Arnon (2016). More than words: multiword frequency effects in non-native speakers, Language, Cognition and Neuroscience, DOI:10.1080/23273798.2016.1152389

 

Abstract

英語の母語話者は複数の語からなる句(Multiword phrases)の頻度に敏感である。つまり,全ての語の頻度を統制したのちに実験をすると,より句として高い頻度のものをより速く処理する(例:高頻度:Don’t have to worry vs. 低頻度:Don’t have to wait)。さて,遅い時期に学習を始めた中級から上級の(英語)学習者(late English learners)もまた,大きな言語単位,ここでは4語の組み合わせ,の分布特性に敏感なのだろうか。本研究では,句性判断課題を用いて,学習者も英語母語話者と同様に,複数の語からなる句の頻度を処理していること示した。これは,頻度のより高い句に対してだけでなく,頻度の連続体を通して見られた。すなわち,英語母語話者と同様に,学習者も,より低い頻度の句とより高い(しかしそれでも頻度としてはまだ低い)句を比べた場合においても,複数の語からなる句の頻度効果を示した。加えて,この効果は英語の接触の種類(イマージョンか,教室内か)により変わるものではないことも示された。これらの結果から,遅い時期に学習を開始した言語使用者であっても,母語話者並みに,大きな言語単位の分布特性への敏感さを発達させることができることが示された。

 

2016/5/11

おおよそ1ヶ月ぶりの投稿。3月と4月の忙しさは半端じゃなかった。特に何をしたという記憶がないくらいに,ただただ通常業務に追われる日々でありました。この時期はそんな感じで過ぎていくものの,夏の学会発表への応募締め切りもあったりで,研究のことを頭の片隅で考えながら,日常業務をこなしていくのはなかなかしんどい。論文を読む時間が取れないので,当然,書く時間は取れず,しかしながら,手持ちのデータで学会発表までこぎつけないと研究から遠ざかるばかり。発表しようという気持ちがだけがどうにか研究活動を支えているような気がする。

授業の方もGWが終わり,本格的な感じになってきた。スピーキングのクラスは個人スピーチとグループ発表に向けて少しずつ加速して行く感じか。スピーチの基礎的なことはおおよそカバーしつつあるので,あとは各人に練習してもらい,出来を見るという感じ。

TOEIC関係の授業もそれなりに進んでいる。攻略法というよりも,どんな視点で繰り返し公式問題集を勉強するのが良いのかという話と単語テストで毎回が進んでいく感じ。答えも分かっている公式問題集の問題をランダムに出題して,8割以上を取れないと,やっぱり勉強してないよねー。という嫌がらせをいう授業。単位も出ない参加自由な授業なだけに,残っている人はやる気あるので,それぐらいは言いますよ。そして,授業出ているだけじゃ,得点は上がりませんぜ…というのも理解してもらわねば。

1 9 10 11 12 13 15