🗂

AIエンジニアの学習方法論 ③英語で情報を得るために

2024/12/17に公開

英語で情報を得られるようになるために

この記事はambr, Inc. Advent Calendar 2024の17日目の記事で、AIエンジニアの学習方法論シリーズの第三弾です。スキルを得るためのスキルであるメタスキルに焦点を当て、初回は学習の基本第二回は情報リソースの探し方について考えましたが、今回は英語力に着目します。

IT技術、特にAI関連の情報は、そのほぼ全てが英語で発信されています。企業のブログ、デモ動画、ドキュメント、論文といった多様な形式で表現されていますが、英語が理解できない場合は翻訳ツールや他者による要約記事に頼ることになります。しかし、こうした方法では発表からの時間的ギャップや情報の欠落が生じやすく、効率が悪くなってしまいます。そのため、英語で情報を直接活用できることは、AIエンジニアにとって大きな武器となると思います。

例えば、何か新しいAIモデルを実装する際、えてして上手くいかないことがあります。その原因を調べて対処する必要がある場合、ウェブ検索で見つけたブログ記事やフォーラムの投稿が参考になることもありますが、それらが正確で有用な情報を提供しているとは限りません。一方で、多くのAIモデルは関連する論文が公開されており、そこにはアーキテクチャの選択理由、データセットの詳細、損失関数の選定といった重要な情報が含まれています。これらの原典に直接アクセスできる英語力は、問題解決の際に最も信頼できるスキルとなるでしょう。

とはいえ、「いつか英語を勉強しないとなぁ…」と思いつつも、勉強の時間が取れなかったり、始めても長続きしないという方も多いのではないでしょうか。僕も社会人になるまで、仕事で使えるレベルには全く達していませんでした。しかし、試行錯誤の中で自分に合った勉強法を見つけた結果、今では難なく英語を読んだり聞いたりすることができるようになりました。そこで今回は、英語で一次情報を得られるようになるための僕なりの英語勉強法をまとめたいと思います。全てがそのまま当てはまることはないかと思いますが、少しでもヒントになるようなことがあればうれしいです!

対象読者

”英語で情報を得るスキル”を身に着けたい方を念頭に置いております。そのため、以下では、いわゆるリスニング・リーディングスキルに注力しており、英語力試験のスコアアップや、英語でのアウトプットスキル向上には直接つながらないかもしれません。

ただ、後で触れるように、言語学習の鍵はインプットにあると考えています。個人的にも、インプット中心の学習をしていると、意識的にスピーキングのトレーニングを積んでいないにもかかわらず、いつの間にか気が付いたら日常会話やビジネスシーンでの英会話もできるようになっていたという経験があります。そのため、アウトプットスキルを重視したいという方にとっても、インプット中心の学習は必須であると考えています。

スキルのスタートラインは特に想定しておりませんが、中学卒業時程度の語彙があればまずは十分だと思います。

目指すスキルレベルの目安としては、リーディングについては技術ブログや論文がスラスラと理解できるレベル、リスニングについては自分の興味範囲のトピックであれば字幕なしで聴いて理解することができるレベルです。語学テストスコアでは、英語圏での英語運用力の評価に用いられるIELTSではC1レベル(英語圏大学入学のために必要な標準ライン)、TOEICでは945~990程度です。

Comprehensible Inputの最大化

人間が外国語を学ぶ機構については古くから研究されていて、その有力な理論の一つとして、インプット仮説と呼ばれるものがあります。この仮説では、言語能力の獲得に最も相関のあるものはcomprehensible input(理解可能なインプット)の量だとされています。

この理論においては、学習者の言語力をiとしたとき、comprehensive input = i+1、つまり現状の能力よりも少し難しい内容が、最も学習に効果的なインプットであるということになります。具体例としては次のようなものがあります。

”Yesterday, I went to the park and saw some ducks swimming in the pond.”

このとき、学習者が”duck”と”pond”という単語の意味を知らなかったとしても、他の既知の語彙やそのコンテキストをもとにして、全体の文意をおおよそ推定することが可能です。

また、Input Hypothesisではこのcomprehensible inputが学習に最も重要であると考えるので、逆に言えば、直感には反しますが、声に出して読み上げる、何度も紙に書いて覚えるなど、アウトプットの練習をすることと、言語能力向上とは比較的相関が少ないということになります。

では、どのようにすればこのcomprehensible inputを最大化することができるでしょうか?

学校で英語を勉強したはずなのに…

日本では現在高校を卒業するまでに、少なくとも授業時間換算で600時間以上英語を勉強することになっています。しかし、大半の人は実際に使える状態になっていないのが現状です。私は上記の考えを踏まえ、この原因は英語教育におけるcomprehensible inputの軽視にあると考えています。典型的な授業は、まず例となる文章を読み、上から順に訳していき、適宜重要な文法・構文・単語の説明されるというように進行します。このような授業においては、純粋な意味でのinputの時間は一割にも満たないでしょう。これでは効果的に英語力を向上させることはできません。

また、単語テストや英文日本語訳テストに代表されるように、日本語を対応させる形を英文理解のベースに据えていることも問題だと思います。これによって、多くの人は英語を読んだり聞いたりする際、半ば無意識に日本語に変換してしまう癖がついてしまっています。しかし、この方法では処理スピードが遅くなり、特にリスニングによる理解の制約になってしまいます。また、言語間での翻訳時には、日本語の「いただきます」を英訳することが難しいように、オリジナルの意味を100%保持することはできず、意味が失われたり変わってしまうことは避けられません。そのため、このような英語↔日本語の回路を切り、英語は英語のままで理解するように意識していくことも重要です。これには、後でも紹介しますが、英語↔日本語の単語帳を作らないこと、英語学習時は日本語を使わないようにすることなどが効果的です。

教材の選び方

以上のことから、言語理解のためにはcomprehensible inputの量を最大化していく必要があります。以下では、それに適した教材や学習方法を紹介いたします。

まず、一番最初に取り掛かる教材として、初心者向けの平易な語彙で構成されたものを選びたくなると思うのですが、これはあまり適切とは言えません。理由は、簡単なものは往々にして内容がつまらなく、モチベーションが続かないからです。そのため、たとえ難解な語彙で書かれていようと、自分が知りたいことや興味のあることから選ぶのが効果的です。

リスニング

単位時間当たりのcomprehensible inputを最大化するために適しているのは、PodCastや発話密度の高いYouTubeコンテンツです。特に学習の初期段階ではほとんどが聴き取れず、理解できないまま終わってしまうことがあります。これではcomprehensibleでないinputになってしまい、学習効果が薄くなります。幸い、PodCastやYouTubeは字幕をつけられるので、これを活用すると効果的です。リスニング時は可能であればシャドーイングすることがおすすめです。長時間リスニングをしていると、いつのまにか頭の中で違うことを考え始め、聞いてるつもりが全く聞いてなかった、ということがよくあります。シャドーイングをしていると、意識をキープし続けることができ、また、どこが聴き取れなかったのかも分かり、振り返りやすくなります。

私の英語学習用の個人的な推奨コンテンツは、MattさんのYouTubeチャンネルです。彼は日本語がペラペラのアメリカ人で、言語学習の理論を紹介する動画を多くアップしています。例えばWhy You Can't Understand Sentencesでは、単語の意味を知っていても文章の意味が分からないことがあるのはなぜなのか、ということを理論的に分かりやすく説明しています。また、上記のinput hypothesisの提唱者であるStephen Krashenのインタビュー動画もあります。特に彼が日本語を勉強した際のエピソードを例に挙げている点は、親近感を持って理解しやすいと感じました。また、理論に基づきながら誠実に話す姿勢や、彼が話す英語自体のクリアな発音もかっこよくて魅力的です。

その他には、前回の記事でも紹介しましたがLex Fridman Podcastもおすすめです。AI技術に関わる主要人物を中心とした長時間インタビューになっています。英語の勉強のついでにAIの勉強もできてしまいます。私が好きなエピソードは、DeepMind CEOで今年ノーベル物理学賞を受賞したDemis Hassabis、同じくDeepMindのAlpha Go開発者のDavid Silver、LLVM・MLIRなどのコンパイラやSwift開発者のChyris Lattnerのインタビューです。

また、よく紹介される英語勉強法として洋画や洋楽、ドラマシリーズがありますが、これらは時間当たりのinputの密度が低いという理由から必ずしも効率的ではありません。ただし、学習モチベーションを高める上では良い刺激になることが多いので、間接的な手段として利用するのは有意義だと思います。

本記事は主に技術情報を扱う方を想定しているので少し逸れてはしまいますが、文学や物語文を読めるようになりたい方には、Netflixのaudio descriptions機能が非常に役立ちます。この機能は、本来は目の不自由な方も映像作品を楽しめるように設計されたもので、ナレーターの方が人物や状況の描写を声に出して読み上げてくれます。特に小説などの描写は本を読んでいるだけだとイメージがしづらいものですが、この機能を使うと言葉とイメージとを結びつけて理解することができるようになります。

リーディング

洋書をどこで手に入れるのかということについては、Amazonなどネットで購入することも可能ですが、最初は実物を確かめながら選ぶ方法が効果的です。書店の中では丸善が質量ともにラインナップが優れていて便利です。

知らない単語に出合ったら

本を読んでいる際、多くの知らない単語が出てきます。その度に意味を調べたくなるものですが、都度調べることは推奨されません。理由としては、読書のリズムを失ってしまうこと、読んでいく間に意味が分かってくることが多いことがあげられます。どうしても気になる場合は、メモしておいて、きりがいいところまで読み進めてからまとめて調べると効率的です。

また、調べ方についてですが、辞書で意味を調べてもよく分からないということがあります。そういったときはetymology(語源)をChatGPTに質問しています。語源を知ることで、その語のつづりから意味を類推できるようになったり、他の語との関係も見えてきて、理解を深める上で役立ちます。

英語環境を作る

ネットで調べようとすると、英語で検索しているにもかかわらず、どうしても日本語訳や日本語ページが多く表示されることがあります。そのため、私はGoogle Chromeで英語用アカウントを別に用意していて、日本語の記事が検索結果に含まれないように設定して、アカウントを使い分けています。

また、ChatGPTを使うときも、特別な事情が無い限りは英語で使うようにしています。日本語でプロンプトをするよりも精度の高い回答が得られるからです。英語でプロンプトすることが難しい…という考えもあるかもしれませんが、スペルを間違ったり、文法が多少崩れていても、たいていの場合は意図を正確に汲み取ってくれるため、問題ありません。

(蛇足)ChatGPTで翻訳できるから、今更英語を学ぶ意味ってないんじゃない?

正直なところ、この疑問に対する答えは自分なりにはまとまっていません。そうかもしれないし、そうじゃないかもしれないとも思っています。

翻訳ツールを使えばすぐに翻訳することができますが、面倒さは依然として残っているのではと思います。”いつでもすぐに翻訳できるから”とは言いながらも、その面倒さからか、海外企業のブログ記事を読んだり、英語論文を読んだりすることへの障壁になっているのではないでしょうか。

また、上でも触れましたが、言語間の翻訳には限界があり、オリジナルの意味を完全に別の言語で再現することはできず、ニュアンスが変わってしまったり、意味が欠落してしまう点もあげられます。

最後に、考えや価値観の相対化するためのツールとしての第二言語の価値は失われないと思っています。例えば”幕府”という分かるようでいざ説明しろと言われると困ってしまう言葉がありますが、英訳を見てみるとmilitary governmentとあり、つまり軍事政権のことなのだと理解することができます。このように、外国語と比べたり、外国語ではどのように表現されるのかなどを考えることを通して、思考をより明確にできることがあります。ちなみに上の幕府の例は、田中泰延さんの著書『読みたいことを、書けばいい。』で紹介されていたものです。

最後に

以上、AIエンジニアの学習方法論と題し三回に渡って、スキルを得るためのスキルであるメタスキルについてまとめました。

第一回では「学習の基本」として、学びを継続し、深めるための考え方を紹介しました。第二回では「情報リソースの活用」を通じて、膨大な情報の中から必要な知識を効率的に得る方法をお伝えしました。そして今回、第三回では「英語学習」に焦点を当て、AI分野で活躍するための一次情報へのアクセス方法や言語スキルの重要性を考えました。

どのスキルも習得には時間がかかるものですが、続けることで必ず成長を実感できるはずです。私自身もこれらのスキルを学ぶ過程で、多くの試行錯誤を繰り返しましたが、そのたびに新たな視点を得ることができたと感じています。

これからもAI分野は急速に進化していくでしょう。新しい技術や情報に触れるたびに、それを活用する力がますます重要になっていくと思います。これを読んでいただいた方が、何か参考になる部分があって、学びを深めるヒントになるようなことがあれば嬉しいです!これらを通じて、AI技術の発展に間接的にでも貢献することができたということであれば、私にとってそれ以上の喜びはありません。最後まで読んでいただいてありがとうございました!

GitHubで編集を提案
ambr Tech Blog

Discussion