中高生のためのプログラムで理解する線形代数の講座を始めました

サイエンス記事

中高生向けの線形代数の講座をスタート

2021年11月から「データサイエンスとAIの初歩」講座ではCコースを増設しました。プログラムを使って視覚的に線形代数を理解し、その応用として、主成分分析、自然言語処理を行う講座です。

なぜ中高生に線形代数が必要か?

線形代数は大学の初年度で学習することが多いかと思います。しかしながら、高校生の新学習指導要領を見ると選択科目ではありますが、「情報II」で主成分分析を扱っています。これをきちんと理解するには線形代数の知識が必要となります。

主成分分析に限らず、これから活躍するAI人材を育成していくには早いうちから線形代数を学んでおくのが得策でしょう。

しかしながら、中高生向けの線形代数の教材はなかなか見つかりません。ならば作ってしまおうということで始めたのですが、プログラムを活用することで結果をその場で視覚的に表現できるため、中学生・高校生でも理解できるはずです。もちろん、大学生にも役立つものと思います。

講座の概要

ベクトルや行列について学びます。

プログラムを使って簡単にベクトルを図示することができます。

行列を使った線形変換もプログラムで図示することで理解が深まります。

下図では平面上の青い格子点が赤の点に変換されています。

応用として主成分分析で乳がんデータの分析を行います。

たくさんの人の乳がんのデータがあるのですが、悪性か良性かを説明するための変数が30種類もあります。そのため、そのままではどの変数が悪性か良性かに効いているのかわかりません。これらの変数から主成分分析により新しく2軸を作ってプロットしたのが下図です。malが悪性、benignが良性ですが、2つの主成分でほぼ分離できていることがわかります。

さらに線形代数の応用として自然言語処理も扱っています。

文章は下図のように単語ラティスにすることにより、スコアの高い経路を見つけて品詞分解することができます。

分解された単語をベクトル化することにより単語どうしの演算ができるようになります。

有名な

king – man + woman = queen

のような演算ができるのです。

興味があれば自由に学びましょう

ある学習単元、例えば「行列」が学習指導要領にあるとかないとか議論されているのをよく目にします。しかしそんなことはある意味どうでもよいことです。将来重要になると思われることや自分の興味のあることはどんどん学んでいきましょう。そういう教材を少しずつでも増やしていきます。