新・上級C

新・上級Cコーステキスト

文書を開くパスワードは別途お知らせします。

学習指導案

■単元名
新・上級Cコース　Unit1, 2　タイタニック号データの分析

■単元の学習目標
タイタニック号の乗船者のデータから情報を導き出す。

■テーマ選定の理由
ビッグデータから数学、統計学、計算機科学を駆使して、意味のある情報、法則、現象間の関連姓などを導き出し、新たな価値をもたらすデータサイエンスの分野が注目を浴びている。実際のデータから情報を導き出す経験は将来役に立つと期待される。

■単元の学習計画
カリキュラム
タイタニック号からの生還　Unit1　60分
タイタニック号からの生還　Unit2　60分

■育成したい思考力
ロジカルシンキング

■評価計画
PythonのライブラリであるPandas、Seabornなどを使って簡単なデータの処理ができる。

■応用・発展
他のデータを使って、そこから意味のある情報を引き出してみる。

講義

Unit1からUnit8で使用するテンプレートプログラムを以下からダウンロードします。

Ex-Gram_7_DSandAI_Ver030001_template

Unit 1

Pandasの基本練習で使用するCSVファイルを以下からダウンロードします。

score

タイタニック号データの分析

　タイタニック号からの生還

Unit 2

タイタニック号データの分析

　タイタニック号からの生還

Unit 1 and 2 講義動画

学習指導案

■単元名
新・上級Cコース　Unit3-8　AI（人工知能）の初歩

■単元の学習目標
AIの初歩として回帰、分類、クラスタリングについて学ぶ。

■テーマ選定の理由
AIが様々な分野で活用されるようになってくると、その中の仕組みをある程度は知っておいた方が良いと考えられる。しかしながら、多くの生徒にとって、その機会は少ない。ここでは、AIの初歩的なテーマとして、回帰、分類、クラスタリングの3つに焦点を当て、その原理を学び仕組みを理解する。

■単元の学習計画
カリキュラム
AI（人工知能）研究の歴史
回帰　Unit3, 4　60分
分類　Unit5, 6　60分
クラスタリング　Unit7, 8　60分

■育成したい思考力
ロジカルシンキング

■評価計画
回帰について理解している。
分類について理解している。
クラスタリングについて理解している。

■応用・発展
ディープラーニングなどのAIの最先端技術について調べてみる。

講義

Unit 3

AI（人工知能）の初歩

　AI（人工知能）研究の歴史

　回帰

Unit 4

AI（人工知能）の初歩

　回帰

Unit 3 and 4 講義動画

Unit 5

AI（人工知能）の初歩

　分類

Unit 6

AI（人工知能）の初歩

　分類

Unit 5 and 6 講義動画

Unit 7

AI（人工知能）の初歩

　クラスタリング

Unit 8

クラスタリングの練習で使用するテンプレートプログラムを以下からダウンロードします。

clustering_template

AI（人工知能）の初歩

　ワインデータのクラスタリング

Unit 7 and 8 講義動画

学習指導案

■単元名
新・上級Cコース　Unit9-12　線形代数の初歩、主成分分析

■単元の学習目標

線形代数の初歩について学ぶ。
主成分分析について学ぶ。
分散と共分散にについて学ぶ。
アイリスのデータセットで主成分分析を行ってみる。
乳がんのデータセットで主成分分析を行ってみる。

■テーマ選定の理由
線形代数や高次元のデータセットの次元削減が行える主成分分析はデータサイエンスの基礎知識として重要である。その中身を理解することにより、今後のデータサイエンスやAIの学習をスムーズに進められるようにする。

■単元の学習計画
カリキュラム
線形代数ベクトル、内積など　Unit9　60分
線形代数行列、線形変換、固有ベクトルと固有値など　Unit10　60分
主成分分析分散と共分散、アイリスのデータセットの主成分分析など　Unit11　60分
主成分分析乳がんのデータセットの主成分分析など　Unit12　60分

■育成したい思考力
ロジカルシンキング

■評価計画
主成分分析について理解している。
簡単なデータセットの主成分分析を行うことができる。

■応用・発展
様々なデータセットで主成分分析を行ってみる。

講義

Unit9, 10で使用する線形代数の初歩のテンプレートプログラムを以下からダウンロードします。

Ex-Gram_8_linearalgebra_Ver030002_template

Unit 9

線形代数の初歩1

Unit 10

線形代数の初歩2

Unit 9 and 10 講義動画

Unit 11

Unit11, 12で使用する主成分分析のテンプレートプログラムを以下からダウンロードします。

Ex-Gram_8_PCA_Ver030001a_template

主成分分析

　分散と共分散

　アイリスのデータセットの主成分分析

Unit 12

主成分分析

　乳がんのデータセットの主成分分析

Unit 11 and 12 講義動画

新・上級C　課題

課題1 回帰の問題

ある野菜の販売データに基づいて、価格と販売数量の関係を予測する線形回帰モデルを作成し、訓練してください。
モデルを使用して、価格が110円のときの販売数量を予測してください。

以下のデータを使用します：

価格 (円)   販売数量 (個)
   50         200
   60         180
   70         160
   80         140
   90         120
  100         100

ヒント：

１．Pythonライブラリのnumpyとsklearnを使用すると便利です。
２．sklearn ライブラリを使用して、線形回帰モデルを作成するために

from sklearn.linear_model import LinearRegression

を使用します。
３．データは

X = np.array([50, 60, 70, 80, 90, 100])
y = np.array([200, 180, 160, 140, 120, 100])

のように与えるとよいでしょう。
ただし、reshapeが必要です。
４．fit メソッドを使用してモデルを訓練します。
５．predict メソッドを使用して価格が110円のときの販売数量を予測します。

課題2 分類の問題

以下の花のデータを使用して、花が「アヤメ」か「チューリップ」かを分類するモデルを作成してください。
モデルを使用して、新しい花（花弁の長さが5.0cmで花弁の幅が1.5cmの花）の花がアヤメかチューリップかを予測してください。

花    花弁の長さ (cm)   花弁の幅 (cm)   アヤメ (1) / チューリップ (0)
花1      5.1             1.4                    1
花2      4.9             1.5                    1
花3      5.8             1.8                    1
花4      5.0             1.4                    1
花5      5.9             2.0                    1
花6      4.7             3.2                    0
花7      4.6             3.1                    0
花8      4.5             3.4                    0
花9      5.5             4.1                    0
花10     5.7             4.2                    0

ヒント
１．Pythonライブラリのnumpyとsklearnを使用すると便利です。
２．データは

X = np.array([
    [5.1, 1.4],
    [4.9, 1.5],
    [5.8, 1.8],
    [5.0, 1.4],
    [5.9, 2.0],
    [4.7, 3.2],
    [4.6, 3.1],
    [4.5, 3.4],
    [5.5, 4.1],
    [5.7, 4.2]
])
y = np.array([1, 1, 1, 1, 1, 0, 0, 0, 0, 0])

のように与えるとよいでしょう。
３．sklearn ライブラリを使用して、Perceptronモデルを作成してください。

from sklearn.linear_model import Perceptron

を使用します。
４．fit メソッドを使用してモデルを訓練します。
５．predict メソッドを使用して新しい花の分類予測を行います。

課題3 クラスタリングの問題

以下の果物データを使用し、k-means法に基づいて果物を3つのクラスタに分けてください。

果物                 重さ (g)    直径 (cm)
りんご　　　(Apple)     150        7
バナナ　　　(Banana)    120        3
さくらんぼ　(Cherry)      5        1
ぶどう　　　(Grape)       5        1.5
オレンジ　　(Orange)    180        8
レモン　　　(Lemon)     100        6
メロン　　　(Melon)    1000       15

ヒント
１．Pythonライブラリのmatplotlibとnumpyとsklearnを使用すると便利です。
２．データは

X = np.array([
    [150, 7],
    [120, 3],
    [5, 1],
    [5, 1.5],
    [180, 8],
    [100, 6],
    [1000, 15]
])

のように与えるとよいでしょう。
３．sklearn ライブラリを使用して、k-meansクラスタリングを実行してください。

from sklearn.cluster import KMeans

を使用します。
４．fit メソッドを使用してクラスタリングを実行します。
５．labels_ 属性を使用してクラスタリング結果を確認します。
６．クラスタリング結果を表示し、各果物がどのクラスタに属するかを確認します。

新・上級Cコーステキスト

学習指導案

講義

Unit 1

Unit 2

Unit 1 and 2 講義動画

学習指導案

講義

Unit 3

Unit 4

Unit 3 and 4 講義動画

Unit 5

Unit 6

Unit 5 and 6 講義動画

Unit 7

Unit 8

Unit 7 and 8 講義動画

学習指導案

講義

Unit 9

Unit 10

Unit 9 and 10 講義動画

Unit 11

Unit 12

Unit 11 and 12 講義動画

新・上級C 課題

課題1 回帰の問題

課題2 分類の問題

課題3 クラスタリングの問題

新・上級C　課題