top | サイトマップ | 講義 | 名古屋大学数学教育セミナー | 大学数学基礎教育ネットワーク | 数学教育 | リンク | 連絡先
講演内容アブストラクト
1.データサイエンスとは?
 竹村 彰通


   本年4月に日本初のデータサイエンス学部が滋賀大学に開設された。定員は1学年100名である。私はこの学部の開設まで2年以上準備に関わり、学部のカリキュラムや育成する人材像について検討を重ねて来た。
   まず、データサイエンスとは何かということについて、滋賀大データサイエンス学部の考え方を述べる。よく言われることであるが、最近はビッグデータの時代である。そしてビッグデータから有用な価値を引きだすための学問がデータサイエンスである。
   その技術的基礎はデータを処理するための情報学及びデータを分析するための統計学であり、この部分は理系的である。しかしデータサイエンスの応用分野は人々の行動を記録したデータなど文系的な分野のデータが多く、この意味でデータサイエンスはすぐれて文理融合的である。
   本講演では、データサイエンスの文理融合的な性格、育成する人材像、文理融合的な人材を集めるための入試などについて説明する。
2.統計学と数学
 竹村 彰通

   ここでは、データサイエンスに具体的にどのような数学が必要とされるかについて、主に私の専門である統計学の観点から論じる。
   まず線形代数であるが、具体的な行列の記法や演算が統計学に必要なことは表計算ソフトの使い方を考えると理解できる。表計算ソフトのシートに数値データを入力すれば、そのシート自体を行列と考えることができる。そしてそれらに対してさまざまな統計的な計算をおこなうことは、行列の操作と考えることができる。次に、微分や積分であるが、これらは多項式などの滑らかな関数について学ぶことが多いが、統計学では実は離散的な場合の差分や和分に慣れることが必要である。例えば、ある店の毎月の売上高のように一定の時間ごとに観測される時系列データについては、原系列とともに前月との差をとって考えることが多い。このように差分をとることは時系列データを扱う際に基本的な処理である。また、通常のヒストグラムにおいても、累積度数分布と共に扱うと差分と和分の関係が現れる。
   最後に、統計データには誤差が含まれるためにその扱いには確率論の考え方が必要であること、データ分析の結論にも不確実性が含まれることについても触れる。