リスキリングで何を学べばいいか迷っている…そんな方におすすめしたいのが無料のオンライン講座です。最近では、さまざまなプラットフォームで、無料で視聴できる講座が充実しています。
今回、わたしはNTTドコモグループが提供している学習サービス「gacco」で公開されているオンライン講座を受講してみました。
わたしが選んだのは「社会人のためのデータサイエンス入門」です。以前からデータ分析に興味があり、統計学の基礎を学びたいと思っていました。この講座は統計学の基礎を学ぶのにピッタリ!と直感で感じたため受講。
オンライン講座で学んだことや受講してみた感想などを本記事では体験談としてご紹介いたします。
無料のオンライン講座が充実「gacco」とは
gaccoはドコモグループが運営しているオンライン動画学習サービスです。すぐに役立つスキルからビジネスに活かせるリスキリングのためのスキルまで、原則無料で幅広く学ぶことができます。
PC、スマホどちらからでもアクセス可能。すきま時間に気軽に学習できます。
講座受講の流れ
会員登録をしたあと、マイページから簡単に講座が受講できます。
・トップ画面のおすすめ講座やランキングから講座を探す
・講座一覧からカテゴリで検索①②
・ハッシュタグ③から探す
受講したい講座が見つかったらクリックし、受講登録をします。
すでに開講されている講座であれば、すぐに視聴して始められます。開講前の講座であればマイページにアクセスして受講します。
「社会人のためのデータサイエンス入門」を実際に受講してみた
gaccoで開講まえに予約登録をして受講した「社会人のためのデータサイエンス入門」
開講日にマイページからアクセス、講座は4週にわたって公開されています。(現在は動画のみ視聴可)
この講座では、各回に講義と確認テストがあり、所要時間は60〜90分程度です。講座によっては、ディスカッション形式や課題の提出、対面授業などがあり、双方向でのアウトプットが可能です。講座所定の基準を満たすと、受講後に修了証(公的な資格ではありません)が発行されます。
講義の内容:Week1
第1週目の講義の冒頭では、「大人がデータサイエンスを学ぶべき理由」と題した呼びかけを「シン ニホン」の著者である安宅和人さんが話されます。
「データサイエンスを学ぶべき理由」がわかりやすかったので、話の内容を一部紹介します。
世界でイケてる企業とは?アメリカの調査によるとSpace XとTesla(テスラ)だそうです。企業価値ランキングにおいてはGAFAMをはじめとするデータプラットフォームに直結した会社がほとんどです。これらの企業が未来においてもさらに価値を生み出していくと予想できるでしょう。
現在はAIによって多くのものが自動化されていく過程にあり、未来では自動化されたものをどんどん使い倒すということが予想できます。すでに自動化されているものの例として、
・顔を見ただけで遺伝病がわかる
・贋作を一発で見破る
・どこのスタートアップが当たる、当たらないかがわかる
などがあり、AIが人間をはるかに超える精度の能力をもち「シンギュラリティ」と言われているものが今きつつあると考えられます。
※シンギュラリティとは、人工知能研究の世界的権威であるレイ・カーツワイルが予測する「2045年に人工知能が自己フィードバックを繰り返して人間の知性を上回る」という仮説のことです。
このような臨界点にある中で、ただユーザーとして作られたものを使うだけではなく、仕掛けていく側に立つほうが楽しいのでは?
そして、仕掛ける側に立つにはデータ×AIを使い倒せるリテラシーが重要であり、統計数理や分析・解析能力に加えて、問いを整理してコンピュータに正しく指示を書く力が必要になる、といった内容でした。
こちらでご覧になれます。
くわしくは、統計とは?統計学について
統計とは、集められた数値から集団の特徴や傾向を理解するための方法です。
統計を用いてできることは、
- データ収集と分析
- 図表により集団の特徴を把握する
- 意思決定のサポート
統計学を使ったデータの収集や分析は、日常生活からビジネス、科学研究、社会調査などさまざまな分野で活用されています。
たとえば、日常生活では天気予報、ビジネスでは経済予測や市場分析、顧客行動の分析などのマーケティング戦略に用いられます。科学の分野では、実験結果の分析・仮説検証にも統計学が欠かせません。人口統計や世論調査などの社会調査でも活用されています。
このように、統計学はデータの収集・分析・解析を通して、あらゆる分野での重要な意思決定をするための手法として応用されているのです。
データの種類
統計学で用いられるデータには次のような種類があります。
ヒストグラムと相対度数
点数 | 62点 | 55点 | 70点 | 75点 | 62点 | 70点 | 89点 | 62点 | 55点 | 89点 | 62点 | 70点 | 70点 | 95点 |
ヒストグラムは、あるデータを等しい区間に分けて、それぞれの区間の数値を棒グラフに似た形の図で表します。ヒストグラムの作成によりデータの特徴やばらつきが視覚的にわかりやすくなります。
横軸(X)を階級、縦軸(y)を度数といい、度数分布表をもとに作成します。
相対度数とは?
全体から見てどのカテゴリが多数なのかを示す値です。カテゴリの度数 / 全体の度数で計算できます。
パーセンタイル、四分位、箱ひげ図
パーセンタイルとは、あるデータを小さい順に並べたとき、その数値がデータ全体の何%にあるかを表すものです。0パーセンタイルには最小値が、100パーセンタイルには最大値が表されます。
四分位とは、データを小さい順に並べたときに、4等分にした区切値25%・50%・75%のことをいいます。
4分の1番目を「第1四分位」2番目を「第2四分位」3番目を「第3四分位」といいます。第2四分位は中央値と同じ値となります。
箱ひげ図とは、最小値、最大値、四分位数、四分位範囲、外れ値を図にまとめたものです。ヒストグラムと同様にデータのばらつきを把握するために使われます。
例として、下表のテストの点数を箱ひげ図で表してみます。
点数 | 35 | 38 | 42 | 46 | 51 | 56 | 60 | 62 | 64 | 68 | 72 | 75 | 81 | 86 |
標準偏差・分散
標準偏差は、データのばらつきを表す指標で、平均から離れている度合いを指します。例えば、次の2つのデータがあった場合、
・グループAの1日のおこづかい:100円、200円、300円
・グループBの1日のおこづかい:50円、100円、450円
どちらのグループも平均したおこづかいは200円ですが、データの中身は違います。グループBでは平均から数値が離れている度合いが大きい=データのばらつきが大きいということがわかります。
このようなデータのばらつきを数値化したものを標準偏差といいます。
分散もデータのばらつきを表す指標のひとつで、標準偏差と密接な関係にあります。分散は、データ全体の平均から離れ具合を数値化したものです。
相関関係
相関関係とは、2つの事柄が関わり合う関係にある状態のことです。一方の数値が増加するともう一方の数値も増加するという関係を「正の相関関係」といい、
一方が増えるともう一方が減少する関係のことを「負の相関関係」といいます。そして、まったく相関関係にないものを「無相関」といいます。
相関係数とは、相関が強いか弱いかを数値で表したもので、-1から1の数値で表されます。
0.7~ 1.0 | 0.4~ 0.7 | 0.2~ 0.4 | -0.2~ 0.2 | -0.4~ -0.2 | -0.7~ -0.4 | -1.0~ -0.7 |
強い正の相関がある | 正の相関がある | 弱い正の相関がある | ほとんど相関がない | 弱い負の相関がある | 負の相関がある | 強い負の相関がある |
相関係数は、次のような公式で求められます。
相関係数=Xとyの共分散 / (Xの標準偏差)(yの標準偏差)
また、エクセルやスプレッドシートのCORREL関数を用いて計算することもできます。
オンライン講座は好きな時間にいつでも学べる
実際にオンライン講座を受講してみて、一番良かったことが、自分の都合に合わせて好きな時間に学習できるということです。
仕事や用事で動画公開から1週間ほど視聴できないときも、いつでも視聴できると思うと安心でした。
一方で、いつでも受講できるという安心感によって、ついつい後回しになってしまうことも…ある程度、時間を決めて取り組むといいかもしれません。
この講座だけを視聴して、データ分析や解析ができるようにはなりません。ですが、自分が統計学を面白いと感じるか、さらに学んでいきたいと思うか…という、キャリアを考えるうえでの判断ができます。
わたしは、統計学の基礎の基礎?が学べたことで、データを読み取るというスキルを身につけたいと受講後も感じています。引き続き秋からの講座も受講してみる予定です。
まとめ
無料のオンライン講座では、学びたい分野の基礎が学習できます。リスキリングで「何を学べばいいのかわからない…」という人や、「興味があるけど実際どんな分野なの?」と迷っている人にとっては、学習を始めるきっかけになるでしょう。
今回は、データサイエンスを紹介しましたが、gaccoではその他さまざまな分野の講座が視聴できます。ぜひ興味のある分野が見つかったら、気軽に講座を受講してみましょう。
gacco公式サイトで講座を見る