掲題の通り、「Python3エンジニア認定データ分析試験」を受験し、合格したので合格記を記します。
合格日
2020年10月29日(木)
合格した時の点数
775/1000でした。合格ラインは70%の700点ですが、受験した感覚としてはだいぶ分からない問題が多かったです。こうしてみると、ライブラリの使い方はほぼ完璧ですが、Python基礎等はボロボロでしたね…。
セクション分析 | 正解率 |
---|---|
1.データエンジニアの役割 | 100% |
2.実行環境構築 | 0% |
3.Pythonの基礎 | 33% |
4.Jupyter Notebook | 0% |
5.数式を読むための基礎知識 | 100% |
6.線形代数 | 100% |
7.基礎解析 | 100% |
8.確率と統計 | 50% |
9.NumPy | 83% |
10.pandas | 100% |
11.Matplotlib | 83% |
12.scikit-learn | 75% |
どんな試験か
Pythonを使ったデータ分析の基礎や方法を問う試験です。Pythonの基礎もある程度出されるので、Python3エンジニア認定基礎試験を先に受験しておくといいでしょう。
章 | 節 | 内容 | 問題数 | 問題割合 |
---|---|---|---|---|
1 | データエンジニアの役割 | 2 | 5.00% | |
2 | Pythonと環境 | |||
1 | 実行環境構築 | 1 | 2.50% | |
2 | Pythonの基礎 | 3 | 7.50% | |
3 | Jupyter Notebook | 1 | 2.50% | |
3 | 数学の基礎 | |||
1 | 数式を読むための基礎知識 | 1 | 2.50% | |
2 | 線形代数 | 2 | 5.00% | |
3 | 基礎解析 | 1 | 2.50% | |
4 | 確率と統計 | 2 | 5.00% | |
4 | ライブラリによる分析実践 | |||
1 | NumPy | 6 | 15.00% | |
2 | pandas | 7 | 17.50% | |
3 | Matplotlib | 6 | 15.00% | |
4 | scikit-learn | 8 | 20.00% | |
5 | 応用: データ収集と加工 | 0 | 0.00% |
公式ページ
受験料
受験料金:1万円(税別)学割5千円(税別)
受験会場
全国のオデッセイコミュニケーションズCBTセンターにて通年受験が可能です。 cbt.odyssey-com.co.jp
まだ自宅での受験等はできないようです。
問題数/出題形式/試験時間
- 問題数
- 40問
- 出題形式
- 選択問題
- 試験時間
- 60分
私は20分くらいで解き終わりました。通常であれば30分くらいはかかりそうです。
ラジオボタンで4択から1つの正答を選択します。
Python3エンジニア認定基礎試験と違い、単純な選択問題という訳にはいきません。ホワイトボードもメモもないので、行列の内積(ドット積)が特に厄介でした。
私は学生時代、大学受験に使わないからと数ⅢとCを勉強しないという選択肢を採ったので脳内変換が非常に厄介でした。そもそも、行列のどっちの方角がXで、どっちがYなのか分かってなかったですからね。まずはそれを覚えるところからのスタートだったので、メモが無いというのはかなり負担が大きかったです。
出題範囲
「Pythonによるあたらしいデータ分析の教科書」から出ます。
ただ、感覚的なことを言わせてもらうと、この本から出てこない選択肢も出題されるのでこの本だけで対策するのは非常に難しいです。仕方ないですが「できること」しか書いてないので、テストで出題される「できないこと」が分かりづらいです。巻末に目次がありますが内容が少なく、あとで思い出したい時には見つからず、結局ググって解決していました。
試験のためには、購入は必須です。ただし、一通り覚えた後は読み返せないような本になっているので、オススメはしづらいです。
難易度
勉強期間は短かったですが、難易度は高かったです。データ分析の手法が頭に入っていないと、混乱します。
一応、私はG検定を取得しています。
※ G検定の合格時の日記。 nainaistar.hatenablog.com
しかし、G検定はAIを作る人ではなく、使う人の立場の問題が多く、大半は手を動かして覚えていなかったので忘れていました。
合格に向けた勉強時間と対策
勉強時間:20時間。
本の勉強
「Python3エンジニア認定基礎」を既に持っていたので、Pythonに関する章は飛ばして勉強しました。
numpyとpandasに関しては、Gitpod上でひたすら写経していました。
MatplotlibはGitpod上でグラフをうまく描画できなかったので、Jupyter Notebookから処理しています。Gitpod上でJupyter Notebookをインストールできなかったので、PaizaCloud様を利用して写経しました。 paiza.cloud
scikit-learnに関しては、結局写経していません。覚えることが多かったので自分のやりたい分析をするときに、改めて勉強する予定です。
模擬試験
下記模擬試験はだいたい10時間ほど、みっちり使わせていただきました。前日でも初見の問題は4割程度しかわからなかったので、難しかったです。
DIVE INTO EXAM様 exam.diveintocode.jp
PRIME STUDY様 study.prime-strategy.co.jp
YouTube
今回はYouTubeをフル活用しました。ながらで見ていたので完全ではないものの、8時間くらいは見ていました。
なお、この試験対策用の動画はありませんでした。
ただし、「Jupyter Notebook」「Numpy」「pandas」「Matplotlib」「scikit-learn」という各ライブラリごとの使い方を教えてくれる動画はいくつかありました。全て完璧に正答できれば7割は取得できるので、もしこの資格を取得したい人がいればYouTubeで視聴していた方がいいです。
本だけでも勉強できるでしょうが、概要だけでも掴みたい時は手始めにYouTubeを探すといいですね。
終わりに
データ分析の基礎を学ぶという期待値であれば受けておく価値はあります。データの分析ができれば、ログやメトリクスから読み取れるデータも増えるでしょうし、趣味の投資も効率よくできるかもしれないです。
業務として扱うには、最新の情報を常に追い続ける必要があるのでデータエンジニアになる予定はありません。しかし、少しでも自分の可能性を広げたい人にとっては、この試験を受けるとデータ分析が分かるようになるので、ぜひ受けてみてください。
この記事がお役に立ちましたら、各種SNSでのシェアや、今後も情報発信しますのでフォローよろしくお願いします。
類似記事
Python3エンジニア認定基礎試験の合格記 nainaistar.hatenablog.com