標準ライブラリとは、pythonに標準で用意されているモジュールのことです。
【この記事はこんな方に向けて書いています】
・pythonの標準ライブラリの使い方を勉強したい
・標準ライブラリpandasでデータ分析をしたい
【目次】
・モジュールの読み込み
・pandas
・pandasでできること
・日経平均連動型ETFを読み込む
・encode
モジュールは、コードが書かれたファイルのことで、別のファイルに書いた関数を読み込んで使いたい場合は
import モジュール名
と記述して読み込むことで、別のファイルに書いた関数を使えるようになります。
モジュールについては、こちらの記事で簡単に解説していますのでよければご覧下さい。
ここではデータ分析に関連する様々な処理ができるモジュールについて簡単に解説します。
pandasは、pythonでデータ分析をしたい場合に役立つライブラリです。
・csvやExcelファイルの読み込み
・集計や分析
・機械学習
・時系列データの処理
・簡単なデータ可視化
他にもありますが、pythonでデータ分析と言えばpandasと言っても過言ではありません。
まずはpandasを読み込みます。
import pandas as pd
と記述することで、読み込むことができます。
「as pd」は、pandasを読み込んだ後、pdと記述すればpandasを使うことができるようにするための記述です。
「as~」は英語で「~と同様に」という意味があるため
import pandas pdでも同様
というイメージになります。
一般的にpandasを読み込む時は「as pd」と記述することが多いですが、asの後に書く文字列は任意なので、自分が認識しやすい文字列を記述します。
pandasはできることが多く実用的なので、順次記事にしていく予定ですが、ここではcsvファイルの読み込みについて簡単に解説します。
【日経平均連動型ETFを読み込む】
実行環境:Google Colaboratory
日経平均に連動するETF「NEXT FUNDS 日経225連動型上場投信:銘柄コード1321」の時系列データ(2021年の1年間)をcsvファイルで用意します。
時系列データはネット証券の口座を開設することで取得することができます。
時系列データがcsvファイルでデスクトップ等に用意できたら、まずはGoogle Colaboratoryにcsvファイルをアップロードします。
ファイルのアイコンをクリックします。
「セッションストレージにアップロード」をクリックします。
csvファイルをアップロードします(ファイル名は任意です)。
pandasを使って、csvファイルを読み込みます。
csvファイルを読み込む時は、read_csv関数を使います。
「NEXT FUNDS 日経225連動型上場投信:銘柄コード1321」の時系列データ(2021年の1年間)を読み込むことができました。
このように、read_csv関数を使って
pd.read_csv('ファイル名' , encoding = '文字コード')
と記述します。
文字コードとは、コンピューターに文字を識別させるための識別番号のようなものです。コンピューターは文字を識別できません。そのため、コンピューターに文字を識別させるために、文字に番号を割り振ることで識別できるようになります。
例えば「あいうえお」に「12345」の番号を割り振って「あいうえお」と入力すると、コンピューターは「12345」と識別して、「あいうえお」と入力されたことを認識します。
この「12345」の番号が文字コードです。
文字コードには様々な種類がありますが、ここでは日本でよく使われている「Shift-JIS」という文字コードを指定しています。
文字コードを指定せずにcsvファイルを読み込むとエラーになります。
encodeは、英語で記号化するという意味があるので
encoding = 'Shift-JIS'
は「Shift-JIS」という文字コードで記号化するという意味になります。
ここから、読み込んだデータを加工したり、集計して可視化等することで分析していきます。
前述の通りpandasはデータ分析関連の処理ができ、有用性があるので順次記事にしていく予定です。
まとめ
・pandasは、pythonでデータ分析をしたい場合に役立つライブラリ
・pandasではcsvファイルの読み込みや時系列データの処理などできることが豊富
・文字コードとは、コンピューターに文字を識別させるための識別番号
ここまで読んで頂きありがとうございました。
-------------------------------------------------------------------------------------
当ブログの記事一覧(カテゴリー別)