テクノロジー

pythonの基礎:「標準ライブラリ~pandas~」

k-99's icon'
  • k-99
  • 2022/11/14 15:57
Content image

標準ライブラリとは、python標準用意されているモジュールのことです。

 

【この記事はこんな方に向けて書いています】

・pythonの標準ライブラリの使い方を勉強したい

・標準ライブラリpandasでデータ分析をしたい

 

【目次】

・モジュールの読み込み

・pandas

・pandasでできること

・日経平均連動型ETFを読み込む

・encode

 

【モジュールの読み込み】

モジュールは、コードが書かれたファイルのことで、別のファイルに書いた関数を読み込んで使いたい場合は

import モジュール名

と記述して読み込むことで、別のファイルに書いた関数を使えるようになります。

 

モジュールについては、こちらの記事で簡単に解説していますのでよければご覧下さい。

 

ここではデータ分析に関連する様々な処理ができるモジュールについて簡単に解説します。

 

【pandas】

pandasは、pythonデータ分析をしたい場合に役立つライブラリです。

 

【pandasでできること】

・csvやExcelファイルの読み込み

・集計や分析

・機械学習

・時系列データの処理

・簡単なデータ可視化

 

他にもありますが、pythonデータ分析と言えばpandasと言っても過言ではありません。

 

まずはpandasを読み込みます。

import pandas as pd

と記述することで、読み込むことができます。

「as pd」は、pandasを読み込んだ後、pdと記述すればpandasを使うことができるようにするための記述です。

 

「as~」は英語で「~と同様に」という意味があるため

import pandas pdでも同様

というイメージになります。

 

一般的にpandasを読み込む時は「as pd」と記述することが多いですが、asの後に書く文字列任意なので、自分が認識しやすい文字列を記述します。

 

pandasはできることが多く実用的なので、順次記事にしていく予定ですが、ここではcsvファイルの読み込みについて簡単に解説します。

 

【日経平均連動型ETFを読み込む】

実行環境:Google Colaboratory

日経平均連動するETF「NEXT FUNDS 日経225連動型上場投信:銘柄コード1321」時系列データ(2021年の1年間)csvファイルで用意します。

 

時系列データネット証券の口座を開設することで取得することができます。

 

時系列データcsvファイルでデスクトップ等に用意できたら、まずはGoogle Colaboratorycsvファイルアップロードします。

 

ファイルアイコンをクリックします。

Content image

 

「セッションストレージにアップロード」をクリックします。

Content image

 

csvファイルアップロードします(ファイル名は任意です)。

Content image

 

pandasを使って、csvファイルを読み込みます。

csvファイルを読み込む時は、read_csv関数を使います。

Content image
上がコード・下が実行結果

「NEXT FUNDS 日経225連動型上場投信:銘柄コード1321」時系列データ(2021年の1年間)を読み込むことができました。

 

このように、read_csv関数を使って

pd.read_csv('ファイル名' , encoding = '文字コード')

と記述します。

 

文字コードとは、コンピューター文字識別させるための識別番号のようなものです。コンピューター文字識別できません。そのため、コンピューター文字識別させるために、文字番号割り振ることで識別できるようになります。

 

例えば「あいうえお」「12345」番号を割り振って「あいうえお」入力すると、コンピューター「12345」識別して、「あいうえお」入力されたことを認識します。

 

この「12345」番号文字コードです。

文字コードには様々な種類がありますが、ここでは日本でよく使われている「Shift-JIS」という文字コード指定しています。

文字コード指定せずにcsvファイルを読み込むとエラーになります。

 

【encode】

encodeは、英語で記号化するという意味があるので

encoding = 'Shift-JIS'

「Shift-JIS」という文字コード記号化するという意味になります。

 

ここから、読み込んだデータ加工したり、集計して可視化等することで分析していきます。

 

前述の通りpandasデータ分析関連の処理ができ、有用性があるので順次記事にしていく予定です。

まとめ

・pandasは、pythonでデータ分析をしたい場合に役立つライブラリ

・pandasではcsvファイルの読み込みや時系列データの処理などできることが豊富

・文字コードとは、コンピューターに文字を識別させるための識別番号

 

ここまで読んで頂きありがとうございました。

Content image

 

Twitter

 

-------------------------------------------------------------------------------------

当ブログの記事一覧(カテゴリー別)

 

 

 

 

 

Supporter profile icon
Article tip 1人がサポートしています
獲得ALIS: Article like 55.28 ALIS Article tip 4.10 ALIS
k-99's icon'
  • k-99
  • @k-99
python初学者です。pythonで勉強した内容を自分なりにわかりやすくアウトプットしていきます、よろしくお願いします。Twitter:@python_begin

投稿者の人気記事
コメントする
コメントする
こちらもおすすめ!
Eye catch
クリプト

約2年間ブロックチェ-ンゲームをして

Like token Tip token
61.20 ALIS
Eye catch
クリプト

スーパーコンピュータ「京」でマイニングしたら

Like token Tip token
1.06k ALIS
Eye catch
テクノロジー

彼女でも分かるように解説:ディープフェイク

Like token Tip token
32.10 ALIS
Eye catch
他カテゴリ

機械学習を体験してみよう!(難易度低)

Like token Tip token
69.82 ALIS
Eye catch
クリプト

17万円のPCでTwitterやってるのはもったいないのでETHマイニングを始めた話

Like token Tip token
46.60 ALIS
Eye catch
クリプト

ブロックチェーンの51%攻撃ってなに

Like token Tip token
0.00 ALIS
Eye catch
クリプト

Bitcoinの価値の源泉は、PoWによる電気代ではなくて"競争原理"だった。

Like token Tip token
159.32 ALIS
Eye catch
クリプト

NFT解体新書・デジタルデータをNFTで販売するときのすべて【実証実験・共有レポート】

Like token Tip token
120.79 ALIS
Eye catch
クリプト

「ハッシュ」とは何なのか、必ず理解させます

Like token Tip token
0.10 ALIS
Eye catch
テクノロジー

オープンソースプロジェクトに参加して自己肯定感を高める

Like token Tip token
85.05 ALIS
Eye catch
ゲーム

ドラクエで学ぶオーバフロー

Like token Tip token
30.10 ALIS
Eye catch
テクノロジー

なぜ、素人エンジニアの私が60日間でブロックチェーンゲームを制作できたのか、について語ってみた

Like token Tip token
270.93 ALIS