【python】Pandasとは?データ処理をする上で必須のライブラリ

【python】Pandasとは?データ処理をする上で必須のライブラリ

こんにちはなおです!
今回はPythonのライブラリであるPandasについて基本的な説明を行いたいと思います!

そもそもPandasって何??って感じだと思うんですけど、
データ処理をするのに超絶便利なライブラリです。

[スポンサーリンク]


例えば6月~9月までの気温、湿度、降水量の情報があったとしましょう。

import pandas as pd
df=pd.DataFrame([[21.8,80.0,216.5],[28.3,77.0,107.0],[28.1,77.0,86.5],[22.9,86.0,365.0]],index=["6月","7月","8月","9月"],columns=["平均気温","平均湿度","降水量"])
print(df)

#表示結果
#    気温 湿度 降水量
#6月 21.8 80.0 216.5
#7月 28.3 77.0 107.0
#8月 28.1 77.0 86.5
#9月 22.9 86.0 365.0

前月との差を知りたいなーと思ったらこのように1行入力するだけでOK

df_sub=df.diff()
print(df_sub)
#表示結果
#   気温 湿度 降水量
#6月 NaN NaN NaN
#7月 6.5 -3.0 -109.5
#8月 -0.2 0.0 -20.5
#9月 -5.2 9.0 278.5

今回の例では最適ではありませんが、全てに+1したいという時もこれだけ]

df_p=df+1
print(df_p)

#表示結果
#    気温 湿度 降水量
#6月 22.8 81.0 217.5
#7月 29.3 78.0 108.0
#8月 29.1 78.0 87.5
#9月 23.9 87.0 366.0

9月の情報いらないわってなったらまた1行入力するだけ

df=df.drop("9月")
print(df)

#表示結果
#    気温 湿度 降水量
#6月 21.8 80.0 216.5
#7月 28.3 77.0 107.0
#8月 28.1 77.0 86.5

こんな感じでデータ処理を短いコードで簡単に行えるのがPandasです!
データ処理やデータ整理を行ってその結果をグラフとして出力、または機械学習で用いるなどPandasが無いとできないこともたくさんあります。

Pythonを扱う上で必須のライブラリと言っても過言ではないでしょう。

そんなPandasを学び始める上でまず知っておくべきことはPandasのデータ構造です!
データ構造を知らないとそもそもどんな風にPandasを扱っていくべきかがわかりません。

そんなPandasのデータ構造については以下の記事で紹介しています!!
DataFrameとSeriesの違いを紹介


その他Pythonの記事は以下にまとめています!!

Python記事まとめ

Pandasカテゴリの最新記事