こんにちはなおです!
今回はPythonのライブラリであるPandasについて基本的な説明を行いたいと思います!
そもそもPandasって何??って感じだと思うんですけど、
データ処理をするのに超絶便利なライブラリです。
[スポンサーリンク]
例えば6月~9月までの気温、湿度、降水量の情報があったとしましょう。
import pandas as pd
df=pd.DataFrame([[21.8,80.0,216.5],[28.3,77.0,107.0],[28.1,77.0,86.5],[22.9,86.0,365.0]],index=["6月","7月","8月","9月"],columns=["平均気温","平均湿度","降水量"])
print(df)
#表示結果
# 気温 湿度 降水量
#6月 21.8 80.0 216.5
#7月 28.3 77.0 107.0
#8月 28.1 77.0 86.5
#9月 22.9 86.0 365.0
前月との差を知りたいなーと思ったらこのように1行入力するだけでOK
df_sub=df.diff()
print(df_sub)
#表示結果
# 気温 湿度 降水量
#6月 NaN NaN NaN
#7月 6.5 -3.0 -109.5
#8月 -0.2 0.0 -20.5
#9月 -5.2 9.0 278.5
今回の例では最適ではありませんが、全てに+1したいという時もこれだけ]
df_p=df+1
print(df_p)
#表示結果
# 気温 湿度 降水量
#6月 22.8 81.0 217.5
#7月 29.3 78.0 108.0
#8月 29.1 78.0 87.5
#9月 23.9 87.0 366.0
9月の情報いらないわってなったらまた1行入力するだけ
df=df.drop("9月")
print(df)
#表示結果
# 気温 湿度 降水量
#6月 21.8 80.0 216.5
#7月 28.3 77.0 107.0
#8月 28.1 77.0 86.5
こんな感じでデータ処理を短いコードで簡単に行えるのがPandasです!
データ処理やデータ整理を行ってその結果をグラフとして出力、または機械学習で用いるなどPandasが無いとできないこともたくさんあります。
Pythonを扱う上で必須のライブラリと言っても過言ではないでしょう。
そんなPandasを学び始める上でまず知っておくべきことはPandasのデータ構造です!
データ構造を知らないとそもそもどんな風にPandasを扱っていくべきかがわかりません。
そんなPandasのデータ構造については以下の記事で紹介しています!!
「DataFrameとSeriesの違いを紹介」
その他Pythonの記事は以下にまとめています!!
「Python記事まとめ」
コメント
[…] ・Pandasについての解説 ・[最重要!!!]DataFrameとSeriesの違い ・DataFrameとSeriesの作成方法 ・DataFrameの行、列の削除と追加方法 ・DataFrameの行、列、セルの参照方法 ・完全一致、部分一致、不等号、AND、OR、NOTでの取り出し方 […]