Python Pandas DataFrame

ウィキペディアより、コピーした内容をDataFrameにする

このコピーするread_clipboard()はcolaboratoryでは使用不可

import pandas as pd
# ウィキペディアより井上尚弥の戦績
inoue_df = pd.read_clipboard()
inoue_df

pd.read_excel()でexcelファイルをデータフレームにする

# 1つ階層が上の「ファイル情報取得」フォルダの「titanic.xlsx」のエクセルファイルを参照
excel_df = pd.read_excel('../excelファイル情報取得/titanic.xlsx')

# 呼び出し
excel_df 

pd.read_csvでcsvファイルからデータフレームにする

# 1つ階層が上の「ファイル情報取得」フォルダの「titanic.csv」のエクセルファイルを参照
csv_df = pd.read_csv('../excelファイル情報取得/titanic.csv')

# 呼び出し
csv_df
# 上記excel_dfと同じ結果

特定のカラム(列)を抜き出す

csv_df['Pclass']
# もしくは
csv_df.Pclass

複数カラムの情報を取得

csv_df[['PassengerId', 'Name', 'Sex', 'Age']]

取得したデータを新しいデータフレームとする

new_df = pd.DataFrame(csv_df, columns=['PassengerId', 'Name', 'Sex', 'Age'])

カラムを追加

new_df_plus_column = pd.DataFrame(csv_df, columns=['PassengerId', 'Name', 'Sex', 'Age', 'Country'])

# 出力
new_df_plus_column

カラムの値を一括代入

new_df_plus_column['Country'] = "みんな不明"

# 出力
new_df_plus_column

Seriesからカラムに値を代入

country = pd.Series(["日本", "韓国", "中国"], index =[0, 1, 5])

new_df_plus_column['Country'] = country
# 出力
new_df_plus_column.head(6)

カラムを削除する

del new_df_plus_column['Country']

辞書型からデータフレームを作る

# 辞書型を作成
data = {'都市': ['大阪', '京都', '和歌山', '奈良'], '人口':[100, 200, 300, 400]}

city_info = pd.DataFrame(data)

# 呼び出し
city_info 

コメント

    タイトルとURLをコピーしました