Pandas read_csv() 関数
Suraj Joshi
2023年1月30日
-
pandas.read_csv()
の構文 -
コード例:
pandas.read_csv()
関数を用いてCSV
ファイルを読み込む -
コード例:
pandas.read_csv()
関数でusecols
パラメータを設定する -
コード例:
pandas.read_csv()
ヘッダー付き関数 -
コード例:行をスキップする
pandas.read_csv()
関数
Pandas read_csv()
メソッドは、指定したカンマ区切り値(CSV
)ファイルを DataFrame
に読み込みます。
pandas.read_csv()
の構文
pandas.read_csv(filepath_or_buffer: Union[str, pathlib.Path, IO[~ AnyStr]],
sep=',',
delimiter=None,
header='infer',
names=None,
index_col=None,
usecols=None,
squeeze=False,
prefix=None,
mangle_dupe_cols=True,
dtype=None,
engine=None,
converters=None,
true_values=None,
false_values=None,
skipinitialspace=False,
skiprows=None,
skipfooter=0,
nrows=None,
na_values=None,
keep_default_na=True,
na_filter=True,
verbose=False,
skip_blank_lines=True,
parse_dates=False,
infer_datetime_format=False,
keep_date_col=False,
date_parser=None,
dayfirst=False,
cache_dates=True,
iterator=False,
chunksize=None,
compression='infer',
thousands=None,
decimal: str='.',
lineterminator=None,
quotechar='"',
quoting=0,
doublequote=True,
escapechar=None,
comment=None,
encoding=None,
dialect=None,
error_bad_lines=True,
warn_bad_lines=True,
delim_whitespace=False,
low_memory=True,
memory_map=False,
float_precision=None)
パラメータ
filepath_or_buffer |
インポートする csv ファイルの場所 |
delimiter |
ファイル csv の内容を解析する際に使用するデリミタ |
usecols |
ファイル csv から DataFrame を形成する際にのみ含まれるカラム名。 |
header |
ヘッダのカラム名として使用する行/行を指定します。 |
squeeze |
解析したデータに 1 列しか含まれていない場合、Pandas の系列を返します。 |
skiprows |
どの行をスキップするか |
リターン
ラベル付きの軸を持つ CSV
ファイルから Dataframe
を作成します。
コード例:pandas.read_csv()
関数を用いて CSV
ファイルを読み込む
import pandas as pd
df = pd.read_csv("dataset.csv")
print(df)
出力:
Country Item Type Sales Channel Order Priority
0 Tuvalu Baby Food Offline H
1 East Timor Meat Online L
2 Norway Baby Food Online L
3 Portugal Baby Food Online H
4 Honduras Snacks Online L
5 New Zealand Fruits Online H
6 Moldova Personal Care Online L
このメソッドは CSV
ファイルを DataFrame
にロードします。ここでは、絶対パスと相対パスの両方を利用して pandas.read_csv()
関数の引数として file path
を指定することができます。
この場合、dataset.csv
はプログラムファイルと同じディレクトリにあり、csv
ファイルの名前をファイルパスとして利用することができます。
コード例:pandas.read_csv()
関数で usecols
パラメータを設定する
import pandas as pd
df = pd.read_csv("dataset.csv",usecols=["Country","Sales Channel","Order Priority"])
print(df)
出力:
Country Sales Channel Order Priority
0 Tuvalu Offline H
1 East Timor Online L
2 Norway Online L
3 Portugal Online H
4 Honduras Online L
5 New Zealand Online H
6 Moldova Online L
このケースでは、CSV
ファイルを DataFrame
にロードし、usecols
パラメータに指定された列のみを含めます。
Country
、Sales Channel
, および Order Priority
はパラメータとして渡されるだけなので、DataFrame
にのみ含まれます。
コード例:pandas.read_csv()
ヘッダー付き関数
import pandas as pd
df = pd.read_csv("dataset.csv",header=1)
print(df)
出力:
Tuvalu Baby Food Offline H
0 East Timor Meat Online L
1 Norway Baby Food Online L
2 Portugal Baby Food Online H
3 Honduras Snacks Online L
4 New Zealand Fruits Online H
5 Moldova Personal Care Online L
このプロセスは、1 行目をヘッダとして設定して CSV
ファイルを DataFrame
にロードします。
ここでは、1 行目の要素が DataFrame
全体のカラム名となります。
コード例:行をスキップする pandas.read_csv()
関数
import pandas as pd
df = pd.read_csv("dataset.csv",skiprows=3)
print(df)
出力:
Norway Baby Food Online L
0 Portugal Baby Food Online H
1 Honduras Snacks Online L
2 New Zealand Fruits Online H
3 Moldova Personal Care Online L
この手続きは、最初の 3 行をスキップして CSV
ファイルを DataFrame
にロードします。
著者: Suraj Joshi
Suraj Joshi is a backend software engineer at Matrice.ai.
LinkedIn