Pandas教程( 三 )

b) 重命名某些列(在下面的示例中 , 将“PassengerId”改为“id”) 。
data.rename(columns = {data.columns[0]:'id'}, inplace=True)等同于
data.rename(columns = {'PassengerId':'id'}, inplace=True)Index(['id', 'Survived', 'Pclass', 'Name', 'Sex', 'Age', 'SibSp', 'Parch', 'Ticket', 'Fare', 'Cabin', 'Embarked'], dtype='object')c) 重命名多个列(“PassengerId”、“Pclass”和“SibSp”) 。
data.rename(columns = {'PassengerId':'Passenger_Id', 'Pclass':'P_Class', 'SibSp':'Sib_Sp'}, inplace=True)Index(['Passenger_Id', 'Survived', 'P_Class', 'Name', 'Sex', 'Age', 'Sib_Sp', 'Parch', 'Ticket', 'Fare', 'Cabin', 'Embarked'], dtype='object')d) 通过列表生成式将下划线替换为点(仅适用于“Passenger.Id”、“P.Class”和“Sib.Sp”) 。
data.columns = [x.lower().replace('.', '') for x in data.columns]Index(['passengerid', 'survived', 'pclass', 'name', 'sex', 'age', 'sibsp', 'parch', 'ticket', 'fare', 'cabin', 'embarked'], dtype='object')e) 小写化字符并删除点(应用于'Passenger.Id' , 'P.Class'和'Sib.Sp') 。
data.columns = [x.lower().replace('.', '') for x in data.columns]Index(['passengerid', 'survived', 'pclass', 'name', 'sex', 'age', 'sibsp', 'parch', 'ticket', 'fare', 'cabin', 'embarked'], dtype='object')f) 将列名称大写 。
data.columns = [x.capitalize() for x in data.columns]Index(['Passengerid', 'Survived', 'Pclass', 'Name', 'Sex', 'Age', 'Sibsp', 'Parch', 'Ticket', 'Fare', 'Cabin', 'Embarked'], dtype='object')布尔索引:locdata.loc[, ] , 按列名称选择
a) 选择行 。
data.loc[[3]]
Pandas教程文章插图
b) 选择行数组 。
data.loc[6:8]
Pandas教程文章插图
c) 选择几行 。
data.loc[[7,28,39]]
Pandas教程文章插图
d) 从“Name”、“Age”、“Sex”和“Survived”几个列中选择一行 。
data.loc[[7], ['Name', 'Age', 'Sex', 'Survived']]
Pandas教程文章插图
e) 从多个列中选择多行 。
data.loc[[7,28,39], ['Name', 'Age', 'Sex','Survived']]
Pandas教程文章插图
f) 在某些条件下使用loc选择特定值 。 在这种情况下 , 从第4行到第10行选择年龄大于或等于10岁的乘客 。
data.loc[4:10, ['Age']] >= 10
Pandas教程文章插图
g) 在某些条件下使用loc选择特定值 。 在这种情况下 , 从前5行选择乘坐C123客舱的乘客 。
data.loc[:4, ['Cabin']] == 'C123'
Pandas教程文章插图
布尔索引:ilocdata.iloc[, ]按数字选择行和列
a) 选择数据集的第4行 。
data.iloc[3]
Pandas教程文章插图
b) 从所有列中选择一个行数组 。
data.iloc[6:12]
Pandas教程文章插图
c) 从所有列中选择几行 。
data.iloc[[7,28,39],:]
Pandas教程文章插图
d) 从“Name”、“Age”、“Sex”和“Survived”列中选择一行 。
data.iloc[[7], [3,5,4,1]]
Pandas教程文章插图
e) 从多个列中选择多行 。
data.iloc[[7,28,39], [3,5,4,1]]
Pandas教程文章插图
f) 选择多行形成列序列 。
data.iloc[[7,28,39], 3:10]
Pandas教程文章插图
g) 选择其他值 。

  • 从第6行到第12行 , 最后一列 。
data.iloc[6:13, -1]
  • 第3列和第6列的所有行 。
data.iloc[:, [3,6]]
  • 7、28、39行 , 从第3列到第6列 。
data.iloc[[7,28,39], 3:7]
  • 最后一列的最后20行 。
data.iloc[-20:, -1:]基本处理数据