Pandas教程( 三 )
b) 重命名某些列(在下面的示例中 , 将“PassengerId”改为“id”) 。
data.rename(columns = {data.columns[0]:'id'}, inplace=True)
等同于
data.rename(columns = {'PassengerId':'id'}, inplace=True)
Index(['id', 'Survived', 'Pclass', 'Name', 'Sex', 'Age', 'SibSp', 'Parch', 'Ticket', 'Fare', 'Cabin', 'Embarked'], dtype='object')
c) 重命名多个列(“PassengerId”、“Pclass”和“SibSp”) 。
data.rename(columns = {'PassengerId':'Passenger_Id', 'Pclass':'P_Class', 'SibSp':'Sib_Sp'}, inplace=True)
Index(['Passenger_Id', 'Survived', 'P_Class', 'Name', 'Sex', 'Age', 'Sib_Sp', 'Parch', 'Ticket', 'Fare', 'Cabin', 'Embarked'], dtype='object')
d) 通过列表生成式将下划线替换为点(仅适用于“Passenger.Id”、“P.Class”和“Sib.Sp”) 。
data.columns = [x.lower().replace('.', '') for x in data.columns]
Index(['passengerid', 'survived', 'pclass', 'name', 'sex', 'age', 'sibsp', 'parch', 'ticket', 'fare', 'cabin', 'embarked'], dtype='object')
e) 小写化字符并删除点(应用于'Passenger.Id' , 'P.Class'和'Sib.Sp') 。
data.columns = [x.lower().replace('.', '') for x in data.columns]
Index(['passengerid', 'survived', 'pclass', 'name', 'sex', 'age', 'sibsp', 'parch', 'ticket', 'fare', 'cabin', 'embarked'], dtype='object')
f) 将列名称大写 。
data.columns = [x.capitalize() for x in data.columns]
Index(['Passengerid', 'Survived', 'Pclass', 'Name', 'Sex', 'Age', 'Sibsp', 'Parch', 'Ticket', 'Fare', 'Cabin', 'Embarked'], dtype='object')
布尔索引:locdata.loc[
a) 选择行 。
data.loc[[3]]
文章插图
b) 选择行数组 。
data.loc[6:8]
文章插图
c) 选择几行 。
data.loc[[7,28,39]]
文章插图
d) 从“Name”、“Age”、“Sex”和“Survived”几个列中选择一行 。
data.loc[[7], ['Name', 'Age', 'Sex', 'Survived']]
文章插图
e) 从多个列中选择多行 。
data.loc[[7,28,39], ['Name', 'Age', 'Sex','Survived']]
文章插图
f) 在某些条件下使用loc选择特定值 。 在这种情况下 , 从第4行到第10行选择年龄大于或等于10岁的乘客 。
data.loc[4:10, ['Age']] >= 10
文章插图
g) 在某些条件下使用loc选择特定值 。 在这种情况下 , 从前5行选择乘坐C123客舱的乘客 。
data.loc[:4, ['Cabin']] == 'C123'
文章插图
布尔索引:ilocdata.iloc[
a) 选择数据集的第4行 。
data.iloc[3]
文章插图
b) 从所有列中选择一个行数组 。
data.iloc[6:12]
文章插图
c) 从所有列中选择几行 。
data.iloc[[7,28,39],:]
文章插图
d) 从“Name”、“Age”、“Sex”和“Survived”列中选择一行 。
data.iloc[[7], [3,5,4,1]]
文章插图
e) 从多个列中选择多行 。
data.iloc[[7,28,39], [3,5,4,1]]
文章插图
f) 选择多行形成列序列 。
data.iloc[[7,28,39], 3:10]
文章插图
g) 选择其他值 。
data.iloc[6:13, -1]
data.iloc[:, [3,6]]
data.iloc[[7,28,39], 3:7]
data.iloc[-20:, -1:]
基本处理数据
- 占营收|华为值多少钱
- 商品|问道自有品牌,山姆多方博弈
- 公式|?有人把 5G 讲得这么简单明了
- 责令|1336款APP被责令整改,三大问题突出
- 缩小|调整电脑屏幕文本文字显示大小,系统设置放大缩小DPI图文教程
- 长庚君|向小米公司致歉
- “天河优创”放榜
- 广东移动OTN精智专网,助力千行百业数字化转型
- 快的秒回,慢的等了近一天
- 制药领域|为什么AI制药这么火,为什么是现在?