着实之前都写过小笔记了Python Pandas 中lambda和apply函数的应用。用到的方法照旧针对dataframe的apply函数+lambda表达式,除此之外,还存在针对series的map函数和apply函数。
下面区分单列、多列和元素级别的的操作。
1. 对单枚举行操作,Series.apply()函数和Series.map()函数
针对一个Series,map函数和apply函数均可操作,看官方文档的先容,apply适用于更复杂的操作功能。
s = pd.Series(['cat', 'dog', np.nan, 'rabbit'])>>> s.map('I am a {}'.format, na_action='ignore')0 I am a cat1 I am a dog2 NaN3 I am a rabbitdtype: object
df['new_col'] = df['col'].apply(lambda x: x+2)2. 对多枚举行操作,DataFrame.apply()函数
apply函数是针对指定的轴举行操作的,以是着实是行列都可以操作的,对枚举行操作时指定axis=1,如下所示
df['new_col'] = df.apply(lambda x: x['a'] + x['b'] - x['c'], axis=1)def self_sum(a, b): return a ^ 2 + b ^ 2df['sum'] = df.apply(lambda x: self_sum(x['from'], x['to']), axis=1)3. 对个体元素举行操作,DataFrame.applymap()函数
针对整个dataframe,好比获取每个元素的长度
df.applymap(lambda x: len(str(x)), na_action='ignore')针对整个dataframe的操作可以直接操作的,好比df**2就是对每个元素举行平方,服从更高。
本日动手归一化pandas中dataframe的一个列,竟然还忘记加apply了,哎,基础功一点都不踏实呀 |