能向量化还是尽量向量化处理
自己写函数apply或是用行列的for循环太慢了
import numpy as np
import pandas as pd
df = pd.DataFrame({'A': [4,4,5,6,6,6,6,6,7,7,8,8,8,8], 'B': [np.nan, np.nan,
np.nan,2,3,4,5,6,6,7,3,4,5,6]})
pair = df[['A']].drop_duplicates(keep='last').reset_index() # 数字对应最末
行号
df['result'] = df.index - (df[['A']]-2).merge(pair, how='left')['index']
print(df)
【 在 Tnnnnn 的大作中提到: 】
: 我想添加一个新列['B'],数值根据['A']列相应位置的数值而定
: A B
: 0 4
: ...................
--
FROM 222.131.24.*