J’ai un dataFrame
dans les pandas et plusieurs des colonnes ont toutes les valeurs nulles. Existe-t-il une fonction intégrée qui me permettra de supprimer ces colonnes?
Je vous remercie!
Oui, dropna
. Voir http://pandas.pydata.org/pandas-docs/stable/missing_data.html et le DataFrame.dropna
DataFrame.dropna:
Definition: DataFrame.dropna(self, axis=0, how='any', thresh=None, subset=None) Docssortingng: Return object with labels on given axis omitted where alternately any or all of the data are missing Parameters ---------- axis : {0, 1} how : {'any', 'all'} any : if any NA values are present, drop that label all : if all values are NA, drop that label thresh : int, default None int value : require that many non-NA values subset : array-like Labels along other axis to consider, eg if you are dropping rows these would be a list of columns to include Returns ------- dropped : DataFrame
La commande spécifique à exécuter serait:
df=df.dropna(axis=1,how='all')
Fonction permettant de supprimer toutes les colonnes nulles du bloc de données:
def Remove_Null_Columns(df): dff = pd.DataFrame() for cl in fbinst: if df[cl].isnull().sum() == len(df[cl]): pass else: dff[cl] = df[cl] return dff
Cette fonction supprime toutes les colonnes Null du df.