import pandas
factuurlines = pd.read_csv("df_debet_geschoond.csv",sep=";",engine='python' )
factuurlines["BEDR_FACT__GOEDGEKEURD"].sum()
a=factuurlines.groupby('C_CLIENT')
pd.pivot_table(factuurlines,index="N_PRODUCTCODE",values="BEDR_FACT__GOEDGEKEURD")
pd.pivot_table(factuurlines,index=("C_CLIENT","N_SRT_VOORZ","C_VOORZ","N_PRODUCTCODE"),values="BEDR_FACT__GOEDGEKEURD")
df_pivot1=pd.pivot_table(factuurlines,index=("C_CLIENT","N_SRT_VOORZ","C_VOORZ","N_PRODUCTCODE"),values="BEDR_FACT__GOEDGEKEURD",aggfunc="sum",margins = True, margins_name= 'Total count')
# altijd de pivot resetten: dataframe weer normaliseren.de velden waarop gegroepeerd wordt zijn als index concated.
df_pivot1=df_pivot1.reset_index()
df_pivot1['iets'] = df_pivot1['groterDan1000']*10
df_bsn=pd.pivot_table(factuurlines,index=("C_CLIENT"),columns="C_VOORZ",values="ORGANISATIE",aggfunc="count")
nieuw veld aan begin dataframe toevoegen
mycol=pd.Index(['VALID_BSN']).append(dflookup1.columns)#list comprehension in python: Gebruik om het veld teller te verwijderen
juistKolommen = [k for k in df_bsn.columns if k is not 'teller']df_bsn = df_bsn[juistKolommen]
# Hoe tel ik per bsn het aantal unieke produkten
df_bsn=df_bsn>0df_bsn=df_bsn*1
df_bsn['teller']=df_bsn[:].sum(axis=1)
df_pivot1.to_csv("produktenJeugd2017.csv",sep= ";",decimal= ",");
Geen opmerkingen:
Een reactie posten