vrijdag 18 augustus 2017

Data-analyse machine learning

Voordat je  data de machine learning in gaat is het goed om de data te onderzoeken. Heeft een veld X eigenlijk wel invloed op het label  Y


hiervoor kan je boxplot gebruiken bij een beperkte set waarden

df_baseball[['hr', 'lg']].groupby('lg').boxplot(figsize=(20,15))




of bij een grotere set waarden


plot

import matplotlib.pyplot as plt
%matplotlib inline

plt.plot(df_baseball.year, df_baseball.hr, marker='.', linestyle='')

Geen opmerkingen:

Een reactie posten

Datums bepalen adhv begin en einddatum in Dataframe

Voorbeeld op losse velden  ####################################################################### # import necessary packages from datetime...