Voordat je data de machine learning in gaat is het goed om de data te onderzoeken. Heeft een veld X eigenlijk wel invloed op het label Y
hiervoor kan je boxplot gebruiken bij een beperkte set waarden
df_baseball[['hr', 'lg']].groupby('lg').boxplot(figsize=(20,15))
of bij een grotere set waarden
plot
import matplotlib.pyplot as plt
%matplotlib inline
plt.plot(df_baseball.year, df_baseball.hr, marker='.', linestyle='')
Abonneren op:
Reacties posten (Atom)
Datums bepalen adhv begin en einddatum in Dataframe
Voorbeeld op losse velden ####################################################################### # import necessary packages from datetime...
-
value_counts geef per waarde het aantal voorkomens in een bepaalde df_iris.species.value_counts() versicolor 50 setosa 50 v...
-
import textfiles # Open a file: file file = open('opa.txt','r') # Print it print(file.read()) # Check whether file ...
-
scikit-learn, a standard library for machine learning in Python. It describes itself like this: Machine Learning in Python •Simple and...
Geen opmerkingen:
Een reactie posten