Voordat je data de machine learning in gaat is het goed om de data te onderzoeken. Heeft een veld X eigenlijk wel invloed op het label Y
hiervoor kan je boxplot gebruiken bij een beperkte set waarden
df_baseball[['hr', 'lg']].groupby('lg').boxplot(figsize=(20,15))
of bij een grotere set waarden
plot
import matplotlib.pyplot as plt
%matplotlib inline
plt.plot(df_baseball.year, df_baseball.hr, marker='.', linestyle='')
Abonneren op:
Reacties posten (Atom)
Datums bepalen adhv begin en einddatum in Dataframe
Voorbeeld op losse velden ####################################################################### # import necessary packages from datetime...
-
handig https://www.shanelynn.ie/summarising-aggregation-and-grouping-data-in-python-pandas/ import pandas factuurlines = pd.read_csv(...
-
Importeer CSV naar Dataframe import pandas factuurlines = pd.read_csv("df_debet_geschoond.csv",sep=";",engine='pyt...
-
The Pandas loc indexer can be used with DataFrames for two different use cases: a.) Selecting rows by label/index b.) Selecting r...
Geen opmerkingen:
Een reactie posten