import pandas as pd
import matplotlib.pyplot as plt
%matplotlib inline
pd.set_option('display.max_columns', None)
pd.set_option('display.max_rows', None)
RKIData = pd.read_csv('https://opendata.arcgis.com/datasets/dd4580c810204019a7b8eb3e0b329dd6_0.csv');
RKIData.head()
RKIData = RKIData[RKIData.Geschlecht.str.contains("unbekannt") == False]
RKIData = RKIData[RKIData.Altersgruppe.str.contains("unbekannt") == False]
RKIData = RKIData.drop(['NeuerFall','NeuerTodesfall','ObjectId','Meldedatum','IdBundesland','IdLandkreis'],axis=1)
RKIData.head()
RKIData['Bundesland'].nunique()
RKIData.info()
RKIData.groupby(['Altersgruppe']).sum()
RKIData.groupby(['Bundesland']).sum()
plots = RKIData.groupby(['Geschlecht']).sum().plot(kind="bar",figsize=(20,10),secondary_y="AnzahlTodesfall")
plots.get_figure().savefig('geschlecht.png',dpi=200,pad_inches=5)
RKIData.groupby(['Bundesland','Geschlecht']).sum().sort_values(by="AnzahlFall").plot(kind="bar")
GADaten = RKIData.groupby(['Geschlecht','Altersgruppe']).sum().sort_values(by=["AnzahlFall"])
thePlotGADaten = GADaten.plot(kind="bar",secondary_y="AnzahlTodesfall",figsize=(20,10))
thePlotGADaten.get_figure().savefig('geschlecht-altersgruppe.png',dpi=200,pad_inches=5)
RKIData.groupby(['Bundesland','Altersgruppe']).sum().sort_values(by=["Bundesland","AnzahlTodesfall"])
RKIData.groupby(['Landkreis','Altersgruppe','Geschlecht']).sum().sort_values(by=["AnzahlFall"])[-10:]
RKIData.loc[RKIData['Landkreis'] == "LK Heinsberg"].groupby(['Altersgruppe','Geschlecht']).sum()
LandkreisTodesfall = RKIData.groupby(['Landkreis']).sum().sort_values(by=["AnzahlTodesfall"])[-10:].plot(kind="bar",figsize=(20,10))
LandkreisTodesfall.get_figure().savefig('todesfall-landkreis.png',dpi=200,pad_inches=5)
LandkreisTodesfall = RKIData.groupby(['Landkreis']).sum().sort_values(by=["AnzahlFall"])[-10:].plot(kind="bar",figsize=(20,10))
LandkreisTodesfall.get_figure().savefig('fall-landkreis.png',dpi=200,pad_inches=5)
RKIData.loc[RKIData['Landkreis'] == "LK Heinsberg"].groupby(['Altersgruppe']).sum().plot(kind="bar")
frame = RKIData.groupby(['Altersgruppe']).sum().reset_index()
fig,ax = plt.subplots(figsize=(10,10))
ax.plot(frame['Altersgruppe'], frame['AnzahlTodesfall'], color="black")
ax.set_xlabel("Altersgruppe",fontsize=14)
ax.set_ylabel("Anzahl Todesfall",color="black",fontsize=14)
ax2=ax.twinx()
ax2.plot(frame['Altersgruppe'], frame['AnzahlFall'],color="red")
ax2.set_ylabel("Anzahl Fälle",color="red",fontsize=14)
fig.savefig('data.png',dpi=200,pad_inches=5) # Bild Speichern
frame.head()
Vielen Dank fürs Lesen