slogan3

Help me een Matplotlib-visualisatie maken die belangrijke statistieken uit mijn dataset samenvat

description

Door deze prompt te gebruiken, kun je snel informatieve visualisaties genereren die belangrijke statistische inzichten uit je data benadrukken, wat je vermogen verbetert om bevindingen effectief te communiceren.

prompt

try_prompt

Ik wil belangrijke statistieken visualiseren zoals het gemiddelde, de mediaan en de standaarddeviatie uit mijn dataset: {{dataset_beschrijving}}. De visualisatie moet deze statistieken effectief vergelijken tussen vers ... more
generate_helper
disclaimerOnPageApi image_legal_disclaimer...

ai_answers

provider: openai
model: gpt-4.1-nano
Hier is een voorbeeld van Python-code waarmee je de gemiddelde, mediaan en standaarddeviatie van je verkoopgegevens voor Q1 2023 kunt visualiseren, gesorteerd per categorie. De code gebruikt Matplotlib en Pandas, en bevat opties voor kleuren, labels en stijl: ```python import pandas as pd import matplotlib.pyplot as plt import numpy as np # Voorbeeld: Laad je dataset (pas de bestandsnaam en kolomnamen aan) # df = pd.read_csv('verkoop_q1_2023.csv') # Stel dat je dataset er zo uitziet: # df = pd.DataFrame({ # 'Categorie': ['A', 'A', 'B', 'B', 'C', 'C'], # 'Verkoop': [100, 150, 200, 250, 300, 350] # }) # Groepeer data per categorie en bereken statistieken stats = df.groupby('Categorie')['Verkoop'].agg(['mean', 'median', 'std']).reset_index() # Voor de visualisatie, kies je een breedte voor de staven bar_width = 0.2 # X-as posities voor de groepen categories = stats['Categorie'] indices = np.arange(len(categories)) # Plot de gemiddelde, mediaan en std dev plt.figure(figsize=(10,6)) plt.bar(indices - bar_width, stats['mean'], width=bar_width, color='green', label='Gemiddelde') plt.bar(indices, stats['median'], width=bar_width, color='blue', label='Mediaan') plt.bar(indices + bar_width, stats['std'], width=bar_width, color='orange', label='Standaarddeviatie') # Labels en titel plt.xlabel('Categorie', fontsize=12, fontweight='bold') plt.ylabel('Verkoopwaarde', fontsize=12, fontweight='bold') plt.title('Statistieken Verkoopgegevens Q1 2023 per Categorie', fontsize=14, fontweight='bold') # Zet de x-as tick labels plt.xticks(indices, categories, fontsize=10, fontweight='bold') # Voeg legende toe plt.legend() # Optioneel: maak labels vetgedrukt for label in plt.gca().get_xticklabels(): label.set_fontweight('bold') for text in plt.gca().get_yticklabels(): text.set_fontweight('bold') plt.tight_layout() plt.show() ``` **Aanpassingen:** - Vervang de voorbeeld dataset door je eigen gegevens in `df`. - Pas eventueel de kleuren aan (bijvoorbeeld groen voor alle staven of andere kleuren). - Je kunt ook de presentatie verder aanpassen door fontstijlen, kleuren en layout te wijzigen. Wil je bijvoorbeeld de statistieken in één overzichtelijke staafdiagram met verschillende kleuren of met error-bars? Laat het weten!
provider: deepseek
model: deepseek-chat
Hier is een Python-code voor het visualiseren van belangrijke statistieken met de opgegeven specificaties: ```python import pandas as pd import matplotlib.pyplot as plt import numpy as np # Voorbeeld dataset (vervang dit met je eigen data) data = { 'Categorie': ['Elektronica', 'Kleding', 'Huishouden', 'Sport'] * 10, 'Verkoop': np.random.normal(1000, 200, 40) } df = pd.DataFrame(data) # Bereken statistieken per categorie stats = df.groupby('Categorie')['Verkoop'].agg([ ('Gemiddelde', 'mean'), ('Mediaan', 'median'), ('Standaarddeviatie', 'std') ]).reset_index() # Stel de stijl in plt.style.use('default') fig, ax = plt.subplots(figsize=(12, 8)) # Posities voor de staven x = np.arange(len(stats['Categorie'])) width = 0.25 # Maak staafdiagrammen voor elke statistiek bars1 = ax.bar(x - width, stats['Gemiddelde'], width, label='Gemiddelde', color='green', alpha=0.8) bars2 = ax.bar(x, stats['Mediaan'], width, label='Mediaan', color='lightgreen', alpha=0.8) bars3 = ax.bar(x + width, stats['Standaarddeviatie'], width, label='Standaarddeviatie', color='darkgreen', alpha=0.8) # Aanpassingen voor labels en presentatie ax.set_xlabel('Categorieën', fontweight='bold', fontsize=12) ax.set_ylabel('Waarden', fontweight='bold', fontsize=12) ax.set_title('Statistieken Verkoopgegevens Q1 2023', fontweight='bold', fontsize=14) ax.set_xticks(x) ax.set_xticklabels(stats['Categorie'], fontweight='bold') ax.legend(fontsize=10) # Waarden toevoegen boven de staven def add_values(bars): for bar in bars: height = bar.get_height() ax.text(bar.get_x() + bar.get_width()/2., height + height*0.01, f'{height:.0f}', ha='center', va='bottom', fontweight='bold') add_values(bars1) add_values(bars2) add_values(bars3) # Layout optimaliseren plt.tight_layout() plt.grid(axis='y', alpha=0.3) plt.show() # Toon ook de statistieken in tabelvorm print("\nStatistieken per categorie:") print(stats.round(2)) ``` **Aanpassingsopties:** 1. **Kleuren wijzigen**: ```python # Andere kleuren voor de staven bars1 = ax.bar(x - width, stats['Gemiddelde'], width, color='#2E8B57') # Zeegroen bars2 = ax.bar(x, stats['Mediaan'], width, color='#3CB371') # Middelgroen bars3 = ax.bar(x + width, stats['Standaarddeviatie'], width, color='#228B22') # Bosgroen ``` 2. **Labels aanpassen**: ```python ax.set_xlabel('Productcategorieën', fontweight='bold', fontsize=14) ax.set_ylabel('Verkoopwaarden (€)', fontweight='bold', fontsize=14) ``` 3. **Stijl wijzigen**: ```python plt.style.use('ggplot') # Of 'seaborn', 'fivethirtyeight', etc. ``` 4. **Grootte aanpassen**: ```python fig, ax = plt.subplots(figsize=(14, 10)) # Groter formaat ``` **Voor gebruik:** - Vervang de voorbeelddata met je eigen dataset - Zorg ervoor dat je de benodigde bibliotheken hebt geïnstalleerd: `pip install pandas matplotlib numpy` - De code berekent automatisch gemiddelde, mediaan en standaarddeviatie per categorie - Alle labels zijn vetgedrukt zoals gevraagd - Staven zijn in verschillende tinten groen De visualisatie toont duidelijk de vergelijking tussen de verschillende statistieken per categorie, met duidelijke labels en een professionele presentatie.