Help me een Matplotlib-visualisatie maken die belangrijke statistieken uit mijn dataset samenvat
description
Door deze prompt te gebruiken, kun je snel informatieve visualisaties genereren die belangrijke statistische inzichten uit je data benadrukken, wat je vermogen verbetert om bevindingen effectief te communiceren.
prompt
try_prompt
Ik wil belangrijke statistieken visualiseren zoals het gemiddelde, de mediaan en de standaarddeviatie uit mijn dataset: {{dataset_beschrijving}}. De visualisatie moet deze statistieken effectief vergelijken tussen vers ... more
generate_helper
...
tags
ai_answers
provider: openai
model: gpt-4.1-nano
Hier is een voorbeeld van Python-code waarmee je de gemiddelde, mediaan en standaarddeviatie van je verkoopgegevens voor Q1 2023 kunt visualiseren, gesorteerd per categorie. De code gebruikt Matplotlib en Pandas, en bevat opties voor kleuren, labels en stijl:
```python
import pandas as pd
import matplotlib.pyplot as plt
import numpy as np
# Voorbeeld: Laad je dataset (pas de bestandsnaam en kolomnamen aan)
# df = pd.read_csv('verkoop_q1_2023.csv')
# Stel dat je dataset er zo uitziet:
# df = pd.DataFrame({
# 'Categorie': ['A', 'A', 'B', 'B', 'C', 'C'],
# 'Verkoop': [100, 150, 200, 250, 300, 350]
# })
# Groepeer data per categorie en bereken statistieken
stats = df.groupby('Categorie')['Verkoop'].agg(['mean', 'median', 'std']).reset_index()
# Voor de visualisatie, kies je een breedte voor de staven
bar_width = 0.2
# X-as posities voor de groepen
categories = stats['Categorie']
indices = np.arange(len(categories))
# Plot de gemiddelde, mediaan en std dev
plt.figure(figsize=(10,6))
plt.bar(indices - bar_width, stats['mean'], width=bar_width, color='green', label='Gemiddelde')
plt.bar(indices, stats['median'], width=bar_width, color='blue', label='Mediaan')
plt.bar(indices + bar_width, stats['std'], width=bar_width, color='orange', label='Standaarddeviatie')
# Labels en titel
plt.xlabel('Categorie', fontsize=12, fontweight='bold')
plt.ylabel('Verkoopwaarde', fontsize=12, fontweight='bold')
plt.title('Statistieken Verkoopgegevens Q1 2023 per Categorie', fontsize=14, fontweight='bold')
# Zet de x-as tick labels
plt.xticks(indices, categories, fontsize=10, fontweight='bold')
# Voeg legende toe
plt.legend()
# Optioneel: maak labels vetgedrukt
for label in plt.gca().get_xticklabels():
label.set_fontweight('bold')
for text in plt.gca().get_yticklabels():
text.set_fontweight('bold')
plt.tight_layout()
plt.show()
```
**Aanpassingen:**
- Vervang de voorbeeld dataset door je eigen gegevens in `df`.
- Pas eventueel de kleuren aan (bijvoorbeeld groen voor alle staven of andere kleuren).
- Je kunt ook de presentatie verder aanpassen door fontstijlen, kleuren en layout te wijzigen.
Wil je bijvoorbeeld de statistieken in één overzichtelijke staafdiagram met verschillende kleuren of met error-bars? Laat het weten!
provider: deepseek
model: deepseek-chat
Hier is een Python-code voor het visualiseren van belangrijke statistieken met de opgegeven specificaties:
```python
import pandas as pd
import matplotlib.pyplot as plt
import numpy as np
# Voorbeeld dataset (vervang dit met je eigen data)
data = {
'Categorie': ['Elektronica', 'Kleding', 'Huishouden', 'Sport'] * 10,
'Verkoop': np.random.normal(1000, 200, 40)
}
df = pd.DataFrame(data)
# Bereken statistieken per categorie
stats = df.groupby('Categorie')['Verkoop'].agg([
('Gemiddelde', 'mean'),
('Mediaan', 'median'),
('Standaarddeviatie', 'std')
]).reset_index()
# Stel de stijl in
plt.style.use('default')
fig, ax = plt.subplots(figsize=(12, 8))
# Posities voor de staven
x = np.arange(len(stats['Categorie']))
width = 0.25
# Maak staafdiagrammen voor elke statistiek
bars1 = ax.bar(x - width, stats['Gemiddelde'], width, label='Gemiddelde', color='green', alpha=0.8)
bars2 = ax.bar(x, stats['Mediaan'], width, label='Mediaan', color='lightgreen', alpha=0.8)
bars3 = ax.bar(x + width, stats['Standaarddeviatie'], width, label='Standaarddeviatie', color='darkgreen', alpha=0.8)
# Aanpassingen voor labels en presentatie
ax.set_xlabel('Categorieën', fontweight='bold', fontsize=12)
ax.set_ylabel('Waarden', fontweight='bold', fontsize=12)
ax.set_title('Statistieken Verkoopgegevens Q1 2023', fontweight='bold', fontsize=14)
ax.set_xticks(x)
ax.set_xticklabels(stats['Categorie'], fontweight='bold')
ax.legend(fontsize=10)
# Waarden toevoegen boven de staven
def add_values(bars):
for bar in bars:
height = bar.get_height()
ax.text(bar.get_x() + bar.get_width()/2., height + height*0.01,
f'{height:.0f}', ha='center', va='bottom', fontweight='bold')
add_values(bars1)
add_values(bars2)
add_values(bars3)
# Layout optimaliseren
plt.tight_layout()
plt.grid(axis='y', alpha=0.3)
plt.show()
# Toon ook de statistieken in tabelvorm
print("\nStatistieken per categorie:")
print(stats.round(2))
```
**Aanpassingsopties:**
1. **Kleuren wijzigen**:
```python
# Andere kleuren voor de staven
bars1 = ax.bar(x - width, stats['Gemiddelde'], width, color='#2E8B57') # Zeegroen
bars2 = ax.bar(x, stats['Mediaan'], width, color='#3CB371') # Middelgroen
bars3 = ax.bar(x + width, stats['Standaarddeviatie'], width, color='#228B22') # Bosgroen
```
2. **Labels aanpassen**:
```python
ax.set_xlabel('Productcategorieën', fontweight='bold', fontsize=14)
ax.set_ylabel('Verkoopwaarden (€)', fontweight='bold', fontsize=14)
```
3. **Stijl wijzigen**:
```python
plt.style.use('ggplot') # Of 'seaborn', 'fivethirtyeight', etc.
```
4. **Grootte aanpassen**:
```python
fig, ax = plt.subplots(figsize=(14, 10)) # Groter formaat
```
**Voor gebruik:**
- Vervang de voorbeelddata met je eigen dataset
- Zorg ervoor dat je de benodigde bibliotheken hebt geïnstalleerd: `pip install pandas matplotlib numpy`
- De code berekent automatisch gemiddelde, mediaan en standaarddeviatie per categorie
- Alle labels zijn vetgedrukt zoals gevraagd
- Staven zijn in verschillende tinten groen
De visualisatie toont duidelijk de vergelijking tussen de verschillende statistieken per categorie, met duidelijke labels en een professionele presentatie.

