Automatiseer het maken van Seaborn-visualisaties met Python-scripts
description
Met deze prompt kun je eenvoudig een Python-script laten maken dat je visuele analyse automatiseert, waardoor je tijd bespaart en consistente, reproduceerbare Seaborn-grafieken krijgt. Het lost het probleem op van handmatig grafieken maken en biedt flexibiliteit door filters en exportopties toe te voegen. Hierdoor kun je sneller inzichten delen en je werkstroom stroomlijnen.
prompt
Help me bij het schrijven van een Python-script dat automatisch Seaborn-visualisaties genereert op basis van mijn dataset en opgegeven criteria. Dataset beschrijving: <beschrijf je dataset kort> Soort visualisatie: <kies het type visualisatie, bijvoorbeeld histogram, ...
try_prompt
generate_helper
disclaimerOnPageApi
tags
ai_answers
provider: openai
model: gpt-4.1-nano
Natuurlijk! Hier is een voorbeeld van een Python-script dat een Seaborn-histogram genereert van de leeftijd van klanten uit categorie A en deze opslaat als PNG-bestand:
```python
import pandas as pd
import seaborn as sns
import matplotlib.pyplot as plt
# Laad je dataset
# Vervang 'jouw_dataset.csv' door de juiste bestandsnaam of datalocatie
df = pd.read_csv('jouw_dataset.csv')
# Filter de dataset op klanten uit categorie A
# Vervang 'categorie' en 'A' door de juiste kolomnaam en waarde
filtered_df = df[df['categorie'] == 'A']
# Stel de visualisatie in
plt.figure(figsize=(10, 6))
sns.histplot(filtered_df['leeftijd'], kde=False)
plt.title('Leeftijd van klanten uit categorie A')
plt.xlabel('Leeftijd')
plt.ylabel('Aantal klanten')
# Sla de visualisatie op als PNG
plt.savefig('leeftijd_categorie_A.png')
plt.close()
```
**Aanpassingen die je moet maken:**
- Vervang `'jouw_dataset.csv'` door de daadwerkelijke bestandsnaam of pad naar je dataset.
- Controleer of de kolomnaam `'categorie'` overeenkomt met die in jouw dataset.
- Vervang `'A'` indien nodig door de exacte waarde die jouw categorie aangeeft.
- Pas de kolomnaam `'leeftijd'` aan indien deze anders heet.
Wil je dat ik een uitgebreider script maak dat bijvoorbeeld meerdere visualisaties of filters ondersteunt?
provider: deepseek
model: deepseek-chat
Hier is een Python-script dat een histogram genereert voor de leeftijd van klanten uit categorie A:
```python
import pandas as pd
import seaborn as sns
import matplotlib.pyplot as plt
# Laad je dataset (vervang 'jouw_dataset.csv' met je bestandsnaam)
df = pd.read_csv('jouw_dataset.csv')
# Filter alleen klanten uit categorie A
categorie_a_data = df[df['categorie'] == 'A']
# Stel de stijl van Seaborn in
sns.set_style("whitegrid")
# Maak het histogram
plt.figure(figsize=(10, 6))
histogram = sns.histplot(data=categorie_a_data, x='leeftijd', bins=20, kde=True)
# Stel titel en labels in
plt.title('Leeftijdsverdeling van Klanten in Categorie A', fontsize=16)
plt.xlabel('Leeftijd', fontsize=12)
plt.ylabel('Aantal Klanten', fontsize=12)
# Sla de visualisatie op als PNG
plt.savefig('leeftijd_histogram_categorie_a.png',
dpi=300,
bbox_inches='tight',
format='png')
# Toon de plot (optioneel)
plt.show()
print("Histogram succesvol opgeslagen als 'leeftijd_histogram_categorie_a.png'")
```
**Belangrijke aanpassingen die je mogelijk moet maken:**
1. **Bestandsnaam**: Verander `'jouw_dataset.csv'` naar de werkelijke naam van je datasetbestand
2. **Kolomnamen**: Controleer of de kolomnamen `'categorie'` en `'leeftijd'` overeenkomen met je dataset
3. **Categoriewaarde**: Als categorie A anders is genoemd (bijv. 'A', 'Category_A', etc.), pas dit dan aan
**Vereiste bibliotheken** (installeer met `pip install` indien nodig):
- pandas
- seaborn
- matplotlib
**Extra opties die je kunt aanpassen:**
- `bins=20`: aantal intervallen in het histogram
- `kde=True`: voegt een kernel density estimate curve toe
- `figsize=(10,6)`: grootte van de afbeelding
- `dpi=300`: resolutie van de outputafbeelding
Het script zal automatisch filteren op categorie A en een professioneel histogram genereren in PNG-formaat.