Creëer Seaborn Visualisaties met Geavanceerde Kleurcodering op Basis van Meerdere Variabelen
description
Met deze prompt kan de gebruiker geavanceerde kleurcodering toepassen op Seaborn visualisaties, waardoor het mogelijk wordt om meerdere variabelen tegelijk visueel te representeren. Dit helpt bij het beter onderscheiden van datagroepen en het verkrijgen van diepere inzichten. Het biedt flexibiliteit in kleurenschema’s en styling, wat het aantrekkelijker en informatiever maakt dan standaard kleurtoewijzingen.
prompt
Help me een Seaborn visualisatie te maken waarin ik geavanceerde kleurcodering kan toepassen, gebaseerd op meerdere variabelen uit mijn dataset. Beschrijving van mijn dataset: <beschrijf kort je dataset>. Welke variabelen wil ik gebruiken voor kleurcodering: <noem de kolommen die de kle ...
try_prompt
generate_helper
disclaimerOnPageApi
tags
ai_answers
provider: openai
model: gpt-4.1-nano
no_answer_for_language
error: Generation failed [openai] prompt_id=3693 locale=nl err=OpenAI connection/timeout | Generation failed [openai] prompt_id=3693 locale=en err=OpenAI connection/timeout | Generation failed [openai] prompt_id=3693 locale=de err=OpenAI connection/timeout | Generation failed [openai] prompt_id=3693 locale=fr err=OpenAI connection/timeout | Generation failed [openai] prompt_id=3693 locale=pt err=OpenAI connection/timeout | Generation failed [openai] prompt_id=3693 locale=es err=OpenAI connection/timeout | Generation failed [openai] prompt_id=3693 locale=zh err=OpenAI connection/timeout
provider: deepseek
model: deepseek-chat
Zeker, hier is een voorbeeld van hoe je een geavanceerde scatterplot kunt maken met Seaborn met kleurcodering op basis van twee variabelen:
```python
import seaborn as sns
import matplotlib.pyplot as plt
import pandas as pd
import numpy as np
# Stel de stijl in
sns.set_style("whitegrid")
plt.figure(figsize=(12, 8))
# Voorbeeld dataset (vervang met je eigen data)
# Stel dat je DataFrame 'df' heet met kolommen:
# product_categorie, klantsegment, omzet, x_variabele, y_variabele
# Creëer een combinatievariabele voor dubbele kleurcodering
df['combinatie'] = df['product_categorie'] + ' - ' + df['klantsegment']
# Maak een scatterplot met geavanceerde kleurcodering
scatter = sns.scatterplot(
data=df,
x='x_variabele', # vervang met je x-as variabele
y='y_variabele', # vervang met je y-as variabele
hue='combinatie', # kleur op basis van beide variabelen
size='omzet', # grootte van punten gebaseerd op omzet
sizes=(20, 200), # range van puntgroottes
alpha=0.7,
palette='tab20' # gebruik een kleurenpalet met veel kleuren
)
# Annotaties voor hoogste omzetpunten
top_omzet = df.nlargest(5, 'omzet')
for i, row in top_omzet.iterrows():
plt.annotate(f'€{row["omzet"]:,.0f}',
(row['x_variabele'], row['y_variabele']),
xytext=(5, 5),
textcoords='offset points',
fontsize=9,
bbox=dict(boxstyle="round,pad=0.3", fc="yellow", alpha=0.7))
# Pas de legende aan
plt.legend(bbox_to_anchor=(1.05, 1), loc='upper left', borderaxespad=0.)
# Titel en labels
plt.title('Omzetanalyse per Productcategorie en Klantsegment', fontsize=16, pad=20)
plt.xlabel('X-as Variabele')
plt.ylabel('Y-as Variabele')
# Formatteer de omzetwaarden in de legende
for text in scatter.legend_.get_texts():
if 'omzet' in text.get_text():
omzet_waarde = float(text.get_text().split(' ')[-1])
text.set_text(f'Omzet: €{omzet_waarde:,.0f}')
plt.tight_layout()
plt.show()
```
**Aanvullende opties voor kleurenschema's:**
```python
# Alternatieve kleurenschema's:
palette = sns.color_palette("husl", n_colors=len(df['combinatie'].unique()))
# of
palette = sns.color_palette("Set2", n_colors=len(df['combinatie'].unique()))
# of
palette = sns.color_palette("viridis", n_colors=len(df['combinatie'].unique()))
```
**Belangrijke aanpassingen die je moet maken:**
- Vervang 'x_variabele' en 'y_variabele' met je daadwerkelijke kolomnamen
- Zorg dat je DataFrame de juiste kolommen bevat
- Pas de kleurenpalet aan naar je voorkeur
- Stel de annotatieteksten naar wens bij
Dit voorbeeld geeft je een scatterplot waarbij:
- Kleuren unieke combinaties van productcategorie en klantsegment weergeven
- Puntgrootte de omzet representeert
- De hoogste omzetpunten geannoteerd zijn
- Een duidelijke legenda wordt getoond