Ontwikkel een Claude-gestuurde Automatische Data Verrijkingsworkflow
description
Met deze prompt kan de gebruiker een geavanceerde workflow ontwerpen die bestaande data automatisch aanvult met externe en contextuele informatie, waardoor analyses betrouwbaarder en inzichten waardevoller worden. Dit lost het probleem op van incomplete datasets en handmatige data-aanvulling en is efficiënter dan handmatige methoden.
prompt
Help me een automatische data verrijkingsworkflow te ontwikkelen met Claude die mijn bestaande datasets kan aanvullen met relevante externe informatie en inzichten. Beschrijf hoe Claude kan worden ingezet om data te analyseren, ontbrekende gegevens aan te vullen, en conte ...
try_prompt
generate_helper
disclaimerOnPageApi
tags
ai_answers
provider: openai
model: gpt-4.1-nano
no_answer_for_language
error: Generation failed [openai] prompt_id=3723 locale=nl err=OpenAI connection/timeout | Generation failed [openai] prompt_id=3723 locale=en err=OpenAI connection/timeout | Generation failed [openai] prompt_id=3723 locale=de err=OpenAI connection/timeout | Generation failed [openai] prompt_id=3723 locale=fr err=OpenAI connection/timeout | Generation failed [openai] prompt_id=3723 locale=pt err=OpenAI connection/timeout | Generation failed [openai] prompt_id=3723 locale=es err=OpenAI connection/timeout | Generation failed [openai] prompt_id=3723 locale=zh err=OpenAI connection/timeout
provider: deepseek
model: deepseek-chat
Absoluut. Hier is een gedetailleerd stappenplan voor een automatische dataverrijkingsworkflow met Claude, specifiek toegespitst op uw dataset en doelen.
### Overzicht van de Workflow
De workflow bestaat uit drie hoofdonderdelen:
1. **Data-extractie en -voorbereiding:** Het structureren van uw bestaande data en het identificeren van ontbrekende waarden.
2. **Dataverrijking met Claude:** Het gebruik van Claude als een intelligente "onderzoeksassistent" om externe bronnen te benutten.
3. **Data-integratie en -validatie:** Het samenvoegen en controleren van de verrijkte data.
---
### Stap 1: Data Extractie en Voorbereiding
1. **Exporteer uw dataset:** Exporteer uw klantgegevens (naam, e-mail, aankoopgeschiedenis) naar een gestructureerd formaat zoals CSV of JSON.
2. **Identificeer hiaten:** Gebruik een eenvoudig script of filter in Excel/Sheets om alle records zonder telefoonnummer en adres te markeren. Deze lijst vormt de input voor Claude.
3. **Structureer de prompt-invoer:** Maak een JSON-object per klant dat u naar Claude stuurt. Dit zorgt voor consistentie.
**Voorbeeld van een input-JSON:**
```json
{
"klant_id": "12345",
"naam": "Jansen B.V.",
"email": "info@jansenbv.nl",
"aankoopgeschiedenis": ["Product A - 2023-11-01", "Product B - 2024-01-15"],
"doel_verrijking": ["telefoonnummer", "bedrijfsadres", "postcode", "plaats"]
}
```
---
### Stap 2: Dataverrijking met Claude (de kern van de workflow)
Claude fungeert hier niet als een live data-querytool, maar als een uitzonderlijk krachtige tekst- en patroonherkenningsengine. U gaat Claude "voeden" met informatie van externe bronnen en vragen deze te analyseren.
**Aanpak voor het vinden van telefoonnummers en adressen:**
**A. Verrijking via KvK-data (Publieke Bronnen):**
1. **Scrape of download KvK-gegevens:** Verzamel basisprofielen van bedrijven van de KvK-website (handelsnaam, vestigingsadres, telefoonnummer). Sla deze gegevens op in een tekstbestand (bijv. `kvk_data.txt`).
2. **Gebruik Claude voor fuzzy matching:**
* **Prompt:**
```
Hier is een lijst met KvK-gegevens (Handelsnaam, Adres, Telefoon):
[Plak hier de inhoud van kvk_data.txt]
Hier is een klantrecord dat ik wil verrijken:
{ "naam": "Jansen B.V.", "email": "info@jansenbv.nl" }
Vind het meest waarschijnlijke KvK-record voor deze klant op basis van de handelsnaam en het e-maildomein (@jansenbv.nl). Geef het bijbehorende telefoonnummer en volledige adres terug in een gestructureerd JSON-formaat. Als je geen goede match kunt vinden, geef dan null terug.
Antwoord ALTIJD alleen met een geldig JSON-object, geen andere tekst:
{ "telefoonnummer": "...", "straat": "...", "postcode": "...", "plaats": "..." }
```
* Claude's kracht in het begrijpen van context en het matchen van bedrijfsnamen (ook bij kleine spellingverschillen) is hier cruciaal.
**B. Verrijking via LinkedIn (Meer Geavanceerd):**
1. **Verzamel publieke profielgegevens:** Gebruik tools (zoals scraping-API's of browser-extensies - *zorg voor compliance met Terms of Service*) om publieke LinkedIn-profielpagina's van uw contacten op te halen. Sla de ruwe tekst van deze profielen op.
2. **Laat Claude de profielen parseren:**
* **Prompt:**
```
Analyseer het volgende LinkedIn-profiel en extraheer het telefoonnummer en adres als deze beschikbaar zijn. Negeer alle andere informatie.
**LinkedIn Profiel Tekst:**
[Plak hier de ruwe tekst van het LinkedIn-profiel van de klant]
**Bestaande Klantgegevens (voor context):**
Naam: [Naam klant]
E-mail: [E-mail klant]
Geef alleen de ontbrekende gegevens terug in een strikt JSON-formaat. Als een veld niet gevonden is, gebruik dan null.
{
"telefoonnummer": "0612345678 of null",
"bedrijfsnaam": "Jansen B.V. of null",
"functie": "Directeur of null",
"plaats": "Utrecht of null"
}
```
* Claude is expert in het vinden van specifieke informatie in grote lappen tekst, zelfs als deze niet perfect gestructureerd is.
---
### Stap 3: Data-integratie en Validatie
1. **Ontvang Claude's output:** Claude zal antwoorden met een netjes gestructureerd JSON-object, klaar voor automatisering.
2. **Automatiseer de workflow:** Gebruik een scripttaal (Python is ideaal) om dit proces te schalen:
* Lees uw input-CSV.
* Voor elke rij zonder telefoonnummer/adres, construeer een prompt zoals hierboven.
* Stuur de prompt naar de Claude API.
* Ontvang en parseer het JSON-antwoord.
* Schrijf de verrijkte gegevens terug naar een nieuwe CSV of uw database.
3. **Validatie:** Implementeer een eenvoudige validatiestap. Bijvoorbeeld: alle gevonden telefoonnummers moeten voldoen aan het Nederlandse nummerformaat (06-..., +316...). Claude kan hier ook bij helpen met een validatieprompt.
### Belangrijke Overwegingen en Best Practices
* **Privacy en Compliance (AVG/GDPR):** Dit is het allerbelangrijkste. U mag alleen gegevens verwerken en verrijken waarvoor u een gerechtvaardigd belang of toestemming heeft. Het gebruik van publiekelijk beschikbare data (KvK) is generally safer dan het scrapen van persoonlijke profielen (LinkedIn). **Wees u altijd bewust van de wettelijke grenzen.**
* **Kwaliteit van de Bronnen:** De output is direct afhankelijk van de kwaliteit en beschikbaarheid van de externe bronnen. KvK-data zijn zeer betrouwbaar voor bedrijfsgegevens.
* **Foutafhandeling:** Uw script moet om kunnen gaan met gevallen waarin Claude `null` teruggeeft (geen match gevonden).
* **Kosten en Schaalbaarheid:** Het gebruik van de Claude API heeft kosten per request. Test de nauwkeurigheid eerst op een kleine batch (50-100 records) voordat u op grote schaal gaat verrijken.
Door Claude op deze manier in te zetten als een intelligente analyse- en extractielaag, transformeert u het van een pure chatbot naar een krachtige engine voor dataverrijking.