slogan3

Ontwikkel een OpenAI-integratie voor geautomatiseerde documentverwerking en extractie

description

Met deze prompt kan de gebruiker een geavanceerde OpenAI-integratie ontwerpen die handmatige documentverwerking automatiseert, tijd bespaart en de nauwkeurigheid verhoogt bij het extraheren van belangrijke gegevens. Dit vermindert fouten, versnelt workflows en integreert naadloos in bestaande systemen, waardoor het efficiënter is dan handmatige of minder gespecialiseerde alternatieven.

prompt

Help me een OpenAI-integratie te ontwerpen die geautomatiseerde verwerking en extractie van informatie uit documenten mogelijk maakt. Documenttype: <voer het type documenten in die ik wil verwerken> Belangrijke informatie om te extraheren: <beschrijf welke informatie ik wil extraheren> Verwerkingswor ...

try_prompt

generate_helper
disclaimerOnPageApi

ai_answers

provider: openai
model: gpt-4.1-nano
Voor het automatisch verwerken en extraheren van informatie uit facturen met een Node.js backend en Express, raad ik het gebruik van OpenAI’s GPT-modellen aan, gecombineerd met documentvoorverwerkingstechnieken. Hier is een gestructureerd voorstel: 1. **Modelkeuze en API-functies** - Gebruik de GPT-4 modellen (bijvoorbeeld `gpt-4` of `gpt-4-turbo`) voor hoge nauwkeurigheid en efficiëntie. - Maak gebruik van de **ChatCompletion API** voor gespreks-achtige interacties en betere contextbeheer. - Overweeg het gebruik van **fine-tuning** of **prompt engineering** voor consistente extractie. 2. **Voorbereiding van documenten** - Converteer facturen naar tekst (bijvoorbeeld via OCR voor gescande documenten of directe tekstextractie bij digitale facturen). - Splits grote documenten indien nodig in kleinere chunks voor betere verwerking. 3. **Promptontwerp** - Gebruik een gestructureerde prompt die duidelijk aangeeft welke informatie geëxtraheerd moet worden. - Voorbeeld prompt: ``` Gegeven de volgende factuurtekst: [factuurtekst] Extracteer de volgende gegevens: 1. Naam klant 2. Adres 3. Contactgegevens (telefoon, e-mail) Geef het antwoord in JSON-formaat, bijvoorbeeld: { "naam_klant": "...", "adres": "...", "contactgegevens": { "telefoon": "...", "email": "..." } } ``` 4. **Voorbeeld API-aanroep in Node.js** ```javascript const { Configuration, OpenAIApi } = require("openai"); const configuration = new Configuration({ apiKey: 'JOUW_OPENAI_API_KEY', }); const openai = new OpenAIApi(configuration); async function extractInvoiceData(factuurTekst) { const prompt = ` Gegeven de volgende factuurtekst: ${factuurTekst} Extracteer de volgende gegevens: 1. Naam klant 2. Adres 3. Contactgegevens (telefoon, e-mail) Geef het antwoord in JSON-formaat, bijvoorbeeld: { "naam_klant": "...", "adres": "...", "contactgegevens": { "telefoon": "...", "email": "..." } } `; const response = await openai.createChatCompletion({ model: "gpt-4", messages: [ { role: "system", content: "Je bent een data-extractie assistent voor facturen." }, { role: "user", content: prompt } ], temperature: 0, max_tokens: 500, }); const antwoord = response.data.choices[0].message.content; try { const data = JSON.parse(antwoord); return data; } catch (error) { console.error("Fout bij JSON-parsing:", error); return null; } } ``` 5. **Verwerkingsworkflow** - Verzamel documenten (bijv. upload via API, batchverwerking). - Converteer documenten naar tekst. - Roep `extractInvoiceData()` aan voor elk document. - Sla de output op in een database of bestandssysteem. 6. **Aanvullende tips** - Gebruik batchverwerking en asynchrone calls om efficiëntie te verhogen. - Implementeer foutafhandeling en fallback-methoden bij onduidelijke extracties. - Overweeg het gebruik van caching of promptspecificaties om kosten te minimaliseren. **Samenvatting:** Gebruik `gpt-4` via de ChatCompletion API met goed ontworpen prompts voor nauwkeurige en efficiënte informatie-extractie. Combineer dit met voorafgaande tekstconversie en batchverwerking binnen je Node.js/Express backend voor een robuuste oplossing.
provider: deepseek
model: deepseek-chat
Voor het automatisch verwerken en extraheren van informatie uit facturen met OpenAI raad ik het volgende aan: ## Aanbevolen OpenAI-modellen en API's **Primaire keuze: GPT-4 Turbo with Vision** - Ondersteunt zowel tekst- als beeldverwerking (PDF, afbeeldingen) - Uitstekende nauwkeurigheid voor gestructureerde data-extractie - Geschikt voor complexe documentstructuren **Alternatief: gpt-4-1106-preview** - Zeer capabel voor tekstgebaseerde extractie - Lagere kosten dan Vision-model ## API-aanbevelingen ### 1. Chat Completions API met Vision ```javascript const OpenAI = require('openai'); const openai = new OpenAI({ apiKey: process.env.OPENAI_API_KEY }); async function extractInvoiceData(fileBuffer, fileName) { const response = await openai.chat.completions.create({ model: "gpt-4-vision-preview", messages: [ { role: "user", content: [ { type: "text", text: "Extreer de volgende gegevens uit deze factuur in JSON-formaat: naam klant, adres, contactgegevens. Geef alleen de JSON terug zonder extra tekst." }, { type: "image_url", image_url: { url: `data:application/pdf;base64,${fileBuffer.toString('base64')}` } } ] } ], max_tokens: 1000 }); return JSON.parse(response.choices[0].message.content); } ``` ### 2. Batch Processing voor efficiëntie ```javascript async function processBatchInvoices(files) { const batchPromises = files.map(async (file) => { try { const extractedData = await extractInvoiceData(file.buffer, file.originalname); return { fileName: file.originalname, data: extractedData, status: 'success' }; } catch (error) { return { fileName: file.originalname, error: error.message, status: 'failed' }; } }); return Promise.all(batchPromises); } ``` ## Integratievoorbeeld met Express ```javascript const express = require('express'); const multer = require('multer'); const app = express(); const upload = multer({ storage: multer.memoryStorage() }); app.post('/api/process-invoices', upload.array('invoices', 10), async (req, res) => { try { const results = await processBatchInvoices(req.files); // Opslaan in database (voorbeeld met MongoDB) await InvoiceResult.insertMany(results.filter(r => r.status === 'success')); res.json({ processed: results.length, successful: results.filter(r => r.status === 'success').length, results: results }); } catch (error) { res.status(500).json({ error: error.message }); } }); ``` ## Optimalisatietips 1. **Prompt Engineering**: Verfijn je prompt voor betere resultaten: ```javascript const extractionPrompt = ` Extreer exact de volgende gegevens uit de factuur: - klant_naam: volledige naam van de klant - adres: volledig postadres - contact: telefoonnummer en e-mail Geef antwoord in JSON-formaat: { "klant_naam": string, "adres": string, "contact": string } `; ``` 2. **Error Handling**: Implementeer retry-logica voor API-limieten 3. **Caching**: Sla resultaten op om dubbele verwerking te voorkomen 4. **Validatie**: Voeg post-processing validatie toe voor extra betrouwbaarheid ## Kostenoverwegingen - Gebruik `gpt-4-1106-preview` voor tekst-only facturen om kosten te besparen - Implementeer rate limiting om API-kosten te beheren - Overweeg asyncrone verwerking voor grote batches Deze aanpak biedt een goede balans tussen nauwkeurigheid, efficiëntie en integratiegemak met je Node.js/Express omgeving.