AI-integratie — Semantische zoek
Semantische zoek over jouw dossiers
Jij weet dat het antwoord in een PDF van vorig jaar staat. Alleen: welke? Ctrl+F werkt niet op 4.000 dossiers. Semantische zoek wel — stel een vraag in normale taal, krijg de exacte passage met bronverwijzing.
Dossier-zoek voor adviseurs
"WBSO projecten 2024 met afgewezen loonkosten" → directe lijst met passages uit beschikkingen, mailwisselingen en notities — met klikbare bron.
Regelingen-encyclopedie
Adviseurs zoeken voorwaarden over regelingen en krijgen een precies antwoord met paragraaf-verwijzing naar het officiële document, niet een algemeen taalmodel-verhaal.
Klant-historie semantisch ontsluiten
Mailwisselingen, gespreksverslagen en bijlagen van een klant doorzoekbaar in één vraag — geen handmatig zoekwerk per map.
Juridische precedenten doorzoeken
Juristen vinden vergelijkbare zaken op argument, niet op woord. Semantiek pakt synoniemen en context die keyword-zoek mist.
Hoe het werkt: jouw documenten worden eenmalig ingelezen (PDF, Word, mail, notities), opgeknipt in coherente stukken en omgezet in vector-embeddings. Een vraag van een gebruiker wordt ook embedded en de meest relevante passages worden teruggezocht. Een taalmodel formuleert het antwoord — alleen op basis van wat in jouw eigen documenten staat, mét bronverwijzing per zin.
Geen hallucinaties: het model mag niets verzinnen wat niet in de bron staat. Onbekend = "ik heb hier geen bron voor". Dat is essentieel voor advies-werk waarin onjuiste informatie tot schade kan leiden.
De data-engineering discipline die we inzetten voor Schiphol, Provincie Zeeland en Gemeente Amstelveen — schone pipelines, controleerbare bronnen, EU-hosting — is dezelfde basis waarop we AI-integraties bouwen voor MKB. RAG en embeddings vereisen kwaliteitsdata, geen hype.
- RAG-architectuur (Retrieval-Augmented Generation) met bronverwijzing per zin
- Ondersteunt PDF, Word, Excel, e-mail, Markdown, Notion-export
- Private embeddings op EU-hosting — jouw data blijft van jou
- Bidirectionele sync: nieuwe documenten automatisch geïndexeerd
- Confidence-score per antwoord — geen "ik weet het zeker" als het niet zo is
- Filteren op tags, datum, dossier, klant of map
- Koppeling met SharePoint, Google Drive, Dropbox of eigen storage
- Audit-log: wie zocht wat, welke bron werd geretourneerd
- Projectprijs vooraf, transparant en helder
- Volledige broncode en 100% eigendom
Investeringsrange
€ 3.500 – € 18.000per project
Een eerste semantische zoek over één corpus (tot 5.000 documenten) begint vanaf €3.500. Grotere corpora, meerdere bronnen en koppelingen met bestaande systemen starten vanaf €8.000 en lopen op tot €18.000 voor de meest complete implementaties.
Plan een gratis gesprek voor een offerte op maat →PROJECT KLEINER DAN VERWACHT?
Twijfel je of jouw project in deze range valt? Vraag toch een offerte aan — kleinere scopes zijn welkom.
Sommige projecten hebben een kleinere kern die binnen 1-2 weken kan landen, of een gefaseerde aanpak die past bij een lager startbudget. Beschrijf in een paar regels wat je voor ogen hebt en je krijgt binnen één werkdag een eerlijke inschatting — ook als dat onder onze range uitkomt.
Vraag een vrijblijvende offerte aan →Geen verkooppraatje · reactie binnen 1 werkdag · vaste prijs vooraf
EIGENDOM & KOSTEN
Vaste prijs vooraf — daarna geen per-gebruiker-tarief
Standaard SaaS-tooling rekent per gebruiker per maand. Hoe meer collega's of klanten meedoen, hoe duurder het wordt. Bij een eigen webapplicatie betaal je één keer voor de bouw — daarna onbeperkt gebruikers.
Wanneer is SaaS goedkoper? Voor kleine teams (tot ~15 mensen) op lichte tools zoals Notion of Airtable is een abonnement vaak gewoon goedkoper. Maatwerk wordt interessant wanneer je workflow afwijkt van standaard tools, of zodra je team groter wordt. Dat zeggen we ook eerlijk als het zo is.
LIEVER NIET ZELF BEHEREN?
Een eigen VPS hoef je niet zelf bij te houden. Managed hosting via Digitaalnu vanaf €49/mnd: monitoring, security updates, backups en directe support inbegrepen. Vlakke maandprijs, geen verrassingen.
Digitaalnu is een handelsnaam van DigiHand · KVK 34315122 · 15 jaar data engineering · EU-hosting · GDPR
Onder andere gebouwd voor
Ook relevant
Document- & mail-intake automatisering
Mails en documenten automatisch classificeren, labelen en routeren naar de juiste adviseur.
Meer info →AI-samenvattingen & extractie
Lange documenten en regelingen samengevat tot 1-pagers met deadlines en bronverwijzing.
Meer info →Interne kennisbank-chatbot (RAG)
Een chatbot getraind op jouw eigen documenten — met bronverwijzing en zonder verzinsels.
Meer info →AI-gevalideerde intake-formulieren
Intake-formulieren die in realtime checken op volledigheid en logica.
Meer info →AI lead scoring & dossier-triage
AI scoort leads en dossiers op fit en winstkans uit jouw eigen historie.
Meer info →Veelgestelde vragen
Wat is semantische zoek en hoe verschilt het van keyword-zoeken?
Keyword-zoek (zoals Ctrl+F of klassieke search) zoekt op exacte woorden. Semantische zoek snapt de betekenis van jouw vraag en vindt documenten die hetzelfde bedoelen — ook als er andere woorden gebruikt worden. "Loonkosten R&D-personeel afwijzen" vindt ook documenten over "salariskosten ontwikkeling niet geaccepteerd". Dat scheelt enorm in dossier-zwaar werk waar schrijvers niet altijd dezelfde termen gebruiken.
Kan ik ChatGPT trainen op mijn eigen bedrijfsdocumenten zonder data te delen?
Nee, niet in de letterlijke zin. Maar wat we wel doen is RAG (Retrieval-Augmented Generation): jouw documenten worden lokaal opgeslagen als embeddings (een numerieke representatie). Bij elke vraag halen we de relevante passages erbij en geven ze als context aan een taalmodel. Het model "leert" niets, het krijgt elke keer opnieuw jouw eigen documenten als bron. Resultaat: actuele, controleerbare antwoorden zonder dat jouw data wordt opgeslagen of gebruikt voor training. Jouw data blijft van jou: private embeddings, vectorstore op EU-hosting (of jouw eigen omgeving), geen training door externe modellen op jouw documenten. GDPR-compliant en auditeerbaar.
Hoe voorkom ik AI-hallucinaties in een zakelijke toepassing?
Door RAG met strikte bronverwijzing. Het taalmodel mag alleen antwoorden op basis van de teruggevonden passages — staat het er niet, dan zegt het systeem dat eerlijk. Elke zin in het antwoord linkt terug naar de exacte bron. Voor extra zekerheid kunnen we een confidence-threshold instellen waaronder het systeem geen antwoord geeft maar doorverwijst naar een mens.
Wat kost semantische zoek over eigen documenten?
Een eerste implementatie met één corpus (1.000-5.000 documenten) begint vanaf €3.500. Grotere corpora, meerdere bronnen, geavanceerde filtering en koppeling met bestaande systemen starten vanaf €8.000 en lopen op tot €18.000 voor de meest uitgebreide setups. We werken met een vaste projectprijs na intake.
Hoe vaak wordt nieuwe content geïndexeerd?
Naar wens: realtime via webhooks (nieuw document = direct doorzoekbaar), elke nacht via batch, of on-demand. Voor de meeste klanten werken we met een nachtelijke sync plus realtime voor de allerbelangrijkste mappen. We bespreken in de intake wat past bij jouw werkstroom.