Archivum

Om projektet

Archivum — semantisk søgning i Folketingets Åbne Data

Hvad er Archivum?

Archivum er et højperformant søge- og genfindingsværktøj til danske parlamentariske dokumenter. Systemet giver adgang til over 625.000 OCR-skannet sider fra Folketing Open Data, der spænder over årtiers parlamentarisk virksomhed.

I modsætning til traditionelle nøgleordssøgninger benytter Archivum semantisk søgning baseret på vektorsimilaritet. Det betyder, at systemet forstår meningen bag din forespørgsel og finder dokumenter, der er indholdsmæssigt relevante — også selvom de ikke indeholder de præcise ord, du har skrevet.

Archivum er bygget til politologer, jurister og forskere, der har brug for hurtig, konfigurerbar og transparent adgang til parlamentariske dokumenter på side- og dokumentniveau.

Teknologi

Søgesystemet er bygget på et to-trins arkitektur: først konverteres din søgning til en numerisk vektor via en sprogmodel. Derefter sammenlignes denne vektor med forudberegnede gennemsnitsvektorer for hvert dokument i databasen ved hjælp af cosinusliged.

Dokumenter, der overstiger den valgte grænseværdi for lighed, rangeres og præsenteres i resultattabellen. Du kan justere præcisionsniveauet via cosinus-skyderen og filtrere på dokumenttype, minimalt antal relevante sider og emneord.

Datakilde

Folketing Open Data — offentligt tilgængeligt via Folketingets åbne database. Dokumenterne dækker lovforslag, betænkninger, beslutningsforslag, redegørelser og parlamentstaler.

Om udvikleren

Anders Kozuch
Anders KozuchAros Tech · Aarhus Universitet

Anders Kozuch er udvikleren bag Archivum og er kandidatstuderende på Institut for Statskundskab ved Aarhus Universitet samt ejer af software-firmaet Aros Tech. Anders er 27 år og selvlært programmør med en stærk profil inden for AI, data science og mobil app-udvikling. Han har arbejdet med parlamentariske og retlige dokumenter ad forskellige omgange undervejs i studiet, senest med sin bacheloropgave om regelvækst og vækst i embedsværket, som er udgivet i Djøfbladet og Administrativ Debat.

Kontakt

Anders Kozuchanders@arostech.dk

Har du spørgsmål til projektet, ønsker du adgang til rådata, eller vil du samarbejde — så skriv endelig.