Arkitektur

Hur Graffold fungerar

En delad databasarkitektur — Memgraph för graftraverseringar, Cloudflare Vectorize för semantisk sökning — med inläsning från flera källor och hybridåterhämtning. Fullständig härkomst på varje svar.

Inläsningspipeline

Fråge- & hämtningsarkitektur

Integrationer

Graf- & vektorlager

Memgraph + MAGE
Cloudflare Vectorize
Neo4j · FalkorDB

LLM-leverantörer

AWS Bedrock (Claude, Titan)
AWS SageMaker
Cloudflare Workers AI
Ollama (local / air-gapped)
OpenAI-compatible APIs

Datakällor

Any source with an API
PDF files (vision + OCR)
CSV / Excel / Parquet
PubMed / bioRxiv (built-in)

Infrastruktur

Redis (cache + sessions)
OpenTelemetry + Grafana
Docker (per-tenant isolation)
HuggingFace embeddings (768d)

Prestandastack

▸

Rust-accelererad JSON

3–10× snabbare serialisering

▸

Rust ASGI-server

2–4× begärandegenomströmning

▸

In-memory graf

Sub-ms traverseringar via Memgraph

▸

Rust-nativa DataFrames

2–5× snabbare för databehandling

▸

Tokenmedveten chunkning

BPE-tokenizer med meningsgränser

▸

Hybridåterhämtning

Vektor + fulltext + graftraversering

Prestandamätningar

Uppmätta hastighetsökningar från Rust- och C-backade drop-in-ersättningar i hela stacken. Noll omskrivningar av applikationskod krävs.

3–10×

JSON-serialisering

Rust-backad encoder vs stdlib

2–4×

HTTP-genomströmning

Rust ASGI-server vs Python-standard

<1 ms

Graftraversering

In-memory Memgraph, sub-millisekund

2–5×

DataFrame-operationer

Rust-nativa DataFrames vs äldre bibliotek

~10×

Cache-parsning

C-backad parser vs ren Python

250 ms

P50 frågelatens

Hybrid vektor + grafåterhämtning

Bearbetningsgenomströmning

1,000+

Dokument per pipeline-körning

Multi-source

Parallell inläsning över dataflöden

47 → 1

Dubblettkanter konsoliderade per entitetspar

< 15 min

Inkrementell uppdatering för ~100 nya dokument