Privacy-Schutz für deinen KI-Stack.
Bereinige Prompts in Echtzeit mit unserer Open-Source SDK. Führe PII-Erkennung lokal über WebAssembly aus oder deploye den rehydra-Sidecar in deiner VPC für zentrale Governance.
npm i rehydra
import { createAnonymizer } from 'rehydra'; const anonymizer = createAnonymizer({ ner: { mode: 'quantized' }, semantic: { enabled: true } }); await anonymizer.initialize(); const result = await anonymizer.anonymize( 'Hallo John Schmidt von der Acme GmbH in Berlin!' );
Hallo <PII type="PERSON" gender="male" id="1" /> von der <PII type="ORG" id="2" /> in <PII type="LOCATION" scope="city" country="Germany" id="3" />
Guides
Getting Started.
Hier sind einige unserer Getting-Started-Guides, um deine datenschutzkonforme KI-Nutzung zu beschleunigen.

Produkteinführung
Einführung von Rehydra: Die Privacy-Layer für den KI-Stack
04.11.2025

Produkteinführung
Einführung von Rehydra: Die Privacy-Layer für den KI-Stack
04.11.2025

Produkteinführung
Einführung von Rehydra: Die Privacy-Layer für den KI-Stack
04.11.2025

Engineering
Semantic Redaction vs. Regex: Warum Kontext beim Schutz personenbezogener Daten zählt
31.12.2025

Engineering
Semantic Redaction vs. Regex: Warum Kontext beim Schutz personenbezogener Daten zählt
31.12.2025

Engineering
Semantic Redaction vs. Regex: Warum Kontext beim Schutz personenbezogener Daten zählt
31.12.2025
FAQ
Häufig gestellte Fragen
Benötigt die SDK eine Internetverbindung?
Eine Internetverbindung ist nur beim ersten Start erforderlich, um das NER‑Modell und semantische Datensätze (falls aktiviert) von Huggingface herunterzuladen. Nach dem Download werden diese Dateien lokal zwischengespeichert: Node.js: In Standard‑Cache‑Verzeichnissen (z.B. ~/.cache/rehydra unter Linux). Browser: Im Origin Private File System (OPFS) für große Modelldateien und in IndexedDB für Metadaten.
Wie kann ich meine eigenen sensiblen Datentypem erstellen (z. B. Bestellnummern)?
Du kannst benutzerdefinierte, RegEx‑basierte Regeln mit `createCustomIdRecognizer` definieren. Gib einfach eine Regel, einen Namen und einen PII‑Typ an (z.B. `CASE_ID` oder `CUSTOMER_ID`). Zum Beispiel:
Sind die PII‑Mapping‑Daten sicher?
Ja. Die PII‑Map (die Platzhalter‑IDs mit den ursprünglichen Werten verknüpft) wird mit AES‑256‑GCM verschlüsselt. - Entwicklung: `InMemoryKeyProvider` generiert beim Start einen zufälligen Schlüssel (für persistente Nutzung nicht sicher). - Produktion: Verwende `ConfigKeyProvider`, um einen sicheren, persistenten 32‑Byte‑Schlüssel aus deinen Umgebungsvariablen oder deinem Secrets‑Manager zu injizieren. Node.js: In Standard‑Cache‑Verzeichnissen (z. B. ~/.cache/rehydra unter Linux). Browser: Im Origin Private File System (OPFS) für große Modelldateien und in IndexedDB für Metadaten.
Was ist der Unterschied zwischen den „Standard“- und den „quantisierten“ NER‑Modellen?
Das SDK unterstützt zwei Betriebsmodi für das ONNX‑basierte Named‑Entity‑Recognition‑(NER‑)Modell: Quantisiert (~280 MB): Das empfohlene Standardmodell. Es verwendet int8‑Quantisierung für einen geringeren Footprint und schnellere Inferenz bei minimalem Genauigkeitsverlust. Standard (~1,1 GB): Das vollpräzise FP32‑Modell. Es bietet die höchste Genauigkeit, benötigt aber deutlich mehr Speicher und Bandbreite. Beide Modelle werden bei der ersten Initialisierung automatisch heruntergeladen und lokal zwischengespeichert. Entwicklung: `InMemoryKeyProvider` generiert beim Start einen zufälligen Schlüssel (für persistente Nutzung nicht sicher). Produktion: Verwende `ConfigKeyProvider`, um einen sicheren, persistenten 32‑Byte‑Schlüssel aus deinen Umgebungsvariablen oder deinem Secrets‑Manager zu injizieren. Node.js: In Standard‑Cache‑Verzeichnissen (z. B. ~/.cache/rehydra unter Linux). Browser: Im Origin Private File System (OPFS) für große Modelldateien und in IndexedDB für Metadaten.
Wie verbessert rehydra den MT‑Kontext (Machine Translation) für anonymisierte Entitäten?
Du kannst Semantic Enrichment aktivieren, indem du { semantic: { enabled: true } } in der Konfiguration setzt. Dadurch werden zusätzliche Datensätze (~12 MB) heruntergeladen, um Attribute für erkannte Entitäten abzuleiten: Personen: Fügt ein Geschlechts-Attribut (z.B., <PII type="PERSON" gender="female" .../>) hinzu, damit MT Engines korrekte Grammatik verwenden. Orte: Fügt ein Scope‑Attribut hinzu (z. B. Stadt, Land, Region), um die richtige Präposition zu wählen (z. B. „in Berlin“ vs. „in Deutschland“).
Benötigt die SDK eine Internetverbindung?
Eine Internetverbindung ist nur beim ersten Start erforderlich, um das NER‑Modell und semantische Datensätze (falls aktiviert) von Huggingface herunterzuladen. Nach dem Download werden diese Dateien lokal zwischengespeichert: Node.js: In Standard‑Cache‑Verzeichnissen (z.B. ~/.cache/rehydra unter Linux). Browser: Im Origin Private File System (OPFS) für große Modelldateien und in IndexedDB für Metadaten.
Wie kann ich meine eigenen sensiblen Datentypem erstellen (z. B. Bestellnummern)?
Du kannst benutzerdefinierte, RegEx‑basierte Regeln mit `createCustomIdRecognizer` definieren. Gib einfach eine Regel, einen Namen und einen PII‑Typ an (z.B. `CASE_ID` oder `CUSTOMER_ID`). Zum Beispiel:
Sind die PII‑Mapping‑Daten sicher?
Ja. Die PII‑Map (die Platzhalter‑IDs mit den ursprünglichen Werten verknüpft) wird mit AES‑256‑GCM verschlüsselt. - Entwicklung: `InMemoryKeyProvider` generiert beim Start einen zufälligen Schlüssel (für persistente Nutzung nicht sicher). - Produktion: Verwende `ConfigKeyProvider`, um einen sicheren, persistenten 32‑Byte‑Schlüssel aus deinen Umgebungsvariablen oder deinem Secrets‑Manager zu injizieren. Node.js: In Standard‑Cache‑Verzeichnissen (z. B. ~/.cache/rehydra unter Linux). Browser: Im Origin Private File System (OPFS) für große Modelldateien und in IndexedDB für Metadaten.
Was ist der Unterschied zwischen den „Standard“- und den „quantisierten“ NER‑Modellen?
Das SDK unterstützt zwei Betriebsmodi für das ONNX‑basierte Named‑Entity‑Recognition‑(NER‑)Modell: Quantisiert (~280 MB): Das empfohlene Standardmodell. Es verwendet int8‑Quantisierung für einen geringeren Footprint und schnellere Inferenz bei minimalem Genauigkeitsverlust. Standard (~1,1 GB): Das vollpräzise FP32‑Modell. Es bietet die höchste Genauigkeit, benötigt aber deutlich mehr Speicher und Bandbreite. Beide Modelle werden bei der ersten Initialisierung automatisch heruntergeladen und lokal zwischengespeichert. Entwicklung: `InMemoryKeyProvider` generiert beim Start einen zufälligen Schlüssel (für persistente Nutzung nicht sicher). Produktion: Verwende `ConfigKeyProvider`, um einen sicheren, persistenten 32‑Byte‑Schlüssel aus deinen Umgebungsvariablen oder deinem Secrets‑Manager zu injizieren. Node.js: In Standard‑Cache‑Verzeichnissen (z. B. ~/.cache/rehydra unter Linux). Browser: Im Origin Private File System (OPFS) für große Modelldateien und in IndexedDB für Metadaten.
Wie verbessert rehydra den MT‑Kontext (Machine Translation) für anonymisierte Entitäten?
Du kannst Semantic Enrichment aktivieren, indem du { semantic: { enabled: true } } in der Konfiguration setzt. Dadurch werden zusätzliche Datensätze (~12 MB) heruntergeladen, um Attribute für erkannte Entitäten abzuleiten: Personen: Fügt ein Geschlechts-Attribut (z.B., <PII type="PERSON" gender="female" .../>) hinzu, damit MT Engines korrekte Grammatik verwenden. Orte: Fügt ein Scope‑Attribut hinzu (z. B. Stadt, Land, Region), um die richtige Präposition zu wählen (z. B. „in Berlin“ vs. „in Deutschland“).
Benötigt die SDK eine Internetverbindung?
Eine Internetverbindung ist nur beim ersten Start erforderlich, um das NER‑Modell und semantische Datensätze (falls aktiviert) von Huggingface herunterzuladen. Nach dem Download werden diese Dateien lokal zwischengespeichert: Node.js: In Standard‑Cache‑Verzeichnissen (z.B. ~/.cache/rehydra unter Linux). Browser: Im Origin Private File System (OPFS) für große Modelldateien und in IndexedDB für Metadaten.
Wie kann ich meine eigenen sensiblen Datentypem erstellen (z. B. Bestellnummern)?
Du kannst benutzerdefinierte, RegEx‑basierte Regeln mit `createCustomIdRecognizer` definieren. Gib einfach eine Regel, einen Namen und einen PII‑Typ an (z.B. `CASE_ID` oder `CUSTOMER_ID`). Zum Beispiel:
Sind die PII‑Mapping‑Daten sicher?
Ja. Die PII‑Map (die Platzhalter‑IDs mit den ursprünglichen Werten verknüpft) wird mit AES‑256‑GCM verschlüsselt. - Entwicklung: `InMemoryKeyProvider` generiert beim Start einen zufälligen Schlüssel (für persistente Nutzung nicht sicher). - Produktion: Verwende `ConfigKeyProvider`, um einen sicheren, persistenten 32‑Byte‑Schlüssel aus deinen Umgebungsvariablen oder deinem Secrets‑Manager zu injizieren. Node.js: In Standard‑Cache‑Verzeichnissen (z. B. ~/.cache/rehydra unter Linux). Browser: Im Origin Private File System (OPFS) für große Modelldateien und in IndexedDB für Metadaten.
Was ist der Unterschied zwischen den „Standard“- und den „quantisierten“ NER‑Modellen?
Das SDK unterstützt zwei Betriebsmodi für das ONNX‑basierte Named‑Entity‑Recognition‑(NER‑)Modell: Quantisiert (~280 MB): Das empfohlene Standardmodell. Es verwendet int8‑Quantisierung für einen geringeren Footprint und schnellere Inferenz bei minimalem Genauigkeitsverlust. Standard (~1,1 GB): Das vollpräzise FP32‑Modell. Es bietet die höchste Genauigkeit, benötigt aber deutlich mehr Speicher und Bandbreite. Beide Modelle werden bei der ersten Initialisierung automatisch heruntergeladen und lokal zwischengespeichert. Entwicklung: `InMemoryKeyProvider` generiert beim Start einen zufälligen Schlüssel (für persistente Nutzung nicht sicher). Produktion: Verwende `ConfigKeyProvider`, um einen sicheren, persistenten 32‑Byte‑Schlüssel aus deinen Umgebungsvariablen oder deinem Secrets‑Manager zu injizieren. Node.js: In Standard‑Cache‑Verzeichnissen (z. B. ~/.cache/rehydra unter Linux). Browser: Im Origin Private File System (OPFS) für große Modelldateien und in IndexedDB für Metadaten.
Wie verbessert rehydra den MT‑Kontext (Machine Translation) für anonymisierte Entitäten?
Du kannst Semantic Enrichment aktivieren, indem du { semantic: { enabled: true } } in der Konfiguration setzt. Dadurch werden zusätzliche Datensätze (~12 MB) heruntergeladen, um Attribute für erkannte Entitäten abzuleiten: Personen: Fügt ein Geschlechts-Attribut (z.B., <PII type="PERSON" gender="female" .../>) hinzu, damit MT Engines korrekte Grammatik verwenden. Orte: Fügt ein Scope‑Attribut hinzu (z. B. Stadt, Land, Region), um die richtige Präposition zu wählen (z. B. „in Berlin“ vs. „in Deutschland“).



