Entwickler - rehydra

Benötigt die SDK eine Internetverbindung?

Eine Internetverbindung ist nur beim ersten Start erforderlich, um das NER‑Modell und semantische Datensätze (falls aktiviert) von Huggingface herunterzuladen. Nach dem Download werden diese Dateien lokal zwischengespeichert: Node.js: In Standard‑Cache‑Verzeichnissen (z.B. ~/.cache/rehydra unter Linux). Browser: Im Origin Private File System (OPFS) für große Modelldateien und in IndexedDB für Metadaten.

Wie kann ich meine eigenen sensiblen Datentypem erstellen (z. B. Bestellnummern)?

Du kannst benutzerdefinierte, RegEx‑basierte Regeln mit `createCustomIdRecognizer` definieren. Gib einfach eine Regel, einen Namen und einen PII‑Typ an (z.B. `CASE_ID` oder `CUSTOMER_ID`). Zum Beispiel:

Sind die PII‑Mapping‑Daten sicher?

Ja. Die PII‑Map (die Platzhalter‑IDs mit den ursprünglichen Werten verknüpft) wird mit AES‑256‑GCM verschlüsselt. - Entwicklung: `InMemoryKeyProvider` generiert beim Start einen zufälligen Schlüssel (für persistente Nutzung nicht sicher). - Produktion: Verwende `ConfigKeyProvider`, um einen sicheren, persistenten 32‑Byte‑Schlüssel aus deinen Umgebungsvariablen oder deinem Secrets‑Manager zu injizieren. Node.js: In Standard‑Cache‑Verzeichnissen (z. B. ~/.cache/rehydra unter Linux). Browser: Im Origin Private File System (OPFS) für große Modelldateien und in IndexedDB für Metadaten.

Was ist der Unterschied zwischen den „Standard“- und den „quantisierten“ NER‑Modellen?

Das SDK unterstützt zwei Betriebsmodi für das ONNX‑basierte Named‑Entity‑Recognition‑(NER‑)Modell: Quantisiert (~280 MB): Das empfohlene Standardmodell. Es verwendet int8‑Quantisierung für einen geringeren Footprint und schnellere Inferenz bei minimalem Genauigkeitsverlust. Standard (~1,1 GB): Das vollpräzise FP32‑Modell. Es bietet die höchste Genauigkeit, benötigt aber deutlich mehr Speicher und Bandbreite. Beide Modelle werden bei der ersten Initialisierung automatisch heruntergeladen und lokal zwischengespeichert. Entwicklung: `InMemoryKeyProvider` generiert beim Start einen zufälligen Schlüssel (für persistente Nutzung nicht sicher). Produktion: Verwende `ConfigKeyProvider`, um einen sicheren, persistenten 32‑Byte‑Schlüssel aus deinen Umgebungsvariablen oder deinem Secrets‑Manager zu injizieren. Node.js: In Standard‑Cache‑Verzeichnissen (z. B. ~/.cache/rehydra unter Linux). Browser: Im Origin Private File System (OPFS) für große Modelldateien und in IndexedDB für Metadaten.

Wie verbessert rehydra den MT‑Kontext (Machine Translation) für anonymisierte Entitäten?

Du kannst Semantic Enrichment aktivieren, indem du { semantic: { enabled: true } } in der Konfiguration setzt. Dadurch werden zusätzliche Datensätze (~12 MB) heruntergeladen, um Attribute für erkannte Entitäten abzuleiten: Personen: Fügt ein Geschlechts-Attribut (z.B., <PII type="PERSON" gender="female" .../>) hinzu, damit MT Engines korrekte Grammatik verwenden. Orte: Fügt ein Scope‑Attribut hinzu (z. B. Stadt, Land, Region), um die richtige Präposition zu wählen (z. B. „in Berlin“ vs. „in Deutschland“).

Benötigt die SDK eine Internetverbindung?

Eine Internetverbindung ist nur beim ersten Start erforderlich, um das NER‑Modell und semantische Datensätze (falls aktiviert) von Huggingface herunterzuladen. Nach dem Download werden diese Dateien lokal zwischengespeichert: Node.js: In Standard‑Cache‑Verzeichnissen (z.B. ~/.cache/rehydra unter Linux). Browser: Im Origin Private File System (OPFS) für große Modelldateien und in IndexedDB für Metadaten.

Wie kann ich meine eigenen sensiblen Datentypem erstellen (z. B. Bestellnummern)?

Du kannst benutzerdefinierte, RegEx‑basierte Regeln mit `createCustomIdRecognizer` definieren. Gib einfach eine Regel, einen Namen und einen PII‑Typ an (z.B. `CASE_ID` oder `CUSTOMER_ID`). Zum Beispiel:

Sind die PII‑Mapping‑Daten sicher?

Ja. Die PII‑Map (die Platzhalter‑IDs mit den ursprünglichen Werten verknüpft) wird mit AES‑256‑GCM verschlüsselt. - Entwicklung: `InMemoryKeyProvider` generiert beim Start einen zufälligen Schlüssel (für persistente Nutzung nicht sicher). - Produktion: Verwende `ConfigKeyProvider`, um einen sicheren, persistenten 32‑Byte‑Schlüssel aus deinen Umgebungsvariablen oder deinem Secrets‑Manager zu injizieren. Node.js: In Standard‑Cache‑Verzeichnissen (z. B. ~/.cache/rehydra unter Linux). Browser: Im Origin Private File System (OPFS) für große Modelldateien und in IndexedDB für Metadaten.

Was ist der Unterschied zwischen den „Standard“- und den „quantisierten“ NER‑Modellen?

Das SDK unterstützt zwei Betriebsmodi für das ONNX‑basierte Named‑Entity‑Recognition‑(NER‑)Modell: Quantisiert (~280 MB): Das empfohlene Standardmodell. Es verwendet int8‑Quantisierung für einen geringeren Footprint und schnellere Inferenz bei minimalem Genauigkeitsverlust. Standard (~1,1 GB): Das vollpräzise FP32‑Modell. Es bietet die höchste Genauigkeit, benötigt aber deutlich mehr Speicher und Bandbreite. Beide Modelle werden bei der ersten Initialisierung automatisch heruntergeladen und lokal zwischengespeichert. Entwicklung: `InMemoryKeyProvider` generiert beim Start einen zufälligen Schlüssel (für persistente Nutzung nicht sicher). Produktion: Verwende `ConfigKeyProvider`, um einen sicheren, persistenten 32‑Byte‑Schlüssel aus deinen Umgebungsvariablen oder deinem Secrets‑Manager zu injizieren. Node.js: In Standard‑Cache‑Verzeichnissen (z. B. ~/.cache/rehydra unter Linux). Browser: Im Origin Private File System (OPFS) für große Modelldateien und in IndexedDB für Metadaten.

Wie verbessert rehydra den MT‑Kontext (Machine Translation) für anonymisierte Entitäten?

Du kannst Semantic Enrichment aktivieren, indem du { semantic: { enabled: true } } in der Konfiguration setzt. Dadurch werden zusätzliche Datensätze (~12 MB) heruntergeladen, um Attribute für erkannte Entitäten abzuleiten: Personen: Fügt ein Geschlechts-Attribut (z.B., <PII type="PERSON" gender="female" .../>) hinzu, damit MT Engines korrekte Grammatik verwenden. Orte: Fügt ein Scope‑Attribut hinzu (z. B. Stadt, Land, Region), um die richtige Präposition zu wählen (z. B. „in Berlin“ vs. „in Deutschland“).

Benötigt die SDK eine Internetverbindung?

Eine Internetverbindung ist nur beim ersten Start erforderlich, um das NER‑Modell und semantische Datensätze (falls aktiviert) von Huggingface herunterzuladen. Nach dem Download werden diese Dateien lokal zwischengespeichert: Node.js: In Standard‑Cache‑Verzeichnissen (z.B. ~/.cache/rehydra unter Linux). Browser: Im Origin Private File System (OPFS) für große Modelldateien und in IndexedDB für Metadaten.

Wie kann ich meine eigenen sensiblen Datentypem erstellen (z. B. Bestellnummern)?

Du kannst benutzerdefinierte, RegEx‑basierte Regeln mit `createCustomIdRecognizer` definieren. Gib einfach eine Regel, einen Namen und einen PII‑Typ an (z.B. `CASE_ID` oder `CUSTOMER_ID`). Zum Beispiel:

Sind die PII‑Mapping‑Daten sicher?

Ja. Die PII‑Map (die Platzhalter‑IDs mit den ursprünglichen Werten verknüpft) wird mit AES‑256‑GCM verschlüsselt. - Entwicklung: `InMemoryKeyProvider` generiert beim Start einen zufälligen Schlüssel (für persistente Nutzung nicht sicher). - Produktion: Verwende `ConfigKeyProvider`, um einen sicheren, persistenten 32‑Byte‑Schlüssel aus deinen Umgebungsvariablen oder deinem Secrets‑Manager zu injizieren. Node.js: In Standard‑Cache‑Verzeichnissen (z. B. ~/.cache/rehydra unter Linux). Browser: Im Origin Private File System (OPFS) für große Modelldateien und in IndexedDB für Metadaten.

Was ist der Unterschied zwischen den „Standard“- und den „quantisierten“ NER‑Modellen?

Das SDK unterstützt zwei Betriebsmodi für das ONNX‑basierte Named‑Entity‑Recognition‑(NER‑)Modell: Quantisiert (~280 MB): Das empfohlene Standardmodell. Es verwendet int8‑Quantisierung für einen geringeren Footprint und schnellere Inferenz bei minimalem Genauigkeitsverlust. Standard (~1,1 GB): Das vollpräzise FP32‑Modell. Es bietet die höchste Genauigkeit, benötigt aber deutlich mehr Speicher und Bandbreite. Beide Modelle werden bei der ersten Initialisierung automatisch heruntergeladen und lokal zwischengespeichert. Entwicklung: `InMemoryKeyProvider` generiert beim Start einen zufälligen Schlüssel (für persistente Nutzung nicht sicher). Produktion: Verwende `ConfigKeyProvider`, um einen sicheren, persistenten 32‑Byte‑Schlüssel aus deinen Umgebungsvariablen oder deinem Secrets‑Manager zu injizieren. Node.js: In Standard‑Cache‑Verzeichnissen (z. B. ~/.cache/rehydra unter Linux). Browser: Im Origin Private File System (OPFS) für große Modelldateien und in IndexedDB für Metadaten.

Wie verbessert rehydra den MT‑Kontext (Machine Translation) für anonymisierte Entitäten?

Du kannst Semantic Enrichment aktivieren, indem du { semantic: { enabled: true } } in der Konfiguration setzt. Dadurch werden zusätzliche Datensätze (~12 MB) heruntergeladen, um Attribute für erkannte Entitäten abzuleiten: Personen: Fügt ein Geschlechts-Attribut (z.B., <PII type="PERSON" gender="female" .../>) hinzu, damit MT Engines korrekte Grammatik verwenden. Orte: Fügt ein Scope‑Attribut hinzu (z. B. Stadt, Land, Region), um die richtige Präposition zu wählen (z. B. „in Berlin“ vs. „in Deutschland“).

Privacy-Schutz für deinen KI-Stack.

Getting Started.

Quickstart

Quickstart

Quickstart

Unser Blog

Ein reversibler Local-First PII-Scrubber für AI-Workflows mit ONNX und Regex

Ein reversibler Local-First PII-Scrubber für AI-Workflows mit ONNX und Regex

Ein reversibler Local-First PII-Scrubber für AI-Workflows mit ONNX und Regex

Einführung von Rehydra: Die Privacy-Layer für den KI-Stack

Einführung von Rehydra: Die Privacy-Layer für den KI-Stack

Einführung von Rehydra: Die Privacy-Layer für den KI-Stack

Semantic Redaction vs. Regex: Warum Kontext beim Schutz personenbezogener Daten zählt

Semantic Redaction vs. Regex: Warum Kontext beim Schutz personenbezogener Daten zählt

Semantic Redaction vs. Regex: Warum Kontext beim Schutz personenbezogener Daten zählt

Häufig gestellte Fragen

Der Privacy Shield für das KI-Zeitalter.

Der Privacy Shield für das KI-Zeitalter.

KI entwickelt sich schnell. Bleib sicher mit rehydra.