Aká je technológia maskovania údajov a riešenie v Network Packet Broker?

1. Koncept maskovania údajov

Maskovanie údajov je tiež známe ako maskovanie údajov. Ide o technickú metódu na konverziu, úpravu alebo zakrytie citlivých údajov, ako sú čísla mobilného telefónu, čísla platobných kariet a ďalšie informácie, ak sme stanovili pravidlá a zásady maskovania. Táto technika sa používa predovšetkým na zabránenie priamemu použitiu citlivých údajov v nespoľahlivom prostredí.

Princíp maskovania údajov: Maskovanie údajov by malo zachovať pôvodné charakteristiky údajov, obchodné pravidlá a relevantnosť údajov, aby sa zabezpečilo, že následný vývoj, testovanie a analýza údajov nebudú ovplyvnené maskovaním. Zabezpečte konzistenciu a platnosť údajov pred a po maskovaní.

2. Klasifikácia maskovania údajov

Maskovanie údajov možno rozdeliť na statické maskovanie údajov (SDM) a dynamické maskovanie údajov (DDM).

Statické maskovanie údajov (SDM)Maskovanie statických údajov vyžaduje vytvorenie novej databázy neprodukčného prostredia na izoláciu od produkčného prostredia. Citlivé údaje sa extrahujú z produkčnej databázy a potom sa ukladajú do neprodukčnej databázy. Týmto spôsobom sa znecitlivené údaje izolujú od produkčného prostredia, čo spĺňa obchodné potreby a zaisťuje bezpečnosť produkčných údajov.

SDM

Dynamické maskovanie údajov (DDM)Vo všeobecnosti sa používa v produkčnom prostredí na znecitlivenie citlivých údajov v reálnom čase. Niekedy sú na čítanie rovnakých citlivých údajov v rôznych situáciách potrebné rôzne úrovne maskovania. Napríklad rôzne role a povolenia môžu implementovať rôzne schémy maskovania.

DDM

Aplikácia na vykazovanie údajov a maskovanie dátových produktov

Medzi takéto scenáre patria najmä interné produkty na monitorovanie údajov alebo billboardy, externé servisné dátové produkty a správy založené na analýze údajov, ako sú obchodné správy a kontroly projektov.

maskovanie produktu na vykazovanie údajov

3. Riešenie maskovania údajov

Medzi bežné schémy maskovania údajov patria: zneplatnenie, náhodná hodnota, nahradenie údajov, symetrické šifrovanie, priemerná hodnota, ofset a zaokrúhľovanie atď.

Zrušenie platnostiZneplatnenie sa vzťahuje na šifrovanie, skracovanie alebo skrývanie citlivých údajov. Táto schéma zvyčajne nahrádza skutočné údaje špeciálnymi symbolmi (napríklad *). Operácia je jednoduchá, ale používatelia nemôžu poznať formát pôvodných údajov, čo môže ovplyvniť následné aplikácie údajov.

Náhodná hodnotaNáhodná hodnota sa vzťahuje na náhodné nahradenie citlivých údajov (čísla nahrádzajú číslice, písmená nahrádzajú písmená a znaky nahrádzajú znaky). Táto metóda maskovania do určitej miery zabezpečí formátovanie citlivých údajov a uľahčí následné použitie údajov. Pre niektoré zmysluplné slová, ako sú mená ľudí a miest, môžu byť potrebné maskovacie slovníky.

Nahradenie údajovNahradenie údajov je podobné maskovaniu hodnôt null a náhodných hodnôt, s tým rozdielom, že namiesto použitia špeciálnych znakov alebo náhodných hodnôt sa maskované údaje nahradia konkrétnou hodnotou.

Symetrické šifrovanieSymetrické šifrovanie je špeciálna metóda reverzibilného maskovania. Šifruje citlivé údaje pomocou šifrovacích kľúčov a algoritmov. Formát šifrovaného textu je v logických pravidlách konzistentný s pôvodnými údajmi.

PriemernýSchéma priemerovania sa často používa v štatistických scenároch. V prípade numerických údajov najprv vypočítame ich priemer a potom náhodne rozdelíme znecitlivené hodnoty okolo priemeru, čím udržíme súčet údajov konštantný.

Odsadenie a zaokrúhľovanieTáto metóda mení digitálne dáta náhodným posunom. Zaokrúhľovanie s ofsetom zaisťuje približnú autenticitu rozsahu a zároveň zachováva bezpečnosť dát, ktoré sú bližšie k skutočným dátam ako predchádzajúce schémy a majú veľký význam v scenári analýzy veľkých dát.

ML-NPB-5660-数据脱敏

Odporúčaný model "ML-NPB-5660„pre maskovanie údajov“

4. Bežne používané techniky maskovania údajov

(1). Štatistické techniky

Vzorkovanie údajov a agregácia údajov

- Vzorkovanie údajov: Analýza a vyhodnotenie pôvodného súboru údajov výberom reprezentatívnej podmnožiny súboru údajov je dôležitou metódou na zlepšenie účinnosti techník deidentifikácie.

- Agregácia údajov: Výsledok, ktorý je reprezentatívny pre všetky záznamy v pôvodnom súbore údajov, je súborom štatistických techník (ako sú suma, počítanie, priemerovanie, maximum a minimum) aplikovaných na atribúty v mikrodátach.

(2). Kryptografia

Kryptografia je bežnou metódou na desenzibilizáciu alebo zvýšenie účinnosti desenzibilizácie. Rôzne typy šifrovacích algoritmov môžu dosiahnuť rôzne desenzibilizačné účinky.

- Deterministické šifrovanie: Nenáhodné symetrické šifrovanie. Zvyčajne spracováva identifikačné údaje a v prípade potreby dokáže dešifrovať a obnoviť šifrovaný text do pôvodnej podoby ID, ale kľúč musí byť riadne chránený.

- Nevratné šifrovanie: Na spracovanie údajov sa používa hašovacia funkcia, ktorá sa zvyčajne používa pre identifikačné údaje. Nedá sa priamo dešifrovať a mapovací vzťah sa musí zachovať. Okrem toho môže kvôli vlastnosti hašovacej funkcie dôjsť ku kolízii údajov.

- Homomorfné šifrovanie: Používa sa homomorfný algoritmus šifrovaného textu. Jeho charakteristickým znakom je, že výsledok operácie so šifrovaným textom je rovnaký ako výsledok operácie s otvoreným textom po dešifrovaní. Preto sa bežne používa na spracovanie číselných polí, ale z dôvodov výkonu nie je široko používaný.

(3). Systémová technológia

Technológia potlačenia vymaže alebo zatieni dátové položky, ktoré nespĺňajú podmienky ochrany súkromia, ale nezverejní ich.

- Maskovanie: označuje najbežnejšiu metódu desenzibilizácie na maskovanie hodnoty atribútu, ako je napríklad číslo súpera, označenie identifikačnej karty hviezdičkou alebo skrátenie adresy.

- Lokálne potlačenie: označuje proces vymazania špecifických hodnôt atribútov (stĺpcov) a odstránenia nepodstatných dátových polí;

- Potlačenie záznamov: označuje proces vymazania konkrétnych záznamov (riadkov) a vymazania nepodstatných údajových záznamov.

(4). Technológia pseudonymov

Pseudomanning je technika deidentifikácie, ktorá používa pseudonym namiesto priameho identifikátora (alebo iného citlivého identifikátora). Techniky pseudonymu vytvárajú jedinečné identifikátory pre každý jednotlivý subjekt informácií namiesto priamych alebo citlivých identifikátorov.

- Dokáže nezávisle generovať náhodné hodnoty, ktoré zodpovedajú pôvodnému ID, ukladať mapovaciu tabuľku a prísne kontrolovať prístup k mapovacej tabuľke.

- Na vytvorenie pseudonymov môžete použiť aj šifrovanie, ale musíte si správne uchovávať dešifrovací kľúč;

Táto technológia sa široko používa v prípade veľkého počtu nezávislých používateľov údajov, ako napríklad OpenID v scenári otvorenej platformy, kde rôzni vývojári získavajú rôzne OpenID pre toho istého používateľa.

(5). Techniky zovšeobecnenia

Technika generalizácie označuje techniku ​​deidentifikácie, ktorá znižuje granularitu vybraných atribútov v súbore údajov a poskytuje všeobecnejší a abstraktnejší popis údajov. Technológia generalizácie sa ľahko implementuje a dokáže chrániť autenticitu údajov na úrovni záznamov. Bežne sa používa v dátových produktoch alebo dátových správach.

- Zaokrúhľovanie: zahŕňa výber základu zaokrúhľovania pre vybraný atribút, napríklad forenznou analýzou smerom nahor alebo nadol, čo vedie k výsledkom 100, 500, 1 000 a 10 000

- Techniky kódovania zhora a zdola: Nahraďte hodnoty nad (alebo pod) prahovou hodnotou prahovou hodnotou predstavujúcou hornú (alebo dolnú) úroveň, čím získate výsledok „nad X“ alebo „pod X“.

(6). Techniky randomizácie

Ako druh techniky deidentifikácie sa technológia randomizácie vzťahuje na úpravu hodnoty atribútu prostredníctvom randomizácie tak, aby sa hodnota po randomizácii líšila od pôvodnej skutočnej hodnoty. Tento proces znižuje schopnosť útočníka odvodiť hodnotu atribútu z iných hodnôt atribútov v tom istom dátovom zázname, ale ovplyvňuje autenticitu výsledných údajov, čo je bežné pri testovacích dátach v produkcii.


Čas uverejnenia: 27. septembra 2022