1. Koncept maskovania údajov
Maskovanie údajov sa tiež nazýva maskovanie údajov. Je to technická metóda na konverziu, úpravu alebo pokrytie citlivých údajov, ako je číslo mobilného telefónu, číslo bankovej karty a ďalšie informácie, keď sme poskytli maskovacie pravidlá a politiky. Táto technika sa používa primárne na zabránenie použitia citlivých údajov priamo vo nespoľahlivých prostrediach.
Princíp maskovania údajov: Maskovanie údajov by sa malo zachovať pôvodné charakteristiky údajov, obchodné pravidlá a relevantnosť údajov, aby sa zabezpečilo, že následný vývoj, testovanie a analýza údajov nebude ovplyvnené maskovaním. Zabezpečte konzistentnosť a platnosť údajov pred a po maskovaní.
2. Klasifikácia maskovania údajov
Maskovanie údajov možno rozdeliť na maskovanie statických údajov (SDM) a dynamické maskovanie údajov (DDM).
Maskovanie statických údajov (SDM): Maskovanie statických údajov si vyžaduje vytvorenie novej databázy nevýrobných prostredí na izoláciu od výrobného prostredia. Citlivé údaje sa extrahujú z výrobnej databázy a potom sa uložia do nevýrobnej databázy. Týmto spôsobom sú desenzibilizované údaje izolované od výrobného prostredia, ktoré vyhovuje obchodným potrebám a zabezpečuje bezpečnosť výrobných údajov.
Dynamické maskovanie údajov (DDM): Všeobecne sa používa vo výrobnom prostredí na znecitlivenie citlivých údajov v reálnom čase. Niekedy sú potrebné rôzne úrovne maskovania na čítanie rovnakých citlivých údajov v rôznych situáciách. Napríklad rôzne úlohy a povolenia môžu implementovať rôzne schémy maskovania.
Aplikácia Masking Data Hlásenie a dátové produkty
Takéto scenáre zahŕňajú hlavne produkty na monitorovanie interných údajov alebo billboard, externé dátové produkty a správy na základe analýzy údajov, ako sú obchodné správy a preskúmanie projektov.
3. Riešenie maskovania údajov
Medzi bežné schémy maskovania údajov patrí: invalida, náhodná hodnota, výmena údajov, symetrické šifrovanie, priemerná hodnota, ofset a zaokrúhlenie atď.
Neplatnosť: Inplaidácia sa týka šifrovania, skrátenia alebo skrytia citlivých údajov. Táto schéma zvyčajne nahrádza skutočné údaje špeciálnymi symbolmi (napríklad *). Táto operácia je jednoduchá, ale používatelia nemôžu poznať formát pôvodných údajov, ktoré môžu ovplyvniť následné dátové aplikácie.
Náhodná hodnota: Náhodná hodnota sa vzťahuje na náhodnú výmenu citlivých údajov (čísla nahradia číslice, písmená nahradia písmená a znaky nahrádzajú znaky). Táto metóda maskovania zabezpečí formát citlivých údajov do určitej miery a uľahčí následnú aplikáciu údajov. Maskovanie slovníkov môžu byť potrebné pre niektoré zmysluplné slová, ako sú mená ľudí a miest.
Výmena údajov: Výmena údajov je podobná maskovaniu nulových a náhodných hodnôt, s výnimkou toho, že namiesto použitia špeciálnych znakov alebo náhodných hodnôt sa maskovacie údaje nahradia špecifickou hodnotou.
Symetrické šifrovanie: Symetrické šifrovanie je špeciálna reverzibilná metóda maskovania. Šikuje citlivé údaje prostredníctvom šifrovacích klávesov a algoritmov. Formát CipherText je v súlade s pôvodnými údajmi v logických pravidlách.
Priemer: Priemerná schéma sa často používa v štatistických scenároch. V prípade numerických údajov najprv vypočítame ich priemer a potom náhodne distribuujeme desenzibilizované hodnoty okolo priemeru, čím si udržujeme súčet dátovej konštanty.
Kompenza: Táto metóda mení digitálne údaje náhodným posunom. Offsetové zaokrúhlenie zaisťuje približnú autentickosť rozsahu pri zachovaní bezpečnosti údajov, ktoré sú bližšie k skutočným údajom ako predchádzajúce schémy, a má veľký význam v scenári analýzy veľkých údajov.
Odporúčaný model “ML-NPB-5660„Pre maskovanie údajov
4. Bežne používané techniky maskovania údajov
(1). Štatistické techniky
Vzorkovanie údajov a agregácia údajov
- Odber vzoriek údajov: Analýza a vyhodnotenie pôvodného súboru údajov výberom reprezentatívnej podskupiny súboru údajov je dôležitou metódou na zlepšenie účinnosti techník de-identifikácie.
- Agregácia údajov: Ako zbierka štatistických techník (ako je sumarizácia, počítanie, spriemerovanie, maximum a minimum) aplikované na atribúty v mikrodatach, výsledok je reprezentatívny pre všetky záznamy v pôvodnom súbore údajov.
(2). Kryptografia
Kryptografia je bežnou metódou na znecitlivenie alebo zvýšenie účinnosti desenzibilizácie. Rôzne typy šifrovacích algoritmov môžu dosiahnuť rôzne účinky desenzibilizácie.
- Deterministické šifrovanie: neúmyselné symetrické šifrovanie. Zvyčajne spracováva údaje o ID a v prípade potreby môže dešifrovať a obnoviť šifrový text na pôvodné ID, ale kľúč musí byť správne chránený.
- Nevratné šifrovanie: Funkcia hash sa používa na spracovanie údajov, ktoré sa zvyčajne používajú pre údaje o ID. Nedá sa priamo dešifrovať a mapovací vzťah sa musí uložiť. Okrem toho, v dôsledku funkcie funkcie hash sa môže vyskytnúť zrážka údajov.
- Homomorfné šifrovanie: Používa sa homomorfný algoritmus CipherText. Jeho charakteristika je taká, že výsledok operácie CipherText je rovnaký ako výsledok operácie holého textu po dešifrovaní. Preto sa bežne používa na spracovanie numerických polí, ale z dôvodov výkonnosti sa často nepoužíva.
(3). Systémová technológia
Technológia supresie vymaže alebo Shields Data položky, ktoré nespĺňajú ochranu súkromia, ale nezverejňujú ich.
- Masking: Označuje sa najbežnejšou metódou desenzibilizácie na maskovanie hodnoty atribútu, ako je napríklad číslo súpera, ID karta je označená hviezdičkou alebo sa skráti adresa.
- Lokálne potlačenie: odkazuje na proces odstraňovania špecifických hodnôt atribútov (stĺpce), odstránenia nepodstatných dátových polí;
- Potlačenie záznamu: Vzťahuje sa na proces odstraňovania konkrétnych záznamov (riadky), odstraňovania nepodstatných údajov.
(4). Technológia pseudonym
Pseudanning je technika de-identifikácie, ktorá používa pseudonym na nahradenie priameho identifikátora (alebo iného citlivého identifikátora). Pseudonymové techniky vytvárajú jedinečné identifikátory pre každý jednotlivý informačný subjekt namiesto priamych alebo citlivých identifikátorov.
- Môže generovať náhodné hodnoty nezávisle, aby zodpovedali pôvodnému ID, uložili mapovaciu tabuľku a prísne ovláda prístup k mapovacej tabuľke.
- Môžete tiež použiť šifrovanie na výrobu pseudonymov, ale musíte správne udržiavať kľúčový kľúč;
Táto technológia sa široko používa v prípade veľkého počtu nezávislých používateľov údajov, ako je napríklad OpenID v scenári otvorenej platformy, kde rôzni vývojári získajú rôzne otvorené OpenID pre toho istého používateľa.
(5). Zovšeobecnenie
Zovšeobecnená technika sa vzťahuje na techniku de-identifikácie, ktorá znižuje granularitu vybraných atribútov v súbore údajov a poskytuje všeobecnejší a abstraktnejší opis údajov. Zovšeobecňovacia technológia sa dá ľahko implementovať a môže chrániť pravosť údajov na úrovni záznamu. Bežne sa používa v dátových produktoch alebo v správach o údajoch.
- Zaokrúhlenie: Zahŕňa výber zaokrúhľovacej základne pre vybraný atribút, ako je napríklad forenzná alebo nadol, prináša výsledky 100, 500, 1K a 10k
- Techniky kódovania v hornej a spodnej časti: Vymeňte hodnoty nad (alebo nižšie) prahovú hodnotu prahom predstavujúcou hornú (alebo spodnú) úroveň, čo vedie k výsledku „nad x“ alebo „pod x“
(6). Náhodné techniky
Ako druh techniky de-identifikácie sa technika randomizácie týka modifikácie hodnoty atribútu prostredníctvom randomizácie, takže hodnota po randomizácii sa líši od pôvodnej skutočnej hodnoty. Tento proces znižuje schopnosť útočníka odvodiť hodnotu atribútu z iných hodnôt atribútov v rovnakom zázname údajov, ale ovplyvňuje pravosť výsledných údajov, ktoré sú bežné pri údajoch o testovaní výroby.
Čas príspevku: 2. septembra 2012