Kakšna je tehnologija in rešitev za maskiranje podatkov v posredniku omrežnih paketov?

1. Koncept maskiranja podatkov

Maskiranje podatkov je znano tudi kot maskiranje podatkov. To je tehnična metoda za pretvorbo, spreminjanje ali prekrivanje občutljivih podatkov, kot so številka mobilnega telefona, številka bančne kartice in drugi podatki, kadar smo podali pravila in politike maskiranja. Ta tehnika se uporablja predvsem za preprečevanje neposredne uporabe občutljivih podatkov v nezanesljivih okoljih.

Načelo maskiranja podatkov: maskiranje podatkov mora ohraniti prvotne lastnosti podatkov, poslovna pravila in ustreznost podatkov, da se zagotovi, da maskiranje ne bo vplivalo na kasnejši razvoj, testiranje in analizo podatkov. Zagotovite doslednost in veljavnost podatkov pred in po maskiranju.

2. Klasifikacija maskiranja podatkov

Maskiranje podatkov lahko razdelimo na statično maskiranje podatkov (SDM) in dinamično maskiranje podatkov (DDM).

Statično maskiranje podatkov (SDM): Maskiranje statičnih podatkov zahteva vzpostavitev nove baze podatkov neprodukcijskega okolja za izolacijo od produkcijskega okolja. Občutljivi podatki se izvlečejo iz produkcijske baze podatkov in nato shranijo v neprodukcijsko zbirko podatkov. Na ta način so desenzibilizirani podatki izolirani od produkcijskega okolja, kar ustreza poslovnim potrebam in zagotavlja varnost produkcijskih podatkov.

SDM

Dinamično maskiranje podatkov (DDM): Običajno se uporablja v produkcijskem okolju za desenzibilizacijo občutljivih podatkov v realnem času. Včasih so za branje istih občutljivih podatkov v različnih situacijah potrebne različne ravni maskiranja. Na primer, različne vloge in dovoljenja lahko izvajajo različne maskirne sheme.

DDM

Aplikacija za poročanje podatkov in maskiranje podatkovnih izdelkov

Takšni scenariji vključujejo predvsem interne izdelke za spremljanje podatkov ali panoje, zunanje storitvene podatkovne izdelke in poročila na podlagi analize podatkov, kot so poslovna poročila in pregled projektov.

maskiranje izdelkov za poročanje podatkov

3. Rešitev za maskiranje podatkov

Običajne sheme maskiranja podatkov vključujejo: razveljavitev, naključno vrednost, zamenjavo podatkov, simetrično šifriranje, povprečno vrednost, odmik in zaokroževanje itd.

Razveljavitev: Razveljavitev se nanaša na šifriranje, prirezovanje ali skrivanje občutljivih podatkov. Ta shema običajno zamenja dejanske podatke s posebnimi simboli (kot je *). Operacija je preprosta, vendar uporabniki ne morejo poznati formata izvirnih podatkov, kar lahko vpliva na kasnejše podatkovne aplikacije.

Naključna vrednost: Naključna vrednost se nanaša na naključno zamenjavo občutljivih podatkov (številke nadomestijo številke, črke nadomestijo črke in znaki zamenjajo znake). Ta metoda maskiranja bo do določene mere zagotovila format občutljivih podatkov in olajšala kasnejšo uporabo podatkov. Za nekatere pomembne besede, kot so imena ljudi in krajev, bodo morda potrebni maskirni slovarji.

Zamenjava podatkov: Zamenjava podatkov je podobna maskiranju ničelnih in naključnih vrednosti, le da se namesto uporabe posebnih znakov ali naključnih vrednosti maskirni podatki nadomestijo z določeno vrednostjo.

Simetrično šifriranje: Simetrično šifriranje je posebna metoda reverzibilnega maskiranja. Šifrira občutljive podatke s pomočjo šifrirnih ključev in algoritmov. Format šifriranega besedila je skladen z izvirnimi podatki v logičnih pravilih.

Povprečje: Povprečna shema se pogosto uporablja v statističnih scenarijih. Pri numeričnih podatkih najprej izračunamo njihovo povprečje, nato pa desenzibilizirane vrednosti naključno porazdelimo okoli povprečja, tako da vsota podatkov ostane konstantna.

Odmik in zaokroževanje: Ta metoda spremeni digitalne podatke z naključnim premikom. Zaokroževanje z odmikom zagotavlja približno verodostojnost obsega, hkrati pa ohranja varnost podatkov, ki je bližje dejanskim podatkom kot prejšnje sheme in ima velik pomen v scenariju analize velikih podatkov.

ML-NPB-5660-数据脱敏

Priporočen model "ML-NPB-5660" za maskiranje podatkov

4. Pogosto uporabljene tehnike maskiranja podatkov

(1). Statistične tehnike

Vzorčenje in združevanje podatkov

- Vzorčenje podatkov: analiza in vrednotenje izvirnega niza podatkov z izbiro reprezentativne podmnožice niza podatkov je pomembna metoda za izboljšanje učinkovitosti tehnik deidentifikacije.

- Združevanje podatkov: kot zbirka statističnih tehnik (kot so seštevanje, štetje, povprečje, maksimum in minimum), uporabljenih za atribute v mikropodatkih, je rezultat reprezentativen za vse zapise v izvirnem nizu podatkov.

(2). Kriptografija

Kriptografija je običajna metoda za desenzibilizacijo ali povečanje učinkovitosti desenzibilizacije. Različne vrste šifrirnih algoritmov lahko dosežejo različne učinke desenzibilizacije.

- Deterministično šifriranje: nenaključno simetrično šifriranje. Običajno obdeluje podatke ID-ja in lahko po potrebi dešifrira in obnovi šifrirano besedilo v izvirni ID, vendar mora biti ključ ustrezno zaščiten.

- Nepovratno šifriranje: Za obdelavo podatkov se uporablja zgoščevalna funkcija, ki se običajno uporablja za ID podatke. Ni ga mogoče neposredno dešifrirati in razmerje preslikave je treba shraniti. Poleg tega lahko zaradi funkcije zgoščevalne funkcije pride do kolizije podatkov.

- Homomorfno šifriranje: uporablja se homomorfni algoritem šifriranega besedila. Njegova značilnost je, da je rezultat operacije s šifriranim besedilom enak rezultatu operacije z odprtim besedilom po dešifriranju. Zato se običajno uporablja za obdelavo številskih polj, vendar se zaradi zmogljivosti ne uporablja široko.

(3). Sistemska tehnologija

Tehnologija zatiranja izbriše ali zaščiti elemente podatkov, ki ne ustrezajo varstvu zasebnosti, vendar jih ne objavi.

- Maskiranje: nanaša se na najpogostejšo metodo desenzibilizacije za prikrivanje vrednosti atributa, kot je številka nasprotnika, osebna izkaznica je označena z zvezdico ali je naslov odrezan.

- Lokalno zatiranje: nanaša se na postopek brisanja določenih vrednosti atributov (stolpcev), odstranjevanje nebistvenih podatkovnih polj;

- Zatiranje zapisov: nanaša se na postopek brisanja določenih zapisov (vrstic), brisanje nebistvenih podatkovnih zapisov.

(4). Tehnologija psevdonima

Psevdomaniranje je tehnika deidentifikacije, ki uporablja psevdonim za zamenjavo neposrednega identifikatorja (ali drugega občutljivega identifikatorja). Tehnike psevdonimov namesto neposrednih ali občutljivih identifikatorjev ustvarijo edinstvene identifikatorje za vsakega posameznega subjekta informacij.

- Lahko neodvisno ustvari naključne vrednosti, ki ustrezajo izvirnemu ID-ju, shrani tabelo preslikav in strogo nadzoruje dostop do tabele preslikav.

- Šifriranje lahko uporabite tudi za ustvarjanje psevdonima, vendar morate pravilno hraniti ključ za dešifriranje;

Ta tehnologija se pogosto uporablja v primeru velikega števila neodvisnih podatkovnih uporabnikov, kot je OpenID v scenariju odprte platforme, kjer različni razvijalci pridobijo različne Openide za istega uporabnika.

(5). Tehnike posploševanja

Tehnika generalizacije se nanaša na tehniko deidentifikacije, ki zmanjša razdrobljenost izbranih atributov v nizu podatkov in zagotavlja bolj splošen in abstrakten opis podatkov. Tehnologijo generalizacije je enostavno implementirati in lahko zaščiti pristnost podatkov na ravni zapisa. Običajno se uporablja v podatkovnih izdelkih ali podatkovnih poročilih.

- Zaokroževanje: vključuje izbiro osnove zaokroževanja za izbrani atribut, kot je forenzika navzgor ali navzdol, kar daje rezultate 100, 500, 1K in 10K

- Tehnike kodiranja na vrhu in na dnu: Zamenjajte vrednosti nad (ali pod) pragom s pragom, ki predstavlja najvišjo (ali spodnjo) raven, kar daje rezultat "nad X" ali "pod X".

(6). Tehnike randomizacije

Kot nekakšna tehnika deidentifikacije se tehnologija randomizacije nanaša na spreminjanje vrednosti atributa z randomizacijo, tako da se vrednost po randomizaciji razlikuje od prvotne dejanske vrednosti. Ta postopek zmanjša zmožnost napadalca, da izpelje vrednost atributa iz drugih vrednosti atributa v istem podatkovnem zapisu, vendar vpliva na pristnost nastalih podatkov, kar je običajno pri podatkih proizvodnega preizkusa.


Čas objave: 27. september 2022