Datele sunt un subiect sensibil și, în mod natural, veți fi în preajma multor ele în calitate de cercetător al datelor. Iată câteva reguli pe care ar trebui să le urmați întotdeauna.
Datele sunt extrem de valoroase, iar valorificarea acestora este cu ușurință una dintre cele mai bune practici pentru majoritatea organizațiilor de astăzi. Dar cunoașterea standardelor industriei în acest sens este necesară pentru ca oamenii de știință din date să nu greșească datele, deoarece oamenii învață mai multe despre valoarea lor.
Ca atare, oamenii de știință de date trebuie să adopte practici sigure și etice și să adopte practici standardizate. În loc să ne gândim la cât de valoroase sunt doar datele, este înțelept să punem la îndoială metodele de obținere și prelucrare a datelor pentru orice scop. Astfel, iată nouă coduri de conduită pe care fiecare cercetător de date ar trebui să le urmeze.
1. Respectați regulamentele
Oamenii de știință de date trebuie să cunoască reglementările privind protecția datelor care se aplică anumitor locuri de muncă. În caz contrar, s-ar putea să încalci legea fără să știi și să-ți pui în pericol pe tine și pe alții. Deci, aceste cunoștințe sunt esențiale pentru a asigura munca etică și pentru a preveni vătămările neintenționate.
Ca atare, verificați legile relevante înainte de a vă angaja în orice activitate. În plus, nu respectați doar reglementările pentru a respecta regulile; caută, de asemenea, o înțelegere mai profundă a acestora. Pentru a respecta în mod corespunzător reglementările, trebuie să știți de ce au fost amplasate și împotriva ce protejează.
Câteva legi privind confidențialitatea demne de remarcat sunt Regulamentul general al UE privind protecția datelor (GDPR) și Legea privind confidențialitatea consumatorilor din California (CCPA). Altele includ HIIPA, DPA, PIPEDA, LGPD și multe reglementări specifice industriei.
2. Respectați confidențialitatea
Adresele, e-mailurile și ID-urile sunt identificatori care nu ar trebui să fie publice, deoarece prezintă riscuri reale pentru oameni. Prin urmare, asigurați-vă că faceți aceste detalii cât mai private posibil.
Dacă sunt expuse, victimele ar putea suferi de furt de identitate sau fraudă. Ei ar putea fi, de asemenea, șantajați de oameni care amenință că vor dezvălui informațiile confidențiale. În plus, profesioniștii pot suferi daune reputaționale și hărțuire online odată ce preferințele lor personale sunt făcute publice. Acestea le pot afecta relațiile, oportunitățile de carieră și statutul social.
Deci, având în vedere acest lucru, cercetați și selectați modalități eficiente de a îmbunătăți identități online sigure și de-identificați datele. De exemplu, puteți înlocui caractere, puteți elimina identificatorii direcți sau puteți generaliza. Procedând astfel, datele sensibile sunt protejate de infractorii cibernetici, ajutând în același timp organizațiile cu constatările dvs.
3. Eliminați părtinirea
Oamenii de știință se bazează pe statistici pentru a fi cât mai obiectivi posibil. Cu toate acestea, în ciuda acestor eforturi, părtinirea persistă deoarece ideea că datele mai mari sunt mai precise este una dintre cele mai mituri comune ale științei datelor.
Există ceva adevăr în acest lucru, dar, din păcate, datele mari conțin uneori elemente și statistici inutile sau false. Deci, în loc să vă concentrați doar pe numere, asigurați-vă că datele dvs. sunt curate și reprezentative.
Curățarea sau filtrarea datelor înainte de utilizare sunt metode excelente de combatere a părtinirii. De exemplu, puteți verifica erorile sau puteți utiliza eșantionarea stratificată pentru a asigura date reprezentative.
4. Nu fabricați și nu inventați rezultate
Fabricarea este o formă de comportament greșit în materie de date și fraudă de cercetare care implică inventarea constatărilor și raportarea lor ca fiind adevărate.
De exemplu, un cercetător de date poate raporta că s-a constatat că un medicament nu are efecte secundare pentru majoritatea membrilor unui anumit grup de vârstă. Aceste descoperiri ar fi fabricate dacă nu ar exista experimente medicale inițiale și s-ar colecta date pentru a le susține.
Fabricarea are consecințe grave și negative pentru oamenii de știință de date și pentru cei care se bazează pe munca lor. Vă poate distruge credibilitatea, vă poate păta reputația organizației, vă poate dăuna publicului sau vă poate expune la riscuri legale.
5. Nu falsificați și nu manipulați dovezile
Falsificarea este manipularea realității, a datelor colectate pentru a se potrivi cu o agendă. În timp ce producătorii inventează rezultate din date inexistente pentru a susține afirmațiile lor, falsificatorii lucrează pentru a infirma datele reale și existente din motive personale. Pentru a realiza acest lucru, aceștia pot modifica echipamentele de cercetare, pot schimba sau omite datele în întregime.
Falsificarea poate dăuna publicului prin furnizarea de informații false care afectează luarea deciziilor în diferite sectoare. De exemplu, un studiu de droguri falsificat ar putea expune oamenii la riscuri inutile, tratamente ineficiente sau efecte secundare dăunătoare. De asemenea, poate provoca pierderi de bani, timp sau materiale care ar fi putut fi folosite în alte scopuri.
Fabricarea și falsificarea sunt practici fără scrupule, cu efecte adverse și numeroase sancțiuni. Acestea pot include amenzi, revocarea acreditărilor, pierderea finanțării cercetării sau încarcerarea.
6. Arată transparență
Transparența pentru oamenii de știință a datelor înseamnă a fi sincer cu privire la metodele aplicate pentru colectarea, analiza și prezentarea datelor. Oamenii de știință de date ar trebui să fie deschiși și gata să-și împărtășească practicile cu alți oameni de știință de date și cu participanții la studiu.
Mai mult, trebuie să obțineți consimțământul participanților la studiu, deoarece publicarea rezultatelor fără consimțământul informat poate lipsi de respect sau dăuna participanților în diferite moduri. Ei își pot încălca demnitatea, intimitatea și autonomia sau îi pot expune la riscuri dăunătoare, inutile, rezultate din studiu.
Transparența creează încredere cu cei care se bazează pe datele tale pentru a obține informații. De asemenea, asigură calitatea datelor, permițând altora să vă revizuiască rezultatele.
În plus, deschiderea în rândul cercetătorilor de date promovează colaborarea și învățarea. Puteți contribui la stimularea inovației prin împărtășirea procesului dvs. și comunicând cele mai bune metode de vizualizare a datelor și tehnici de știință a datelor către colegi în timp ce învață de la ei.
7. Colectați datele în siguranță
Oamenii de știință de date trebuie să confirme siguranța metodelor utilizate pentru colectarea, analiza și stocarea datelor. Acest lucru previne posibilele încălcări ale datelor care pot afecta oamenii de știință de date și participanții la studiu.
Încălcările de date pun în pericol siguranța personală, subminează încrederea publicului și expun incompetența organizațională care duce la pierderi financiare uimitoare pentru companie. Aceste pierderi ar putea fi procese din partea victimelor încălcării datelor, mai puțini clienți și multe altele.
Având în vedere acest lucru, trebuie să efectuați cercetări pentru a găsi cele mai eficiente soluții de securitate a datelor si aplica-le. De exemplu, puteți securiza conexiunile cu criptare TLS/SSL sau puteți utiliza proxy rotativi. De asemenea, puteți aplica măsuri de control al accesului și puteți crea copii de rezervă în cazul unui atac. Când găsiți soluții, nu uitați să le împărtășiți altora pentru a asigura securitatea maximă.
8. Utilizați algoritmii în mod responsabil
Algoritmii nu sunt doar instrumente pentru analiza datelor. Ele sunt influențe puternice asupra vieții, comportamentelor și oportunităților oamenilor. Cu toate acestea, deși ajută la rezolvarea problemelor și fac previziuni inovatoare, ele sunt și imperfecte.
Dacă nu sunt proiectați, testați sau implementați cu atenție, algoritmii au efecte sociale și etice care pot dăuna anumitor grupuri de oameni. De asemenea, ei introduc părtinire dacă sunt instruiți pe date care reflectă prejudecățile existente și pot fi imprevizibile. Astfel, oamenii de știință de date trebuie să le proiecteze și să le folosească în mod responsabil.
Alegeți întotdeauna algoritmi adecvați, testați-le performanța și explicați cum funcționează. De asemenea, asigurați-vă că identificați sursele potențiale de părtinire și implementați mecanisme care se actualizează sau corectează acolo unde este necesar.
9. Luați în considerare implicațiile pe termen lung ale muncii dvs
Munca ta ca cercetător de date va avea un impact semnificativ asupra multor aspecte ale societății. Așadar, luați în considerare întotdeauna modul în care modelele dvs. afectează oamenii.
De exemplu, încercați să vă întrebați dacă munca dvs. poate perpetua prejudecățile și inegalitatea sau poate pune în pericol confidențialitatea în viitor. Apoi, abordați în mod adecvat aceste preocupări.
Rețineți că o perspectivă orientată spre viitor este mai importantă decât orice metodă corectivă, iar gândirea la zilele următoare este una dintre cele mai eficiente modalități de a lua decizii corecte din punct de vedere etic.
Trebuie să fii etic ca om de știință a datelor
Ca om de știință a datelor, primești o putere care vine cu responsabilitate proporțională. Abilitățile tale sunt rare, așa că stai în fruntea luării deciziilor organizaționale.
Deciziile tale afectează totul, de la planurile de afaceri ale companiei până la sistemele de justiție penală. Deci, nu ar trebui să le faci ușor. Fiți întotdeauna sincer, etic și meticulos în munca dvs. pentru a proteja oamenii de dilemele etice existente în industria dvs. și în alte domenii tehnologice.