Documente Academic
Documente Profesional
Documente Cultură
Viitorul medicinei oferă îngrijiri personalizate adaptate pacientului, furnizarea de servicii integrate de
îngrijire, sisteme inteligente de sprijin pentru luarea deciziilor pentru medici, un accent din ce în ce mai
mare pe prevenire și o abordare orientată spre sisteme, mai degrabă decât reducționistă, la înțelegerea
bolii. Toate aceste obiective sunt activate de date mari. În 2013, cantitatea de date medicale digitale din
lume a fost estimată la 153 exabyte (1 exabyte = 1018 octeți), o sumă atât de mare încât este greu de
constatat. Pentru perspectivă, considerați că estimarea a 5 exabyte va stoca toate cuvintele purtate
vreodată de ființele umane
Deși există multe definiții, datele mari sunt mari, eterogene, din mai multe surse și pot ajunge în timp
real. Scara, viteza și complexitatea datelor mari fac dificilă procesarea, analizarea și extragerea
informațiilor.2 Datele mari sunt prea masive pentru ca oamenii să înțeleagă fără ajutorul modelelor de
calculatoare.3
Există trei surse primare de date importante în medicină. Prima sursă de date importante, inclusiv
înregistrările medicale electronice (EMR), revendicările și datele de facturare, datele imaginilor și datele
farmaciei sunt furnizori și plătitori. A doua sursă este omica, inclusiv genomica, proteomica și
metabolomica. Al treilea este pacientul și nonproviderii, adică datele de la activitățile smartphone și
Internet, senzori și instrumentele de monitorizare.4 În viitor, aproximativ două treimi din toate datele
medicale vor proveni din surse create de pacienți.5Nu este doar cantitatea de date medicale digitale
masive astăzi, se estimează că va crește cu 48% pe an până în 2020.6 Există multe exemple pentru care
datele digitale privind sănătatea cresc atât de repede. Cantitatea anuală de date per pacient creată într-
un EMR este de aproximativ 80 MB, 95% din acestea fiind date imagistice.7 Serviciul Național de
Sănătate din Marea Britanie stochează în fiecare zi 1 milion de imagini noi în baza sa de date.8
Depozitarea necesară pentru datele imaginilor este crescând pe măsură ce noile tehnici de imagistică
oferă imagini de rezoluție superioară cu 3 sau 4 dimensiuni.9 Se încep să se colecteze datele genomice și
necesită de aproximativ 50 de ori mai mult stocare pe pacient decât datele imaginilor.10 Echipamentul
de monitorizare din spital folosit într-o unitate de terapie intensivă spital înregistrează între 1000 -2000
de date pe secundă per pacient (Figura 1) .11 În 2015, 4,9 milioane de pacienți au folosit prescris de la
distanță la domiciliu, cel mai mult pentru îngrijirea cardiacă. Creșterea la 36,1 milioane de pacienți este
așteptată până în 2020.12 Pacienții încep să utilizeze aplicații pentru sănătate. Cele 165 000 de aplicații
de sănătate disponibile pentru smartphone-urile Android și Apple (Figura 2) sunt estimate să fie
descărcate de 1,7 miliarde de ori până în 2017,13Promisiunea cunoașterii și a luării deciziilor bazate pe
date a schimbat complet paradigma secolului al XX-lea de focalizare pe tehnologie către o concentrare a
datelor pe secolul XXI14. Acum, tehnologiile sunt proiectate în jurul datelor, mai degrabă decât să fie
concepute date în jurul tehnologiilor. Deși mediile digitale din medicină, cum ar fi EMR peste tot și
sistemele de radiologie care oferă "imagini la locul potrivit la momentul potrivit", 15 sunt acum
considerate date, acestea sunt progrese relativ recente. Epoca zorilor de date mari a fost permisă de o
confluență a progresului tehnologic în multe domenii care au evoluat de-a lungul deceniilor.
Pentru a înțelege mai bine domeniul de aplicare al datelor importante din medicină, trebuie să ne uităm
scurt la progresul tehnologic în ultimele decenii.
Fundația pentru explozia digitală, inclusiv datele importante din medicină, este îmbunătățirea dramatică
a performanțelor și scăderea prețului microprocesoarelor. Dublarea numărului de tranzistori pe un
circuit integrat la fiecare 2 ani de la mijlocul anilor 1960 este o operație istorică de inginerie prevăzută
de Gordon Moore.16,17 Trecând de la zeci de tranzistori la peste un miliard pe un singur microcip a dus
la exponențială îmbunătățiri ale vitezei microprocesorului, permițând multor tipuri de procesoare de uz
general și specializate.
Necesitatea de a analiza, procesa și vizualiza datele mari necesită mai mult decât performanța brută
într-un singur microprocesor. Datele mari necesită ca analizele să fie împărțite în bucăți și să fie
finalizate în paralel cu microprocesoare multiple.16,18 Arhitectura pentru epoca mare de date se va
baza pe procesoare multicore (cipuri cu miezuri multiple de procesare) (figura 3). Viitorul va vedea un
număr tot mai mare de nuclee în fiecare procesor multicore și mai multe procesoare multicore care
lucrează simultan. Cercetarea va continua să abordeze provocările legate de livrarea de energie,
constrângerile termice și fiabilitatea procesoarelor multicore.16,18
◆ Stocarea datelor
◆ Conectivitate în rețea
Datele mari din medicină necesită conectivitate în rețea cu alte locații, medici, registre ale bolilor,
oameni de știință, depozite de literatură și pacienți (pentru date de monitorizare la distanță). Împreună
cu puterea de procesare și capacitatea de stocare, a existat o creștere exponențială a numărului de
computere și dispozitive în rețea și a ratei la care datele pot fi transferate la nivel global. Acest lucru sa
datorat în mare parte avansării și adoptării unor protocoale de rețea standard, mai degrabă decât de
proprietate, pentru crearea internetului. Începând cu 4 noduri originale în 1969,21, Cisco a estimat că la
nivel mondial 10 miliarde de obiecte au fost conectate la Internet în 2013 (Figura 4) .22 Protocoalele mai
noi vor evolua pe măsura importanței Internetului continuând să se extindă.23 Odată cu dezvoltarea
rețelelor de acces în bandă largă , datele pot fi distribuite oriunde în lume aproape instantaneu. Bell
Labs estimează că între 50 și 100 miliarde de obiecte vor fi conectate la Internet până în 2020.24
◆ Acces mobil
O viziune a viitorului este o societate în rețea cu acces nelimitat oriunde, oricând, către oricine sau orice
altceva.27 Tehnologia mobilă va continua să evolueze pentru a răspunde provocărilor legate de nevoia
simultană de latență înaltă, de înaltă fiabilitate și de foarte scăzută .27,31
◆ Secvențierea ADN-ului
Puține tehnologii noi au depășit ritmul schimbării microprocesoarelor, dar progresele tehnologiei de
secvențiere a ADN-urilor au fost revoluționare (Figura 5). Costul direct al secvențierii unui genom uman
de dimensiuni a scăzut de la aproximativ 95 milioane USD în 2001 la 1245 dolari în 2015.32 Tehnologia
de secvențiere de generație următoare utilizează analize masive paralele, producând milioane de
secvențe citite într-un singur ciclu.33 Aceste progrese tehnologice au crescut numărul a oamenilor de
știință și a laboratoarelor care sunt capabili să participe la cercetarea genetică, au permis investigarea
unui număr și o varietate de întrebări biologice fără precedent la scară largă a genomului și au oferit
rezultate la o viteză neimaginată.34 Noile tehnici de secvențiere creează cantități masive de date , și
reprezintă provocări atât pentru algoritmii software cât și pentru statisticile utilizate pentru analiza
datelor.35-37 Există, de asemenea, numeroase provocări pentru implementarea secvențierii următoarei
generații în locul de muncă clinic.38 Noua tehnologie a dus deja la o creștere uriașă a numărului de
studiile genetice umane, au creat noi cunoștințe despre relația dintre ADN și boală, 39-41 și au declanșat
creșterea megaconsorțiumuri pentru a eșantiona milioane de indivizi.
Un exemplu recent de date importante privind cercetarea în domeniul geneticii este lucrarea
consorțiului internațional privind litiul de genetică (www.ConLiGen.org), care a asamblat, până în
prezent, cele mai mari studii de asociere cu privire la răspunsul la litiu la nivelul genomului (o bază în
tratamentul farmacologic al tulburare bipolară, un medicament cu un mecanism de acțiune în mare
măsură necunoscut) în tulburarea bipolară, în valoare totală de peste 2500 de indivizi. Consortiul, care
implica doua centre franceze, la Paris si Creteil, a prezentat recent genomului dovezi semnificative
semnificative de asociere intre raspunsul litiului si variante genetice comune pe cromozomul 21.42.
Regiunea genetica asociata cu raspunsul continea doua genuri lungi de necodificare a acidului
ribonucleic, regulatori importanți ai expresiei genelor, în special în creier. Acest studiu sugereaza ca o
mai buna intelegere a mecanismelor de droguri si de raspuns poate fi atins prin eforturile internationale
de cooperare care lega expertiza clinica cu scara larga genomica.
◆ Senzori
Monitorizarea la distanță a pacienților la domiciliu a devenit fezabilă în ultimii ani, datorită tehnologiilor
de detectare care colectează date pasive. Senzorii moderni încorporați sunt miniaturizați, ieftini, ușor și
extrem de joasă, iar senzorii multipli sunt combinați în mod obișnuit într-un singur dispozitiv.43,44 De
exemplu, un smartphone modern include senzori pentru a măsura mișcarea internă (accelerometru),
lumină ambiantă, unghiulară viteza (giroscopie), câmpurile magnetice pentru orientare (magnetometru),
activitatea în raport cu altitudinea (barometrul) și localizarea în aer liber [GPS] [Figura 2] .43 Mulți
senzori sunt disponibili pentru măsurători fiziologice, , electroencefalografia, respirația, tensiunea
arterială și conductivitatea pielii.25 Senzorii pentru monitorizarea pacienților sunt, de asemenea, plasați
în locuințe pe pereți și pardoseli.43 Tehnologiile senzorilor de uzură pot fi preferabile pentru unii
pacienți. Aparatele uzate includ dispozitive purtate sub sau peste îmbrăcăminte, e-textile sau țesături cu
electronice și interconexiuni țesute în cârpă, 45 și senzori flexibili, extensibili, care pot fi montați în
curând.46 S-au făcut progrese uriașe cu biosenzorii. Deși aproximativ 85% din piața mondială a
biosenzorilor este pentru măsurarea glicemiei, acest model de monitorizare la domiciliu va fi probabil
copiat pentru o gamă largă de analize.47 Progresele recente includ senzori semi-sintetici și sintetici,
nanomateriale noi pentru a facilita transducția, 48 și senzori chimici bazați pe textile sau epidermici
(temporar tatuaje). Senzorii hipersensibili în medicamente în combinație cu un senzor purtător vor fi
utilizați în curând pentru a măsura aderența pacientului. Materialele noi și strategiile de fabricare a
dispozitivelor vor extinde rolul senzorilor ingerabili pentru a include eliberarea controlată a
medicamentelor și detectarea și tratamentul anomaliilor din tractul gastrointestinal.50,51
Multe proiecte inovatoare de mari dimensiuni sunt în desfășurare în fiecare domeniu al medicinei. Un
eșantion diversificat de studii de mari dimensiuni este prezentat în tabelul I.57-66. În prezent există 153
de registre clinice în SUA cu un număr mediu de pacienți per registru de peste 1 milion.67 Unele țări,
cum ar fi țările nordice și Taiwan, au registre cu date medicale pentru întreaga populație. Există, de
asemenea, eforturi internaționale mari pentru cuplarea datelor genetice cu datele EMR pentru a studia
influența geneticii asupra bolii. Acestea includ consorțiul eMERGE din SUA cu o cohortă de 55 000,68
Marea Britanie Biobank, cu o populație pe bază de cohortă de 500 000,69 și US Million Veterans
Programme.70 Cercetarea de mari dimensiuni poate fi deosebit de importantă pentru condițiile în care
puțin se înțelege despre patofiziologia de bază, precum cele din psihiatrie
Folosirea datelor mari în medicină nu este ușoară. Fiecare pas în achiziția, prelucrarea, curățarea, analiza
și interpretarea datelor mari este dificil (Figura 6), iar 71 de proiecte necesită colaborarea unor persoane
cu o gamă largă de expertiză. Analiza cu succes a datelor medicale mari necesită participarea activă a
medicilor, statisticienilor, biologilor, inginerilor de software, inginerilor mecanici, experților în
securitatea rețelelor și managerilor de proiect. Procedurile și standardele de calitate sunt necesare
pentru fiecare aspect al unui proiect. Este nevoie de mai multe standarde internaționale pentru
protocoalele tehnologice și interpretarea automată a datelor.
Există, de asemenea, multe aspecte legate de implementare, atât tehnice, cât și clinice, de a încorpora,
procesa și interpreta afluxul de date în practica clinică, de exemplu, de la monitorizarea continuă a
pacienților.25,71,72 Diferențele dintre datele generate de diversele tehnologii contribuie la provocările
analitice pentru utilizarea secundară a datelor medicale în cercetare.54,73 Datele mari includ date
structurate (cum ar fi într-o formă, foaie de calcul sau bază de date relațională), date nestructurate (text,
imagini, audio) și semistructurate date (documente XML). Aproximativ 80% din datele din domeniul
sănătății sunt nestructurate, 74 și există mari provocări care încearcă să proceseze vocabularul medical
divers în textul limbajului natural. Datele mari sunt foarte complexe sau foarte dimensionale și pot avea
un număr mare de parametri disponibili pentru fiecare pacient, număr mare de pacienți sau ambii.75
Cele mai mari date nu sunt generate pentru sau din cercetare, iar datele colectate din diferite surse sunt
de calitate diferită. Calitatea datelor este legată de tipul, defectele și proveniența sau traseul de
proprietate, iar calitatea datelor este redusă prin valori lipsă, inconsecvență, nepotrivire sau manipulare
defectuoasă. Există multe prejudecăți și aspecte de calitate atât în ceea ce privește EMR, cât și în ceea ce
privește cererile de plată.54 Datele obținute din surse de internet, cum ar fi mass-media socială, nu sunt
reprezentative pentru întreaga populație, ci doar pentru grupul auto-selectat care utilizează site-ul
specific. analiza datelor observaționale foarte mari poate fi asociată cu multe constatări false, 75 și
analiza va măsura în primul rând corelația nu și cauzalitatea.55 Dacă analiza datelor mari se bazează pe
metode statistice clasice, ipotezele statistice esențiale sunt probabil încălcate. Se creează noi tehnici
analitice care combină abordările statistice (bazate pe model asupra variabilității) și algoritmice
(elaborarea de date pentru modele și reguli) pentru datele mari.73,77 Investigarea datelor medicale
mari necesită participarea activă a celor cu experiență în materie.
În ciuda schimbărilor dramatice ale tehnologiei, capacitatea de procesare umană rămâne aproximativ
aceeași.78 Aplicațiile care utilizează date mari trebuie să abordeze abilitățile umane legate de
multitasking, vizualizarea datelor și prelucrarea cognitivă.79 Noul domeniu al analizei vizuale se
străduiește să îmbunătățească interfețele sistemului prin combinând puterea procesării computerizate
cu abilitatea umană remarcabilă de a recunoaște modelele vizuale. 80,81 Supraîncărcarea senzorială
(Figura 7) și oboseala de alarmă datorată semnalelor sonore și vizuale exagerate de la o multitudine de
monitoare fiziologice dintr-un spital demonstrează importanța interfața umană.82 Una dintre cele mai
mari provocări cu date importante este de a crea instrumente utile și folositoare pentru medicina clinică
care să furnizeze informațiile pe care medicii doresc să le cunoască în mod clar și în timp util.
Folosirea datelor importante pentru cercetarea medicală ridică, de asemenea, provocări etice fără
precedent. Acestea includ întrebări legate de confidențialitatea individuală, confidențialitatea datelor,
consimțământul informat, implicarea organizațiilor comerciale, reutilizarea datelor, reidentificarea
datelor de identificare, diferențele în reglementările internaționale privind confidențialitatea și
schimbarea atitudinii societății față de datele publice și private. Proiectele mari de date sunt adesea
distribuite în mai multe țări, ceea ce face probleme legate de gestionarea datelor, confidențialitatea și
consimțământul mai complexe. Depozitarea cloud în țări necunoscute complică jurisdicția legală.
Legislația privind confidențialitatea variază de la o țară la alta, 83 și multe țări nu au abordat impactul
tehnologiei moderne asupra reglementărilor existente. Există multe probleme legate de datele create de
pacienți. Pacienții pot presupune incorect că toate legile privind confidențialitatea medicală se aplică
companiilor comerciale de internet, aplicațiilor de sănătate descărcate sau datelor furnizate site-urilor
de sănătate.84
Aceste date importante vor permite cercetări noi în toate domeniile medicinei, care vor schimba
practica medicală. Complexitatea cercetărilor de mari dimensiuni face critică faptul că medicii participă
activ la aceste proiecte. În ciuda provocărilor formidabile, deceniile anterioare de îmbunătățire
tehnologică sugerează că în viitor vor apărea noi abordări și soluții interesante pentru problemele mari
de date din medicină. ■