Sunteți pe pagina 1din 7

Viitorul medicinei va fi activat de date mari.

Astăzi, cantitatea de date medicale din lume este masivă și


în creștere rapidă, un rezultat al convergenței schimbărilor evolutive în multe tehnologii din ultimele
decenii. Cu promisiunea cunoștințelor bazate pe date și luarea deciziilor, proiectele inovatoare de date
mari sunt în desfășurare în fiecare domeniu al medicinei. Pentru ca proiectele mari de date să reușească,
expertiza și participarea medicilor sunt necesare în fiecare fază. Acest articol va revedea o parte din
tehnologia fundamentală care stă la baza creșterii datelor importante și va discuta impactul unor date
importante asupra medicamentelor în viitor.

Viitorul medicinei oferă îngrijiri personalizate adaptate pacientului, furnizarea de servicii integrate de
îngrijire, sisteme inteligente de sprijin pentru luarea deciziilor pentru medici, un accent din ce în ce mai
mare pe prevenire și o abordare orientată spre sisteme, mai degrabă decât reducționistă, la înțelegerea
bolii. Toate aceste obiective sunt activate de date mari. În 2013, cantitatea de date medicale digitale din
lume a fost estimată la 153 exabyte (1 exabyte = 1018 octeți), o sumă atât de mare încât este greu de
constatat. Pentru perspectivă, considerați că estimarea a 5 exabyte va stoca toate cuvintele purtate
vreodată de ființele umane

Deși există multe definiții, datele mari sunt mari, eterogene, din mai multe surse și pot ajunge în timp
real. Scara, viteza și complexitatea datelor mari fac dificilă procesarea, analizarea și extragerea
informațiilor.2 Datele mari sunt prea masive pentru ca oamenii să înțeleagă fără ajutorul modelelor de
calculatoare.3

Există trei surse primare de date importante în medicină. Prima sursă de date importante, inclusiv
înregistrările medicale electronice (EMR), revendicările și datele de facturare, datele imaginilor și datele
farmaciei sunt furnizori și plătitori. A doua sursă este omica, inclusiv genomica, proteomica și
metabolomica. Al treilea este pacientul și nonproviderii, adică datele de la activitățile smartphone și
Internet, senzori și instrumentele de monitorizare.4 În viitor, aproximativ două treimi din toate datele
medicale vor proveni din surse create de pacienți.5Nu este doar cantitatea de date medicale digitale
masive astăzi, se estimează că va crește cu 48% pe an până în 2020.6 Există multe exemple pentru care
datele digitale privind sănătatea cresc atât de repede. Cantitatea anuală de date per pacient creată într-
un EMR este de aproximativ 80 MB, 95% din acestea fiind date imagistice.7 Serviciul Național de
Sănătate din Marea Britanie stochează în fiecare zi 1 milion de imagini noi în baza sa de date.8
Depozitarea necesară pentru datele imaginilor este crescând pe măsură ce noile tehnici de imagistică
oferă imagini de rezoluție superioară cu 3 sau 4 dimensiuni.9 Se încep să se colecteze datele genomice și
necesită de aproximativ 50 de ori mai mult stocare pe pacient decât datele imaginilor.10 Echipamentul
de monitorizare din spital folosit într-o unitate de terapie intensivă spital înregistrează între 1000 -2000
de date pe secundă per pacient (Figura 1) .11 În 2015, 4,9 milioane de pacienți au folosit prescris de la
distanță la domiciliu, cel mai mult pentru îngrijirea cardiacă. Creșterea la 36,1 milioane de pacienți este
așteptată până în 2020.12 Pacienții încep să utilizeze aplicații pentru sănătate. Cele 165 000 de aplicații
de sănătate disponibile pentru smartphone-urile Android și Apple (Figura 2) sunt estimate să fie
descărcate de 1,7 miliarde de ori până în 2017,13Promisiunea cunoașterii și a luării deciziilor bazate pe
date a schimbat complet paradigma secolului al XX-lea de focalizare pe tehnologie către o concentrare a
datelor pe secolul XXI14. Acum, tehnologiile sunt proiectate în jurul datelor, mai degrabă decât să fie
concepute date în jurul tehnologiilor. Deși mediile digitale din medicină, cum ar fi EMR peste tot și
sistemele de radiologie care oferă "imagini la locul potrivit la momentul potrivit", 15 sunt acum
considerate date, acestea sunt progrese relativ recente. Epoca zorilor de date mari a fost permisă de o
confluență a progresului tehnologic în multe domenii care au evoluat de-a lungul deceniilor.

Tehnologii care contribuie la creșterea datelor mari în medicină

Pentru a înțelege mai bine domeniul de aplicare al datelor importante din medicină, trebuie să ne uităm
scurt la progresul tehnologic în ultimele decenii.

◆ Puterea de calcul a microprocesorului

Fundația pentru explozia digitală, inclusiv datele importante din medicină, este îmbunătățirea dramatică
a performanțelor și scăderea prețului microprocesoarelor. Dublarea numărului de tranzistori pe un
circuit integrat la fiecare 2 ani de la mijlocul anilor 1960 este o operație istorică de inginerie prevăzută
de Gordon Moore.16,17 Trecând de la zeci de tranzistori la peste un miliard pe un singur microcip a dus
la exponențială îmbunătățiri ale vitezei microprocesorului, permițând multor tipuri de procesoare de uz
general și specializate.

Necesitatea de a analiza, procesa și vizualiza datele mari necesită mai mult decât performanța brută
într-un singur microprocesor. Datele mari necesită ca analizele să fie împărțite în bucăți și să fie
finalizate în paralel cu microprocesoare multiple.16,18 Arhitectura pentru epoca mare de date se va
baza pe procesoare multicore (cipuri cu miezuri multiple de procesare) (figura 3). Viitorul va vedea un
număr tot mai mare de nuclee în fiecare procesor multicore și mai multe procesoare multicore care
lucrează simultan. Cercetarea va continua să abordeze provocările legate de livrarea de energie,
constrângerile termice și fiabilitatea procesoarelor multicore.16,18

◆ Stocarea datelor

Un rezultat imediat al progreselor tehnologiei microprocesoare a fost o creștere enormă a cantității de


date generate și stocate. Un spital tipic de 500 de paturi necesită mai mult de 50 de petabytes (50 ×
1015) de stocare a datelor.6 În ultimele decenii au existat îmbunătățiri dramatice ale numărului de biți
care ar putea fi stocate pe un hard disk.19 De la introducerea hard disk-urilor în 1956, densitatea
informațiilor stocate a crescut de la 2000 de biți la 100 de miliarde de biți (gigabiți) .19 Odată cu
creșterea exponențială a capacității hard diskului a apărut o diminuare a amprentei de produs și o
scădere a prețurilor.19,20 Astăzi furnizorii de cloud fac depozitarea capacitatea a mii de hard disk-uri
disponibile la cerere pentru a permite ca bazele de date foarte mari să fie asamblate rapid pentru
perioade scurte sau lungi de timp.

◆ Conectivitate în rețea
Datele mari din medicină necesită conectivitate în rețea cu alte locații, medici, registre ale bolilor,
oameni de știință, depozite de literatură și pacienți (pentru date de monitorizare la distanță). Împreună
cu puterea de procesare și capacitatea de stocare, a existat o creștere exponențială a numărului de
computere și dispozitive în rețea și a ratei la care datele pot fi transferate la nivel global. Acest lucru sa
datorat în mare parte avansării și adoptării unor protocoale de rețea standard, mai degrabă decât de
proprietate, pentru crearea internetului. Începând cu 4 noduri originale în 1969,21, Cisco a estimat că la
nivel mondial 10 miliarde de obiecte au fost conectate la Internet în 2013 (Figura 4) .22 Protocoalele mai
noi vor evolua pe măsura importanței Internetului continuând să se extindă.23 Odată cu dezvoltarea
rețelelor de acces în bandă largă , datele pot fi distribuite oriunde în lume aproape instantaneu. Bell
Labs estimează că între 50 și 100 miliarde de obiecte vor fi conectate la Internet până în 2020.24

◆ Acces mobil

Tehnologia mobilă (celulară și wireless) a declanșat începutul monitorizării la distanță a pacientului și


gestionarea bolilor de la distanță, 25 și datele generate de pacienți vor constitui o componentă în
creștere a datelor importante. Traficul de date mobile a crescut de aproape 4000 de ori în ultimii 10 ani,
iar volumul de trafic mobil este de așteptat să crească cu câteva sute de ori în următoarea decadă.27
Costul relativ scăzut al tehnologiei mobile a permis crearea rapidă a rețelelor în economiile în curs de
dezvoltare, aducând accesul la Internet la milioane.28 În 2015, 95% din populația lumii a fost acoperită
de o rețea celulară mobilă 2G și de bandă largă mobilă de 47% prin 3G.29 Procentul global al abonaților
mobili în anul 2015 a fost de 63% sau 4.7 miliarde de abonați unici .30 Aproximativ 43% din numărul
total de telefoane mobile în 2015 au fost smartphone-uri, cu o creștere estimată la 50% până în 2020
(figura 2).

O viziune a viitorului este o societate în rețea cu acces nelimitat oriunde, oricând, către oricine sau orice
altceva.27 Tehnologia mobilă va continua să evolueze pentru a răspunde provocărilor legate de nevoia
simultană de latență înaltă, de înaltă fiabilitate și de foarte scăzută .27,31

◆ Secvențierea ADN-ului

Puține tehnologii noi au depășit ritmul schimbării microprocesoarelor, dar progresele tehnologiei de
secvențiere a ADN-urilor au fost revoluționare (Figura 5). Costul direct al secvențierii unui genom uman
de dimensiuni a scăzut de la aproximativ 95 milioane USD în 2001 la 1245 dolari în 2015.32 Tehnologia
de secvențiere de generație următoare utilizează analize masive paralele, producând milioane de
secvențe citite într-un singur ciclu.33 Aceste progrese tehnologice au crescut numărul a oamenilor de
știință și a laboratoarelor care sunt capabili să participe la cercetarea genetică, au permis investigarea
unui număr și o varietate de întrebări biologice fără precedent la scară largă a genomului și au oferit
rezultate la o viteză neimaginată.34 Noile tehnici de secvențiere creează cantități masive de date , și
reprezintă provocări atât pentru algoritmii software cât și pentru statisticile utilizate pentru analiza
datelor.35-37 Există, de asemenea, numeroase provocări pentru implementarea secvențierii următoarei
generații în locul de muncă clinic.38 Noua tehnologie a dus deja la o creștere uriașă a numărului de
studiile genetice umane, au creat noi cunoștințe despre relația dintre ADN și boală, 39-41 și au declanșat
creșterea megaconsorțiumuri pentru a eșantiona milioane de indivizi.
Un exemplu recent de date importante privind cercetarea în domeniul geneticii este lucrarea
consorțiului internațional privind litiul de genetică (www.ConLiGen.org), care a asamblat, până în
prezent, cele mai mari studii de asociere cu privire la răspunsul la litiu la nivelul genomului (o bază în
tratamentul farmacologic al tulburare bipolară, un medicament cu un mecanism de acțiune în mare
măsură necunoscut) în tulburarea bipolară, în valoare totală de peste 2500 de indivizi. Consortiul, care
implica doua centre franceze, la Paris si Creteil, a prezentat recent genomului dovezi semnificative
semnificative de asociere intre raspunsul litiului si variante genetice comune pe cromozomul 21.42.
Regiunea genetica asociata cu raspunsul continea doua genuri lungi de necodificare a acidului
ribonucleic, regulatori importanți ai expresiei genelor, în special în creier. Acest studiu sugereaza ca o
mai buna intelegere a mecanismelor de droguri si de raspuns poate fi atins prin eforturile internationale
de cooperare care lega expertiza clinica cu scara larga genomica.

◆ Senzori

Monitorizarea la distanță a pacienților la domiciliu a devenit fezabilă în ultimii ani, datorită tehnologiilor
de detectare care colectează date pasive. Senzorii moderni încorporați sunt miniaturizați, ieftini, ușor și
extrem de joasă, iar senzorii multipli sunt combinați în mod obișnuit într-un singur dispozitiv.43,44 De
exemplu, un smartphone modern include senzori pentru a măsura mișcarea internă (accelerometru),
lumină ambiantă, unghiulară viteza (giroscopie), câmpurile magnetice pentru orientare (magnetometru),
activitatea în raport cu altitudinea (barometrul) și localizarea în aer liber [GPS] [Figura 2] .43 Mulți
senzori sunt disponibili pentru măsurători fiziologice, , electroencefalografia, respirația, tensiunea
arterială și conductivitatea pielii.25 Senzorii pentru monitorizarea pacienților sunt, de asemenea, plasați
în locuințe pe pereți și pardoseli.43 Tehnologiile senzorilor de uzură pot fi preferabile pentru unii
pacienți. Aparatele uzate includ dispozitive purtate sub sau peste îmbrăcăminte, e-textile sau țesături cu
electronice și interconexiuni țesute în cârpă, 45 și senzori flexibili, extensibili, care pot fi montați în
curând.46 S-au făcut progrese uriașe cu biosenzorii. Deși aproximativ 85% din piața mondială a
biosenzorilor este pentru măsurarea glicemiei, acest model de monitorizare la domiciliu va fi probabil
copiat pentru o gamă largă de analize.47 Progresele recente includ senzori semi-sintetici și sintetici,
nanomateriale noi pentru a facilita transducția, 48 și senzori chimici bazați pe textile sau epidermici
(temporar tatuaje). Senzorii hipersensibili în medicamente în combinație cu un senzor purtător vor fi
utilizați în curând pentru a măsura aderența pacientului. Materialele noi și strategiile de fabricare a
dispozitivelor vor extinde rolul senzorilor ingerabili pentru a include eliberarea controlată a
medicamentelor și detectarea și tratamentul anomaliilor din tractul gastrointestinal.50,51

Promite de date mari

Luate împreună, evoluția microprocesoarelor, a stocării, a rețelelor, a accesului mobil, a senzorilor și a


secvențializării ADN-ului a permis ca seturile de date medicale masive să fie asamblate pentru analiză.
Datele mari vor oferi oportunități de neegalat pentru a răspunde la întrebări care nu pot fi răspunsate
prin studii clinice sau care necesită rezultate pe mai multe ani.52 Datele mari vor permite studiul
evenimentelor rare și grupurilor rare de populație, extinderea studiilor epidemiologice, studiile de
fenotip genotipic, despre comportamentul și acțiunile umane și detectarea noilor asociații.53,54
Constatările din studiile de mare amploare vor fi incluse în standarde și ghiduri pentru managementul
clinic și vor avea impact asupra practicilor de afaceri în domeniul sănătății. Corelațiile constatate în date
mari vor conduce la generarea de noi ipoteze, 55 care pot fi investigate prin metode de utilizare
intensivă sau tradiționale, după caz.56 În viitor, sistemele cognitive care utilizează inteligența artificială
ar putea să deducă, să prezică și să crească luarea deciziilor medicale.

Multe proiecte inovatoare de mari dimensiuni sunt în desfășurare în fiecare domeniu al medicinei. Un
eșantion diversificat de studii de mari dimensiuni este prezentat în tabelul I.57-66. În prezent există 153
de registre clinice în SUA cu un număr mediu de pacienți per registru de peste 1 milion.67 Unele țări,
cum ar fi țările nordice și Taiwan, au registre cu date medicale pentru întreaga populație. Există, de
asemenea, eforturi internaționale mari pentru cuplarea datelor genetice cu datele EMR pentru a studia
influența geneticii asupra bolii. Acestea includ consorțiul eMERGE din SUA cu o cohortă de 55 000,68
Marea Britanie Biobank, cu o populație pe bază de cohortă de 500 000,69 și US Million Veterans
Programme.70 Cercetarea de mari dimensiuni poate fi deosebit de importantă pentru condițiile în care
puțin se înțelege despre patofiziologia de bază, precum cele din psihiatrie

Provocări ale datelor importante

Folosirea datelor mari în medicină nu este ușoară. Fiecare pas în achiziția, prelucrarea, curățarea, analiza
și interpretarea datelor mari este dificil (Figura 6), iar 71 de proiecte necesită colaborarea unor persoane
cu o gamă largă de expertiză. Analiza cu succes a datelor medicale mari necesită participarea activă a
medicilor, statisticienilor, biologilor, inginerilor de software, inginerilor mecanici, experților în
securitatea rețelelor și managerilor de proiect. Procedurile și standardele de calitate sunt necesare
pentru fiecare aspect al unui proiect. Este nevoie de mai multe standarde internaționale pentru
protocoalele tehnologice și interpretarea automată a datelor.

Există, de asemenea, multe aspecte legate de implementare, atât tehnice, cât și clinice, de a încorpora,
procesa și interpreta afluxul de date în practica clinică, de exemplu, de la monitorizarea continuă a
pacienților.25,71,72 Diferențele dintre datele generate de diversele tehnologii contribuie la provocările
analitice pentru utilizarea secundară a datelor medicale în cercetare.54,73 Datele mari includ date
structurate (cum ar fi într-o formă, foaie de calcul sau bază de date relațională), date nestructurate (text,
imagini, audio) și semistructurate date (documente XML). Aproximativ 80% din datele din domeniul
sănătății sunt nestructurate, 74 și există mari provocări care încearcă să proceseze vocabularul medical
divers în textul limbajului natural. Datele mari sunt foarte complexe sau foarte dimensionale și pot avea
un număr mare de parametri disponibili pentru fiecare pacient, număr mare de pacienți sau ambii.75
Cele mai mari date nu sunt generate pentru sau din cercetare, iar datele colectate din diferite surse sunt
de calitate diferită. Calitatea datelor este legată de tipul, defectele și proveniența sau traseul de
proprietate, iar calitatea datelor este redusă prin valori lipsă, inconsecvență, nepotrivire sau manipulare
defectuoasă. Există multe prejudecăți și aspecte de calitate atât în ceea ce privește EMR, cât și în ceea ce
privește cererile de plată.54 Datele obținute din surse de internet, cum ar fi mass-media socială, nu sunt
reprezentative pentru întreaga populație, ci doar pentru grupul auto-selectat care utilizează site-ul
specific. analiza datelor observaționale foarte mari poate fi asociată cu multe constatări false, 75 și
analiza va măsura în primul rând corelația nu și cauzalitatea.55 Dacă analiza datelor mari se bazează pe
metode statistice clasice, ipotezele statistice esențiale sunt probabil încălcate. Se creează noi tehnici
analitice care combină abordările statistice (bazate pe model asupra variabilității) și algoritmice
(elaborarea de date pentru modele și reguli) pentru datele mari.73,77 Investigarea datelor medicale
mari necesită participarea activă a celor cu experiență în materie.

În ciuda schimbărilor dramatice ale tehnologiei, capacitatea de procesare umană rămâne aproximativ
aceeași.78 Aplicațiile care utilizează date mari trebuie să abordeze abilitățile umane legate de
multitasking, vizualizarea datelor și prelucrarea cognitivă.79 Noul domeniu al analizei vizuale se
străduiește să îmbunătățească interfețele sistemului prin combinând puterea procesării computerizate
cu abilitatea umană remarcabilă de a recunoaște modelele vizuale. 80,81 Supraîncărcarea senzorială
(Figura 7) și oboseala de alarmă datorată semnalelor sonore și vizuale exagerate de la o multitudine de
monitoare fiziologice dintr-un spital demonstrează importanța interfața umană.82 Una dintre cele mai
mari provocări cu date importante este de a crea instrumente utile și folositoare pentru medicina clinică
care să furnizeze informațiile pe care medicii doresc să le cunoască în mod clar și în timp util.

Etica datelor mari

Folosirea datelor importante pentru cercetarea medicală ridică, de asemenea, provocări etice fără
precedent. Acestea includ întrebări legate de confidențialitatea individuală, confidențialitatea datelor,
consimțământul informat, implicarea organizațiilor comerciale, reutilizarea datelor, reidentificarea
datelor de identificare, diferențele în reglementările internaționale privind confidențialitatea și
schimbarea atitudinii societății față de datele publice și private. Proiectele mari de date sunt adesea
distribuite în mai multe țări, ceea ce face probleme legate de gestionarea datelor, confidențialitatea și
consimțământul mai complexe. Depozitarea cloud în țări necunoscute complică jurisdicția legală.
Legislația privind confidențialitatea variază de la o țară la alta, 83 și multe țări nu au abordat impactul
tehnologiei moderne asupra reglementărilor existente. Există multe probleme legate de datele create de
pacienți. Pacienții pot presupune incorect că toate legile privind confidențialitatea medicală se aplică
companiilor comerciale de internet, aplicațiilor de sănătate descărcate sau datelor furnizate site-urilor
de sănătate.84

Schimbarea viitorului medicinei

Convergența îmbunătățirilor dramatice ale puterii de calcul a microprocesoarelor, stocarea datelor,


conectivitatea la nivel mondial, accesul mobil, secvențierea ADN-ului și senzorii reprezintă fundamentul
exploziei datelor medicale. Proiectele mari de date care apar astăzi sunt o dezvoltare a deceniilor de
progres tehnologic diversificat care a permis crearea și prelucrarea unor cantități enorme de date.
Dezvoltarea rapidă și continuă a tehnologiilor medicale, cum ar fi secvențierea, imagistica și
monitorizarea pacienților, sunt complet interconectate cu progresul în infrastructura tehnologică. Vor fi
generate mai multe date care trebuie stocate, distribuite, prelucrate, analizate și interpretate.

Aceste date importante vor permite cercetări noi în toate domeniile medicinei, care vor schimba
practica medicală. Complexitatea cercetărilor de mari dimensiuni face critică faptul că medicii participă
activ la aceste proiecte. În ciuda provocărilor formidabile, deceniile anterioare de îmbunătățire
tehnologică sugerează că în viitor vor apărea noi abordări și soluții interesante pentru problemele mari
de date din medicină. ■

S-ar putea să vă placă și