Sunteți pe pagina 1din 10

ELENA UNEA

UTILIZAREA
TEHNICILOR DATA MINING
NTR-UN SISTEM
EDUCAIONAL
DE TIP E-LEARNING

Copyright 2012, Editura Pro Universitaria


Toate drepturile asupra prezentei ediii aparin
Editurii Pro Universitaria
Nicio parte din acest volum nu poate fi copiat fr acordul scris al
Editurii Pro Universitaria
Descrierea CIP a Bibliotecii Naionale a Romniei
UNEA, ELENA
Utilizarea tehnicilor data mining ntr-un sistem
educaional de tip e-Learning / Elena unea. - Bucureti : Pro
Universitaria, 2012
Bibliogr.
ISBN 978-606-647-543-3
004:371
004.43 Data Mining

CUVNT NAINTE
n prezent, educaia reprezint un factor hotrtor n dezvoltarea pe termen
lung a unei ri, implicnd bunstarea i progresul acesteia. Naiunile care aleg
sistemele de instruire ce utilizeaz noile tehnologii educaionale vor fi naiunile
cele mai puternice din punct de vedere economic n secolul XXI.
Digitizarea, interactivitatea i virtualitatea ofer noi oportuniti i extind
limitele privind modul de organizare i desfurare a proceselor educaionale la
toate nivelurile, fiind factori importani ai schimbrilor ce au loc n domeniul
educaional militar.
Contextul apariiei acestei cri este propice, att datorit creterii
interesului studenilor manifestat la nivel global, pentru cursurile desfurate online, ct i exigenelor NATO privind utilizarea unui sistem avansat de
instrumente i tehnologii de instruire pentru profesionalizarea personalului
armatei.
Dinamica nregistrat de noile tehnologii va avea n continuare un impact
profund asupra premiselor de baz ale nvmntului militar i va da natere la
cutarea de teorii i metodologii educaionale noi, care s satisfac cerinele
privind predarea, nvarea i cercetarea din domeniul academic militar.
Platformele educaionale LMS (Learning Management System, sistem de
management al nvrii), acele aplicaii informatice complexe cu faciliti precum
organizarea i furnizarea de informaii, sprijinirea proceselor de nvare,
supervizarea i evaluarea rezultatelor studenilor, permit stocarea unui volum
mare de date. Exploatarea eficient a acestor date contribuie semnificativ la
dezvoltarea unor instrumente care s faciliteze realizarea unui nvmnt centrat
pe student.
Scopul acestei cri este nelegerea proceselor desfurate ntr-un mediu
virtual de nvare prin analiza datelor furnizate de un sistem de management al
nvrii i elaborarea unor predicii privind aceste procese. n acest sens, autoarea
crii prezint ntr-o form integratoare unele metode de analiz preluate din
statistic i inteligen artificial, reuind o mbinare perfect ntre cunoterea
tiinific, experiena e-learning i practica specific domeniului educaional
militar.
5

Cultura i talentul didactic al autoarei sunt evidente. Utilizarea tehnicilor din


domeniul data minig, un domeniu tiinific transdisciplinar relativ nou, este
ilustrat n susinerea unor activiti de tip e-learning folosind pentru
exemplificarea aspectelor metodologice o aplicaie cu caracter didactic.
Materialul este bine organizat, prezentarea este gradat, expunerea este
foarte elegant i n acelai timp, clar i inteligibil. Lucrarea se concentreaz pe
crearea unei baze teoretice prin prezentarea tehnicilor data mining utilizate n
mediul de nvare virtual i pe elaborarea unor modele care s genereze pe
termen lung cunotine utile studenilor, profesorilor sau tutorilor, managerilor
educaionali i dezvoltatorilor de produse software educaionale, continund cu
valorificarea acestor modele n procesele din cadrul i din afara sistemelor de
management al nvrii.
Data mining este un proces laborios n care sunt utilizate metodele de
descriere i predicie pentru a elabora modele care ulterior sunt testate pentru a
elabora informaiile necesare proceselor decizionale.
Analiza datelor n vederea obinerii de informaii recurge la diverse tehnici,
printre cele mai folosite aflndu-se: clustering, reguli de asociere, arbori de
decizie, reele neuronale artificiale. Dei unele tehnici data mining dateaz de mai
muli ani, cum sunt cele preluate din statistic, totui algoritmii folosii au
cunoscut un proces de evoluie continu, care a permis nlturarea unora dintre
limitele sau deficienele iniiale.
Perspectiva adoptat n aceast lucrare de autoarea Elena unea este aceea
c tehnologiile data mining vor contribui semnificativ la mbuntirea
capacitilor de nvare ale studenilor. Prin nglobarea tehnicilor din inteligena
artificial i statistic n sistemele de tip e-learning se vor crea premisele
dezvoltrii unor sisteme inteligente de instruire.
O asisten inteligent i personalizat pe care un profesor sau tutore o poate
oferi ntr-o anumit situaie educaional n clas (tradiional sau virtual) nu este
uor de realizat. Prin utilizarea tehnologiilor data mining n sistemele de
management al nvrii se adaug funcionalitate n sensul asistrii i adaptrii
inteligente a sistemului la situaia creat.
Instrumentele ce pot fi dezvoltate pe baza modelelor rezultate n urma
folosirii tehnicilor data mining nu elimin nevoia de a avea profesori sau tutori
comuni ns rolul acestora se modific. Acetia trebuie s supravegheze i s
evalueze crearea materialelor necesare n instruirea on-line, s asiste studenii i s
6

monitorizeze progresul nregistrat de acetia, s revizuiasc materialele didactice


n funcie de feedback-ul primit de la studeni etc. n plus, interaciunea uman
este inestimabil n multe situaii de instruire on-line.
n viitor, odat cu utilizarea tehnicilor data mining n educaie, o mare parte
din funciile profesorului sau al tutorelui vor fi preluate de ageni software care
pot ndeplini aceast funcie cu scopul de a ajuta studentul. Astfel, e-learning va
deveni un mediu educaional ce va permite instruirea rapid a unui numr din ce
n ce mai mare de studeni ntr-un mod mult mai eficient.
Valoarea lucrrii este n primul rnd didactic att prin prisma modelului de
sistematizare i prezentare a metodelor de minerit ilustrate cu exemple didactice,
ct i prin cea a ncercrilor de a contribui la mbuntirea predrii cu ajutorul
mijloacelor TIC (tehnologia informaiei i comunicaiilor) prin furnizarea de
feedback profesorului/instructorului n faza de examinare evaluare a cursanilor.
Concluziile trase prin experimentarea pe o baz de date real sunt foarte
valoroase, ele contribuind la nelegerea unor efecte generate de o parte dintre
activitile susinute prin intermediul platformelor informatice de tip e-learning.
Acumularea i crearea de cunotine n cadrul proceselor educaionale
implic antrenarea unor resurse variate (resurse umane precum profesori sau tutori,
resurse financiare, echipamente hardware, produse software educaionale, timp
etc.) n scopul realizrii obiectivelor didactice. ns nu este suficient s dispui de
cele mai moderne tehnologii pentru a desfura un proces educaional optim,
trebuie s accesezi materialele educaionale, s-i doreti s studiezi i s ai
competene metacognitive necesare s o faci.

Teodor FRUNZETI

INTRODUCERE
Domeniul educaional a cunoscut n ultimii ani transformri profunde n
special datorit influenei noilor tehnologii educaionale. Schimbrile importante
produse de acestea n sistemul de nvmnt ating un stadiu care permit
universitilor s desfoare un proces educaional eficient, adaptat nevoilor
studenilor.
Odat cu creterea popularitii Internetului, instituiile de nvmnt
superior au nceput s diversifice oferta de servicii educaionale pentru categoriile
de studeni. Un studiu publicat n noiembrie 2008, efectuat de Allen E., Seaman .J.
.a. [1] de la consoriul Sloan-C, n care se examineaz starea nvmntului
universitar on-line desfurat n S.U.A. [2], indic o cretere a interesului
manifestat de studeni pentru aceast form de nvmnt. Astfel, comparativ cu
datele publicate n anul 2004, raportul curent indic existena unui numr de dou
ori mai mare de studeni ce urmeaz cursuri on-line i o rat de cretere de 12.9 %
a numrului de studeni pentru anul universitar 2007-2008 fa de anul precedent.
Apariia i dezvoltarea noilor tehnologii a avut un impact puternic i asupra
nvmntului militar. Evoluia proceselor i fenomenelor militare este strns
corelat cu dezvoltarea tehnologic. Profesionalizarea personalului armatei
presupune, printre altele, utilizarea unui sistem avansat de instrumente i
tehnologii de instruire, inclusiv nvarea distribuit avansat la distan.
Unul din principiile care stau la baza modernizrii Armatei Romniei,
principiu prevzut i n Strategia Militar a Romniei [3], este promovarea
tehnologiilor moderne. Utilizarea acestor tehnologii n procesul instruirii va
permite operaionalizarea forelor conform standardelor Alianei i participarea
acestora la ndeplinirea cu succes a misiunilor pentru care au fost create.
Prin introducerea standardelor impuse de nvmntul Distribuit Avansat la
Distan (Advanced Distributed Learning, ADL 1 ) n armat, resursele
educaionale devin accesibile oriunde i oricnd [4]. Aceasta nseamn c se pot
1

Strategie elaborat n cadrul Departamentului Aprrii al Statelor Unite care se ocup cu


standardizarea i modernizarea educaiei i formrii profesionale prin utilizarea tehnologiilor
informaiei i comunicaiilor .

13

asigura mobilitatea, operativitatea personalului i realizarea de economii


substaniale, caracteristici foarte importante pentru domeniul militar.
Prin folosirea sistemului e-learning, personalul militar va avea acces la un
sistem educaional modern, de cea mai nalt calitate, conceput pentru nevoile
specifice din domeniu.
n prezent, sistemele e-learning permit achiziia i stocarea unui volum
imens de date. Exploatate suficient, aceste date conduc la obinerea unor
informaii care s reflecte comportamentul sistemului analizat i, n consecin, a
procesului educaional desfurat n cadrul instituiilor de nvmnt.
O platform e-learning complet trebuie s fie un sistem integrat de predare,
nvare i gestiune a coninutului educaional bazat pe principii pedagogice
moderne i s ofere suport pentru predare i nvare, testare i evaluare,
administrarea coninutului, monitorizarea procesului de nvmnt i concepia
curricular.
Universitatea Naional de Aprare Carol I folosete platforma ILIAS1,
din anul 2006, oferind un pachet de cursuri on-line cu suport SCORM2 (Sharable
Content Object Reference Model) care permite monitorizarea i parcurgerea
coninuturilor educaionale conform nevoilor fiecrui student [5]. De asemenea,
platforma e-learning ofer informaii factorilor responsabili din domeniile
decizional, control i planificare respectiv proiectare software, privind modul de
desfurare a procesului de nvmnt [6].
Informaiile necesare pentru analiza procesului de nvmnt pot fi extrase
din datele existente n baza de date a platformei ILIAS, ns acestea sunt dificil de
extras. Tehnicile din domeniul Knowledge Discovery in Database (KDD) i Data
Mining (DM) ajut utilizatorii s descopere informaii folositoare n baza de date.
Dei din 1990 DM i KDD au fost subiecte de interes pentru comunitatea
tiinific, totui terminologia nc variaz i definiiile nu sunt ntotdeauna
clarificatoare.

Sistem de management a nvrii bazat pe Web, care permite gestionarea facil a


resurselor ntr-un sistem integrat, detalii la http://www.ilias.de.
2
SCORM integreaz un set de standarde tehnice, specificaii, precum i orientri concepute
pentru a satisface exigenele utilizatorilor privind accesibilitatea, interoperabilitatea, durabilitatea
i reutilizarea coninutului i a sistemelor de management al nvrii. Aceast colecie de
standarde este definit de Advanced Distributed Learning.

14

ntr-un sistem educaional centrat pe student, datele privitoare la activitile


desfurate de studeni pe toat perioada derulrii cursului la care sunt nscrii,
prelucrate i interpretate corect, pot furniza informaii importante personalului
responsabil de buna desfurare a activitilor didactice (manageri educaionali,
profesori, dezvoltatori software, specialiti din domeniul psiho-pedagogiei).
Platforma ILIAS furnizeaz n acest sens, dou tipuri de date:
resurse educaionale - sistemul pune la dispoziie o serie de resurse
stocate n server, incluznd pagini Web, prin intermediul crora
sunt prezentate coninuturile educaionale, temele pentru acas,
testele pariale i finale, link-uri ctre alte resurse educaionale
disponibile n spaiul Web, simulri;
date referitoare la activitile utilizatorilor, cum ar fi: crearea,
modificare, evaluarea sau folosirea resurselor educaionale,
momentul logrii / delogrii.
Printre factorii care determin creterea cantitii de date stocate n sistemul
ILIAS menionm:
existena unor cursuri n desfurare, implic stocarea unor date,
pentru fiecare student, privind accesarea suportului de curs,
parcurgerea testelor de evaluare, nregistrarea rspunsurilor i a
numrului de ncercri efectuate pentru fiecare item etc.;
apariia unor cursuri noi, presupune pe lng stocarea datelor
amintite anterior i crearea unor noi resurse educaionale n
conformitate cu profilul absolventului;
actualizarea coninuturilor educaionale, prin nlocuirea acelor
pri considerate depite cu unele care corespund unor rezultate
tiinifice recente i au aplicabilitate mai mare;
diversificarea formatului electronic de prezentarea a materialelor
didactice, prin substituirea unor formate statice cu unele care
asigur un grad mare de interactivitate i sunt mai sugestive.
Avnd n vedere cele menionate mai sus, ne propunem s rezolvm un
aspect important privind extragerea unor cunotine din seturile de date ale
studenilor care au desfurat cursuri de pregtire on-line accesnd resursele
educaionale puse la dispoziie de platforma e-learning ILIAS. n procesul de

15

extragere a unor informaii noi i utile pentru cunoaterea proceselor educaionale,


am utilizat metodele i tehnicile data mining.
Organizare i coninut
Prima parte a crii prezint etapele pe care le-a traversat educaia la distan
din punct de vedere a transmiterii informaiilor ctre studeni. Acest tip de
educaie s-a dezvoltat i rafinat continuu atingnd punctul culminant odat cu
asimilarea noilor tehnologii ale informaiei i comunicaiilor, conducnd la
paradigma e-learning. Creterea popularitii Internetului a determinat apariia
nvmntului bazat pe Web (Web-Based Learning) i odat cu el dezvoltarea i
diversificarea sistemelor de management al nvrii (Learning Management
System). Sunt prezentate deasemenea categoriile de date furnizate de platforma elearning ILIAS, factorii care determin creterea volumului de date i modul n
care pot fi analizate aceste date pentru extragerea informaiilor utile dezvoltrii
unui sistem de nvmnt centrat pe student.
n primul capitol, intitulat Sisteme educaionale de tip e-learning, sunt
analizate trsturile comune ale platformelor educaionale de tip e-learning i
factorii care sunt luai n considerare cnd se achiziioneaz o astfel de platform,
un factor important fiind numrul de utilizatori. Dei exist peste 50 de sisteme
open-source pentru managementul nvrii, printre cele mai utilizate sunt Moodle
i ILIAS.
Deoarece analiza fcut n cadrul acestei cri are la baz date furnizate de
sistemul ILIAS, au fost prezentate detaliat caracteristicile i facilitile acestuia.
Sistemul ILIAS are o arhitectur modular, oferind un set de servicii la nivelul
interfeei utilizator datorit existenei urmtoarelor subsisteme: subsistemul de
evaluare, subsistemul de administrare a nvrii, subsistemul de gestionare a
bazelor de date, subsistemul de particularizare a interfeelor. De asemenea, sunt
fcute cteva consideraii privind implementarea unui modul software pentru
analiza datelor furnizate de platform.
Capitolul 2, denumit Data mining i procesul de descoperire a
cunotinelor, are ca scop prezentarea domeniului tiinific data mining. Asaltai
de volumul tot mai mare de date coninute de bazele de date, cercettorii din
domeniile bazelor de date, statisticii, inteligenei artificiale i recunoaterea
formelor, au nceput s defineasc proceduri standard care s ghideze utilizatorii
n extragerea informaiilor utile cu scopul cunoaterii sistemului descris de acele
16

date. n acest sens au fost elaborate mai multe modele, cel mai des utilizat fiind
modelul CRISP-DM, propus de un mare consoriu de companii europene (Integral
Solution Ltd., NCR, DaimlerChrysler, OHARA) care const n parcurgerea a ase
faze. Extragerea informaiilor din bazele de date poate avea ca obiective:
modelarea descriptiv a sistemului, analiza exploratorie a datelor, modelarea
predictiv, descoperirea pattern-urilor i a regulilor, cutarea dup coninut. n
acest sens, sunt prezentate metodele data mining si principalele aplicaii software
care utilizeaz aceste metode.
Dei metodele i tehnicile din domeniul data mining sunt din ce n ce mai
des utilizate, totui terminologia nc mai variaz iar procesul data mining este
frecvent confundat cu procesul de descoperire a cunotinelor din bazele de date
(Knowledge Discovery in Database, KDD). n 1996, Fayyad .a. definete pentru
prima dat conceptul KDD i elaboreaz un model de baz pentru extragerea
cunotinelor din bazele de date. n acest model, data mining este prezentat ca
subproces al procesului KDD (alturi de selecia, preprocesarea, transformarea
datelor respectiv interpretarea-evaluarea informaiilor).
Capitolul 3, intitulat Metode de extragere i selecie a caracteristicilor,
prezint metode de extragere i selecie a caracteristicilor obiectelor stocate n
baza de date. Cele dou operaii sunt importante deoarece permit reducerea
complexitii datelor i implicit eliminarea zgomotului, reducerea memoriei
alocate i a timpului de procesare a acestora. n funcie de numrul de
caracteristici de intrare, tehnicile de extragere a caracteristicilor poate aduce o
mbuntire substanial a algoritmului de calcul din punct de vedere al
complexitii acestuia.
La finalul acestui capitol, este realizat o analiz exploratorie a datelor
coninute de baza de date furnizat de platforma educaional ILIAS, ca pas
premergtor n identificarea claselor prin utilizarea metodelor de clustering
prezentate n capitolul urmtor.
Capitolul 4 cu titlul Metode i tehnici data mining utilizate n modelarea
descriptiv i descoperirea regulilor de asociere prezint tehnicile de clustering
utilizate n instrumentele de tip data mining cu exemplificri pe baza de date. S-a
evideniat faptul c, deoarece acestea nu sunt supervizate, gradul lor de clasificare
a datelor rmne puternic dependent de distribuia caracteristicilor din punctul de
vedere al distanelor interclase i intraclas. Sunt aplicate tehnici precum
clustering i algoritmul k-means.
17

S-ar putea să vă placă și