Documente Academic
Documente Profesional
Documente Cultură
Student :
Szilveszter Alexandru
Cuprins
1.Prezentare generală
2. VoxelNet
3. Învățarea caracteristicilor de rețea
4. Straturi medii convoluționale
5. Implementarea detecției obiectelor 3D bazate pe mulțimea de
puncte LIDAR
6. Rezultatele in urma executării codului
7. Detectarea si segmentarea obiectelor fără folosirea
datelor de tip LIDAR.
Bibliografie
1. Prezentare generală
Tehnicile de ultimă generație în domeniul vederii computerizate detectează obiectul cu o precizie
ridicată de date 2D, cum ar fi imagini, videoclipuri (secvențe de cadre de imagine) în timp real. Utilizarea
senzorului camerei pentru activități precum localizarea, măsurarea distanței dintre obiecte și calcularea
informațiilor de adâncime poate să nu fie eficientă și este costisitoare din punct de vedere computerizat.
a) b) c) d)
Arhitectura VoxelNet
VoxelNet reprezintă o abordare inovatoare în prelucrarea datelor provenite de la senzorii LiDAR în contextul vehiculelor
autonome. Această metodă combină conceptele de voxelizare și rețele neuronale pentru a efectua segmentarea obiectelor
3D din mediul înconjurător.
1. *Voxelizare:* Datele LiDAR sunt transformate într-un format tridimensional numit voxel, asemănător cu un pixel în
imagini 2D, dar în spațiu tridimensional. Astfel, informațiile sunt reprezentate sub formă de cuburi tridimensionale în
care se grupează datele din zonele spațiale apropiate.
2. *Rețele neuronale convoluționale 3D (CNN):* După voxelizare, aceste cuburi tridimensionale sunt introduse într-o
rețea neuronală convoluțională 3D. Aceasta analizează volumul tridimensional de date și învață să identifice
caracteristicile specifice ale obiectelor, precum mașini, pietoni sau alte structuri.
3. *Detectarea și clasificarea obiectelor:* Pe baza analizei efectuate de rețeaua neuronală, VoxelNet poate identifica și
clasifica obiectele din mediul înconjurător. De exemplu, poate face distincția între autovehicule, pietoni sau alte obiecte
semnificative pentru vehiculul autonom.
Această abordare oferă un mod eficient de a procesa și înțelege datele complexe provenite de la senzorii LiDAR în
mediul 3D, contribuind la capacitatea vehiculelor autonome de a percepe și de a lua decizii într-un mod precis și sigur
3. Învățarea caracteristicilor de rețea
• Învățarea caracteristicilor de rețea se aplică tuturor cuburilor care conțin mai mult de un număr T de puncte.
În figura de mai jos se poate observa delimitarea unui spațiu 3D în cuburi Voxel plasate la distanțe egale.
În pașii următori am descărcat setul de date KITTI. Acesta a fost procesat si sectionat, iar ulterior am
realizat dezarhivarea sa.
6. Rezultatele așteptate in urma executării codului
https://www.cvlibs.net/datasets/kitti/index.php
https://www.sciencedirect.com/science/article/pii/S2666691X22000136
https://towardsdatascience.com/lidar-point-cloud-based-3d-object-detection-
implementation-with-colab-part-2-of-2-f3ad55c3f38c
https://www.hindawi.com/journals/cin/2022/6390260/
https://arxiv.org/abs/1711.06396
https://www.youtube.com/watch?v=iYx57oa8jT4&ab_channel=TutorialsTube
https://github.com/enginBozkurt/Visualizing-lidar-data/blob/master/Kitti-
Dataset.ipynb