Documente Academic
Documente Profesional
Documente Cultură
Esta disciplina se ocupa de todas las actividades relacionadas con los sistemas
que manipulan grandes conjuntos de datos. Las dificultades ms habituales
vinculadas a la gestin de estas cantidades de datos se centran en la
recoleccin y el almacenamiento, bsqueda, comparticin, anlisis, y
visualizacin.
Es un trmino que hace referencia a una cantidad de datos tal que supera la
capacidad del software convencional para ser capturados, administrados y
procesados en un tiempo razonable. En 2012 se estimaba su tamao de entre
una docena de terabytes hasta varios peta bytes de datos en un nico conjunto
de datos. En la metodologa dedicada a investigar temas relacionados con
la gestin de informacin, definen en trminos de permutaciones tiles,
complejidad y dificultad para borrar registros individuales.
Se ha definido tambin como datos lo suficientemente masivos, como para
poner de relieve cuestiones y preocupaciones en torno a la efectividad del
anonimato desde una perspectiva ms prctica que terica.
Existen muchsimas herramientas para tratar con big data:
Datos estructurados: Datos que tienen bien definidos su longitud y su
formato, como las fechas, los nmeros o las cadenas de caracteres. Se
almacenan en tablas.
Datos no estructurados: Datos en el formato tal y como fueron recolectados,
carecen de un formato especfico. No se pueden almacenar dentro de una tabla
ya que no se puede desgranar su informacin a tipos bsicos de datos.
2- CLIENTE SERVIDOR
Es un modelo de aplicacin distribuida en el que las tareas se reparten entre
los proveedores de recursos o servicios. Un cliente realiza peticiones a otro
programa, el servidor, quien le da respuesta. Esta idea tambin se puede
aplicar a programas que se ejecutan sobre una sola computadora, aunque es
ms ventajosa en un sistema operativo multiusuario distribuido a travs de
una red de computadoras.
En esta arquitectura la capacidad de proceso est repartida entre los clientes y
los servidores, aunque son ms importantes las ventajas de tipo organizativo
debidas a la centralizacin de la gestin de la informacin y la separacin de
responsabilidades, lo que facilita y clarifica el diseo del sistema.
La separacin entre cliente y servidor es una separacin de tipo lgico, donde
el servidor no se ejecuta necesariamente sobre una sola mquina ni es
necesariamente un slo programa.