Documente Academic
Documente Profesional
Documente Cultură
Con el auge del Big Data se ha redefinido el concepto de dato como tal dndole ms
importancia a la parte del almacenamiento y de cierta manera se ha llevado al olvido por
el usuario promedio el tema del manejo de la informacin, ya que por lo general cuando
se habla de datos se hace alusin (aunque sea de manera discreta) al manejo de base de
datos siendo esta la forma ms conocida y a su vez desconocida dentro de la
manipulacin de la informacin.
DATA SCIENTIST
El aumento progresivo de la Big Data ha hecho que surja la necesidad de encontrar un
profesional que, con ayuda de nueva tecnologa de datos, organice todos estos datos. Es
por ello que ha surgido el nuevo cientfico de datos como puesto de trabajo. Aunque no
ligada exclusivamente a proyectos de datos grandes, el papel cientfico de datos hace
complementarlos debido a la mayor amplitud y profundidad de los datos que se examina,
en comparacin con los roles tradicionales.
Un cientfico de datos representa una evolucin de la funcin empresarial o analista de
datos. El entrenamiento formal es similar, con una base slida tpicamente en ciencias de
la computacin y las aplicaciones, de modelado, estadsticas, anlisis y matemticas. Lo
que diferencia el cientfico de datos aparte es fuerte visin para los negocios, junto con la
capacidad de comunicar los resultados a ambos lderes empresariales y de TI de una
manera que puede influir en cmo una organizacin se acerca a un reto empresarial.
Cientficos de datos buena voluntad no slo hacer frente a los problemas de negocio, van
a recoger los problemas de derecho que tienen el mayor valor a la organizacin.
El papel cientfico de datos ha sido descrito como "el analista, mitad artista." Anjul
Bhambhri, vicepresidente de productos de datos grandes en IBM, dice: "Un cientfico de
datos es alguien que es curioso, que puede mirar a los datos y detectar tendencias. Es
casi como un individuo renacentista que realmente quiere aprender y lograr un cambio en
una organizacin ".
Mientras que un analista de datos tradicional puede mirar slo a los datos de una sola
fuente - un sistema de CRM, por ejemplo - un cientfico de datos lo ms probable es
explorar y analizar datos de mltiples fuentes dispares. El cientfico de datos tamizar a
travs de todos los datos entrantes con el objetivo de descubrir una visin previamente
escondido, que a su vez puede proporcionar una ventaja competitiva o tratar un problema
de negocio urgente. Un cientfico de datos no se limita a recoger e informar sobre los
datos, sino que tambin lo mira desde muchos ngulos, determina lo que significa,
entonces recomienda maneras de aplicar los datos.
Los cientficos de datos son curiosos: explorar, hacer preguntas, hacer "lo que si" el
anlisis, cuestionando supuestos y procesos existentes. Armado con datos y resultados
analticos, un cientfico de datos de primer nivel ser luego comunicar conclusiones y
recomendaciones informadas a travs de la estructura de liderazgo de una organizacin.
Datos Munging: Muchas veces, los datos que est analizando va a ser complicado
y difcil de trabajar. Debido a esto, es muy importante saber cmo lidiar con las
imperfecciones de los datos. Algunos ejemplos de las imperfecciones de datos
incluyen valores perdidos, formateo de cadenas inconsistente (por ejemplo, 'Nueva
York' frente a 'new york' frente 'ny'), y el formato de fecha ("01/01/2014" vs. '01 /
01/2014 ' , unix tiempo frente a las marcas de tiempo, etc.). Esto ser ms
importante a las pequeas empresas en las que usted es un alquiler datos
temprano, o empresas controladas por datos en donde el producto no es de datos
relacionados (sobre todo porque este ltimo ha crecido rpidamente a menudo con
no mucha atencin a la limpieza de datos), pero esto habilidad que es importante
que cada uno tenga.
Pensando como C Datos Cientfico: Las empresas quieren ver que usted es un
solucionador de problemas (data-driven). Es decir, en algn momento de su
proceso de la entrevista, es probable que se pregunt sobre algn problema de
alto nivel - por ejemplo, acerca de una prueba de la empresa lo desea, puede
ejecutar o un producto basado en datos puede querer desarrollar. Es importante
pensar en qu cosas son importantes y qu cosas no lo son. Cmo se debe,
segn el cientfico de datos, interactuar con los ingenieros y gerentes de producto?
Qu mtodos se debe utilizar? Cuando hacen aproximaciones tienen sentido?
TECNOLOGIAS
En este mar de informacin digital, existen ciertos grupos de datos que son difciles de
capturar, almacenar, compartir, analizar o incluso visualizar, por su volumen, variedad y
velocidad. Aquellos que son difciles de gestionar se les llama Big Data y son todo un
desafo para las empresas.
Para facilitar su manejo, se han desarrollado una serie de tecnologas. Aqu te
presentamos algunas herramientas de cdigo abierto:
D3
Es una librera javascript que permite manejar documentos basados en datos y
visualizar la informacin de manera ms sencilla y atractiva. Puedes crear tablas o
grficos de barra, entre otras cosas, teniendo como objetivo que la exposicin a la
gran cantidad de datos no sea compleja.
Drill
Un gran volumen de datos acrecienta la demanda por una forma rpida de
analizarlos. Esta herramienta permite hacer un anlisis interactivo de conjuntos de
datos. Con ella podrs escanearlos y visualizarlos en pocos segundos. Drill es una
versin de cdigo abierto de lo que hace Dremel de Google, la que analiza
petabytes (un milln GB) de datos en pocos segundos.
SAP Hana
Es una plataforma que permite analizar la informacin y adems, crear procesos
de anlisis de los datos. Con SAP Hana se pueden reunir en una sola plataforma
las aplicaciones de racionalizacin, anlisis y planificacin de los datos de un
negocio. Esta herramientatrabaja con sistemas de almacenamiento de memoria
slida, como las tarjetas SSD que usan los celulares y las tablets que, a diferencia
de los discos duros convencionales, permiten almacenar mayor cantidad de datos
y analizarlos ms rpidamente.