Documente Academic
Documente Profesional
Documente Cultură
Aceleración
Python Basics Digital
>>> a = 'is'
Las variables son usadas para guardar valores. Un string es una serie de caracteres >>> b = 'nice' Los diccionarios almacenan conexiones entre piezas de información. Cada elemento
conformado por comillas simples ( ‘’ ) o dobles (“”). >>> my_list = ['my', 'list', a, b] es un par llave - valor
>>> my_list2 = [[4,5,6,7], [3,4,5,6]]
Crear Lista >>> bikes = ['trek', 'redline', Un simple Diccionario >>> alien = {'color': 'green',
Hello world >>> print(“Hello world!”) 'giant'] 'points': 5}
Recorriendo todos los pares llave- >>> fav_numbers = {'eric': 17, 'ever':
Agregar ítems a la lista >>> bike = [] 4}
Concatenación (unión de strings) >>> first_name = 'albert' valor
>>> bikes.append (‘trek’) >>> for name, number in
>>> last_name = 'einstein'
>>> bikes.append(‘redline’) >>> fav_numbers.items():
>>> full_name = first_name + ' ' +
>>> bikes.append(‘giant’) >>> print(name + ' loves ' +
last_name
str(number))
>>> print(full_name)
Hacer listas númericas >>> squares = []
>>> fav_numbers = {'eric': 17,
>>> for x in range (1,11): Recorriendo todos los pares llave
'ever': 4}
square.append(x**2)
>>> for name in fav_numbers.keys():
>>> print(name + ' loves a
number')
>>> fav_numbers = {'eric': 17, 'ever':
Pidiendo Ayuda Seleccionando elementos de la Lista
Recorriendo todos los valores
4}
>>> for number in
fav_numbers.values():
Subset >>> print(str(number) + ' is a
>>> help(str)
Seleccionar item en index 1 >>> my_list[1] favorite')
Slice
Seleccionar items de index 1 y 2 >>> my_list[1:3]
Variables y Tipos de Data If Statements
Seleccionar items después de index 0 >>> my_list[1:]
Copiar my_list >>> my_list[:] Los If statements son usados para comprobar condiciones particulares y
>>> x=5 que respondan apropiadamente.
>>> x Subset Lists of Lists
5 my_list[list][itemOfList] >>> my_list2[1][0]
>>> my_list2[1][:2]
División de una variable >>> x/float(2) Obtener el index de un ítem >>> my_list.index(a) If- elif- else statements >>> if age >= 4:
2.5 ticket_price = 0
Contar un ítem >>> my_list.count(a)
>>> elif age < 18:
Añadir un ítem a la vez >>> my_list.append('!') ticket_price = 10
Tipos de variables y conversión >>> else:
Quitar un ítem >>> my_list.remove('!') ticket_price = 15
Variables a strings str () '5', '3.45', 'True' Quitar un ítem >>> del(my_list[0:1])
Variables a floats float () 5.0, 1.0 Quitar un ítem >>> my_list.pop(-1) Librerías
Insertar un ítem en cierta posición >>> my_list.insert(0,'!')
Variable a booleanos bool () True, True, True
Ordenar la lista >>> my_list.sort() Importar librerías
>>> import numpy
>>> import numpy as np
Importación Selectiva
>>> from math import pi
Strings
Operaciones de String
>>> my_string = 'thisStringIsAwesome'
>>> my_string >>> my_string[3]
'thisStringIsAwesome' >>> my_string[4:9]
Métodos de String
Operaciones de String
>>> my_string.count('w')
>>> my_string + 'Innit'
'thisStringIsAwesomeInnit'
Contar los elementos del string
Descubre más en www.option.cl
Cambiar los elementos del string >>> my_string.replace('e', 'i')
>>> 'm' in my_string
True Eliminar espacios en blanco >>> my_string.strip()
Python For Data Science Cheat Sheet Líderes en
Aceleración
NumPy Basics Digital
División >>> a / b
Dimensiones del arreglo >>> a.shape
array([[ 0.66666667, 1. , 1. ],
Creating Arrays
Creando Arreglos [ 0.25 , 0.4 , 0.5 ]]) Longitud del arreglo >>> len(a)
División >>> np.divide(a,b) Dimensiones del arreglo >>> b.ndim
Multiplicación >>> a * b
Número de elementos del arreglo >>> e.size
>>> a = np.array([1,2,3]) array([[ 1.5, 4. , 9. ],
>>> b = np.array([(1.5,2,3), (4,5,6)], dtype = float) [ 4. , 10. , 18. ]])) Data type de los elementos del >>> b.dtype
>>> c = np.array([[(1.5,2,3), (4,5,6)], [(3,2,1), (4,5,6)]], arreglo
Multiplicación >>> np.multiply(a,b)
dtype = float)
Exponencial Nombre del tipo de data >>> b.dtype.name
>>> np.exp(b)
Raíz Cuadrada >>> np.sqrt(b) Convertir un arreglo a un tipo >>> b.astype(int)
diferente
Placeholders Iniciales Seno de cada elemento del arreglo >>> np.sin(a)
Coseno de cada elemento del arreglo >>> np.cos(b)
Crear un arreglo de ceros >>> np.zeros((3,4))
Logaritmo natural de cada elemento >>> np.log(a)
del arreglo
Crear un arreglo de unos >>> np.ones((2,3,4),dtype=np.int16) >>> e.dot(f)
>>> b[0:2,1]
1.5 2 3 Apilar arreglos horizontalmente >>> np.hstack((e,f))
Seleccionar ítems en la fila 0 y 1 en
array([ 2., 5.]) 4 5 6 (por columnas) array([[ 7., 7., 1., 0.],
columna 1
[ 7., 7., 0., 1.]])
Seleccionar todos los items en la >>> b[:1]
fila 0(equivalente a b[0:1, :]) array([[1.5, 2., 3.]])
1.5 2 3 Copiando Arreglos Crear arreglos apilados por columnas >>> np.column_stack((a,d))
4 5 6 array([[ 1, 10],
Igual a [1, :, :] >>> c[1,...] [ 2, 15],
array([[[ 3., 2., 1.], Crear una vista del arreglo con la [ 3, 20]])
>>> h = a.view()
[ 4., 5., 6.]]]) misma data Crear arreglos aplilados por columnas >>> np.c_[a,d]
Invertir arreglo >>> a[ : :-1] Crear una copia del arreglo >>> np.copy(a) Dividir arreglos
array([3, 2, 1])
Crear una copia profunda del arreglo >>> h = a.copy() Dividir el arreglo horizontalmente en >>> np.hsplit(a,3)
Boolean Indexing el 3er índice [array([1]),array([2]),array([3])]
Seleccionar elementos de a menor >>> a[a<2] 1 2 3 Dividir el arreglo verticalmente en el >>> np.vsplit(c,2)
a2 array([1]) 2do índice [array([[[ 1.5, 2. , 1. ],
[ 4. , 5. , 6. ]]]),
Fancy Indexing
Ordenando Arreglos array([[[ 3., 2., 3.],
[ 4., 5., 6.]]])]
Seleccionar elementos (1,0),(0,1),(1,2) >>> b[[1, 0, 1, 0],[0, 1, 2, 0]]
y (0,0) array([ 4. , 2. , 6. , 1.5])
Seleccionar un subconjunto de filas >>> b[[1, 0, 1, 0]][:,[0,1,2,0]] Ordenar un arreglo >>> a.sort()
y columnas de la matriz array([[ 4. ,5. , 6. , 4. ],
[ 1.5, 2. , 3. , 1.5], Ordenar elementos según un eje >>> c.sort(axis=0)
del arreglo
[ 4. , 5. , 6. , 4. ], Descubre más en www.option.cl
[ 1.5, 2. , 3. , 1.5]])
Python For Data Science Cheat Sheet Líderes en
Aceleración
Matplotlib Digital
Leyendas
Establecer un título y etiquetas para >>> ax.set(title='An Example Axes',
Estilo de Línea ejes x e y
ylabel='Y-Axis', xlabel='X-Axis')
Establecer leyendas para
>>> ax.legend(loc='best')
ejes x e y
2) Crear Plot >>> plt.plot(x,y,linewidth=4.0)
>>> plt.plot(x,y,ls='solid') Ticks
>>> plt.plot(x,y,ls='--') Establecer manualmente x-ticks >>> ax.xaxis.set(ticks=range(1,5),
>>> plt.plot(x,y,'--',x**2,y**2,'-.') ticklabels=[3,100,-12,"foo"])
>>> import matplotlib.pyplot as plt >>> plt.setp(lines,color='r',linewidth=4.0) Alargar y-ticks, que estén dentro y >>> ax.tick_params(axis='y',
fuera del eje direction='inout', length=10)
Plot rectángulos verticales (ancho >>> axes[0,0].bar([1,2,3],[3,4,5]) Graficar un campo 2D de flechas >>> axes[0,1].streamplot(X,Y,U,V) 6) Mostrar Plot
constante)
Seaborn es una librería para Python que esta basada en matplotlib y Cuadrillas de Ejes Plot Categórico
proporciona una interfaz de alto nivel para dibujar atractivos gráficos
estadísticos.
Cuadrilla de Subplot para trazar >>> g = sns.FacetGrid(titanic, Scatterplot
relaciones condicionales col="survived", Scatterplot con una variable >>> sns.stripplot(x="species",
Utiliza la siguiente convención de importación:
row="sex") categórica y="petal_length", data=iris)
>>> import matplotlib.pyplot as plt >>> g = g.map(plt.hist,"age")
Scatterplot categórico con puntos >>> sns.swarmplot(x="species",
>>> import seaborn as sns Dibujar un plot categórico en un >>> sns.factorplot(x="pclass", y="petal_length", data=iris)
Facetgrid no superpuestos
y="survived”,
Los pasos básicos para crear gráficos con Seaborn son: hue="sex",
data=titanic) Mostrar estimaciones de puntos e Bar Chart
1. Preparar la data Creating Arrays intervalos de confianza con glifos >>> sns.barplot(x="sex", y="survived",
2. Controlar la estética de las figuras >>> sns.lmplot(x="sepal_width", de dispersión hue="class", data=titanic)
Graficar data y ajuste de modelo de
3. Plot con Seaborn regresión usando un FacetGrid y="sepal_length",
4. Personalizar tu plot hue="species", Count Plot
data=iris) Mostrar recuento de observaciones >>> sns.countplot(x="deck",
data=titanic,palette="Greens_d")
Grilla de subplot para graficar >>> h = sns.PairGrid(iris)
>>> import matplotlib.pyplot as plt relaciones por pares >>> h = h.map(plt.scatter) Boxplot
>>> import seaborn as sns Mostrar estimaciones de puntos e >>> sns.boxplot(x="alive",
>>> tips = sns.load_dataset("tips") Paso 1 intervalos de confianza como y="age",
Plot para pares de distribuciones >>> sns.pairplot(iris)
>>> sns.set_style("whitegrid") Paso 2 bivariadas barras rectangulares hue="adult_male",
>>> g = sns.lmplot(x="tip", data=titanic)
y="total_bill", Paso 3 Grilla para gráfico bivariado con >>> i = sns.JointGrid(x="x", y="y",
distribuciones marginales data=data)
data=tips, univariadas >>> i = i.plot(sns.regplot, Diagrama de caja con datos de
aspect=2) formato ancho >>> sns.boxplot(data=iris,orient="h")
sns.distplot)
>>> g = (g.set_axis_labels("Tip","Total bill(USD)").
set(xlim=(0,10),ylim=(0,100))) Gráfico de distribución bivariada >>> sns.jointplot("sepal_length",
"sepal_width", Violin Plot >>> sns.violinplot(x="age",
Paso 4
>>> plt.title("title") data=iris, y="sex",hue="survived",
>>> plt.show(g) kind='kde') data=titanic)
1) Preparar la data Datos de plot y ajuste de modelo >>> sns.regplot(x="sepal_width", Gráfico de distribución univariada >>> plot = sns.distplot(data.y,
de regresión lineal y="sepal_length", data=iris, kde=False,
ax=ax) color="b")
>>> titanic = sns.load_dataset("titanic") Quitar columna izquierda >>> g.despine(left=True) Añadir título al plot >>> plt.title("A Title")
>>> iris = sns.load_dataset("iris")
Establecer las etiquetas del eje y >>> g.set_ylabels("Survived") Ajustar la etiqueta del eje y >>> plt.ylabel("Survived")
Establecer las etiquetas de tick
para x >>> g.set_xticklabels(rotation=45) Ajustar la etiqueta del eje x >>> plt.xlabel("Sex")
Establecer las etiquetas de eje >>> g.set_axis_labels("Survived", Ajustar los límites del eje y >>> plt.ylim(0,100)
"Sex")
2) Estética de la Figura Establecer el límite y ticks de los
Ajustar los límites del eje x >>> plt.xlim(0,10)
Creating Arrays
ejes x e y >>> h.set(xlim=(0,5),
Ajustar una propiedad del plot >>> plt.setp(ax,yticks=[0,5])
ylim=(0,5),
Crear una figura y un subplot
xticks=[0,2.5,5],
Ajustar parámetros de subplot >>> plt.tight_layout()
yticks=[0,2.5,5])
>>> f, ax = plt.subplots(figsize=(5,6))
Estilos de Seaborn
5) Mostrar o Guardar Plot Cerrar y Limpiar
(Re) iniciar seaborn por defecto >>> sns.set()
Limpiar un eje >>> plt.cla() Clear an axis
Establecer los parámetros de >>>sns.set_style("whitegrid")
Creating Arrays
matplotlib Mostrar el plot >>> plt.show() Creating Arrays
Limpiar la figura completa >>> plt.clf() Clear the entire figure
>>> sns.set_style("ticks", Set the Guarda el plot como una figura >>> plt.savefig("foo.png") Cerrar ventana
Establecer los parámetros de >>> plt.close()
matplotlib matplotlib parameters Guarda una figura transparente >>> plt.savefig("foo.png"
{"xtick.major.size":8, transparent=True)
Devuelve un dictado de parámetros "ytick.major.size":8})
o utiliza with para establecer
temporalmente el estilo >>> sns.axes_style("whitegrid")
Paletas de colores
>>> s + s3
>>> data = {'Country': ['Belgium', 'India', 'Brazil'], Usar filtro para ajustar DataFrame >>> df[df['Population']>1200000000] a 10.0
'Capital': ['Brussels', 'New Delhi', 'Brasília'], b NaN
'Population': [11190846, 1303171035, 207847528]} Configuración c 5.0
>>> df = pd.DataFrame(data, Configurar index a de la Series s a 6 >>> s['a'] = 6 d 7.0
columns=['Country', 'Capital', 'Population'])
>>> f = lambda x: x*2 Eliminar valores de las filas (ejes=0) >>> s.drop(['a', 'c'])
Aplicar la función >>> df.apply(f)
Eliminar valores de la
Aplicar la función a cada elemento >>> df.applymap(f) >>> df.drop('Country', axis=1)
columna(eje=1)