Documente Academic
Documente Profesional
Documente Cultură
PROBABILIDAD
PROFESOR:
BOGOTÁ D,C
2019
PROYECTO DE AULA PELÍCULAS Y SERIES EN NETFLIX VS. IMDB
Después de haber realizado nuestra la limpieza y organización de datos se pudo realizar una
exploración a los datos, a pesar de ser una gran cantidad de datos se podían destacar unos
más que otros. Se analizaron y se revisaron los datos detenidamente.
Variable 2- Año
Esta variable nos indica el año de estreno de la película según netflix. Es una
varable cuantitativa de razón, con un histograma podemos identificar los
intervalos y la cantidad de películas que se determinaron en el transcurrir de los
años. Podemos evidenciar como a medida del aumento del tiempo, el número de
películas estrenadas también aumenta. Podemos identificar que las películas se
estrenaron desde 1895 hasta 2010. No hay datos acerca de 7 películas en
específico.
Variable 3- Título
Esta variable nos indica el nombre de la serie, película o mini serie, datos
suministrados por netflix. Es una variable cualitativa de escala nominal, en este
tipo de variables simplemente se pueden analizar, viendo cada uno de los títulos,
debido a que, cada una es totalmente e independiente y sin ninguna relación con
cualquier otra.
Variable 4- IMD ID
Esta variable nos indica el número de identificación de cada serie, película o mini
serie. Es una variable cualitativa de escala de razón, en este tipo de variable no se
puede realizar ningún tipo de gráfico o tabla teniendo en cuenta que los valores
no tienen ninguna relación o predominación unos sobre otros.
Variable 5 IMDB Title
Esta variable nos indica el nombre de la serie, película o mini serie, datos
suministrados por IMDB. Es una variable cualitativa de escala nominal, en este tipo
de variables simplemente se pueden analizar, viendo cada uno de los títulos,
debido a que, cada una es totalmente e independiente y sin ninguna relación con
cualquier otra.
Variable 6- IMDB Year
Esta variable nos indica el año de estreno de la película según IMDN. Es una
varable cuantitativa de razón, con un histograma podemos identificar los
intervalos y la cantidad de películas que se determinaron en el transcurrir de los
años. Podemos evidenciar como a medida del aumento del tiempo, el número de
películas estrenadas también aumenta. Se puede identificar que según IMD hay
películas desde 1895 hasta 2020 siendo el año más alto de estreno. También
podemos evidenciar la falta de datos de 223 datos.
Variable 7- Kind
Esta variable nos indica el tipo de obra es decir, se clasifican en: Película,
cortometraje, serie, mini serie, etc. Todos estos datos son suministrados por
IMDB. Esta variable es cualitativa nominal como se puede evidenciar más de la
mitad de los datos evaluados pertenecen a películas, también podemos destacar
que TV short es la categoría que menos porcentaje tiene.
Variable 8- Genres
Esta variable nos indica el género de la obra, es decir, si es: Familiar, animación,
drama, etc. Estos datos son suministrados por IMDB. Esta variable es cualitativa
nominal. Podemos identificar que un gran porcentaje de películas, series o mini
series tienen como género la comedia o el drama. En esta variable se tomó una
muestra ya que la población es bastante extensa.
Variable 9- Countries
Esta variable nos indica el país donde se produjo el título de la película, mini serie
o serie. Esta variable es cualitativa nominal. Podemos evidenciar que el país donde
se produjo el mayor número de nombres es en Estados Unidos, también podemos
identificar que países como Ukrania y Australia no generan tantos nombres.