Documente Academic
Documente Profesional
Documente Cultură
El Concepto de Datos.
Datos son los hechos que describen sucesos y entidades."Datos" es una
palabra en plural que se refiere a más de un hecho. A un hecho simple se le
denomina "data-ítem" o elemento de dato.
Los datos son comunicados por varios tipos de símbolos tales como las letras del
alfabeto, números, movimientos de labios,
puntos y rayas, señales con la mano, dibujos, etc. Estos símbolos se pueden
ordenar y reordenar de forma utilizable y se les denomina información.
Los datos son símbolos que describen condiciones, hechos, situaciones
o valores. Los datos se caracterizan por no contener ninguna información. Un
dato puede significar un número, una letra, un signo ortográfico o cualquier
símbolo que represente una cantidad, una medida, una palabra o
una descripción.
La importancia de los datos está en su capacidad de asociarse dentro de un
contexto para convertirse en información. Por si mismos los datos no tienen
capacidad de comunicar un significado y por tanto no pueden afectar
el comportamiento de quien los recibe. Para ser útiles, los datos deben
convertirse en información para ofrecer un significado, conocimiento, ideas o
conclusiones.
El Concepto de Información.
La información no es un dato conjunto cualquiera de ellos. Es más bien
una colección de hechos significativos y pertinentes, para el organismo u
organización que los percibe. La definición de información es la siguiente:
Información es un conjunto de datos significativos y pertinentes que describan
sucesos o entidades.
DATOS SIGNIFICATIVOS.
Para ser significativos, los datos deben constar de símbolos reconocibles, estar
completos y expresar una idea no ambigua.
Los símbolos de los datos son reconocibles cuando pueden ser correctamente
interpretados. Muchos tipos diferentes de símbolos comprensibles se usan para
transmitir datos.
La integridad significa que todos los datos requeridos para responder a una
pregunta específica están disponibles. Por ejemplo, un marcador de béisbol
debe incluir el tanteo de ambos equipos. Si se oye el tanteo "New York 6" y no
oyes el del oponente, el anuncio será incompleto y sin sentido.
Los datos son inequívocos cuando el contexto es claro. Por ejemplo, el grupo de
signos 2-x puede parecer "la cantidad 2 menos la cantidad desconocida llamada
x" para un estudiante de álgebra, pero puede significar "2 barra x" a un vaquero
que marca ganado. Tenemos que conocer el contexto de estos símbolos antes
de poder conocer su significado.
Validación de datos:
Consiste en asegurar la veracidad e integridad de los datos que ingresan a un
archivo. Existen numerosas técnicas de validación tales como: Digito
verificador, chequeo de tipo, chequeo de rango.
Concepto de Procesamiento Distribuido y Centralizado
Procesamiento Centralizado:
En la década de los años 50’s las computadoras eran máquinas del tamaño de
todo un cuarto con las siguientes características:
• Un CPU
• Pequeña cantidad de RAM
• Dispositivos DC almacenamiento secundario (cintas)
• Dispositivos d salida (perforadoras de tarjetas)
• Dispositivos de entrada (lectores de tarjeta perforada)
Con el paso del tiempo, las computadoras fueron reduciendo su tamaño y
creciendo en sofisticación,
• Aunque la industria continuaba siendo dominada por las computadoras
grandes "mainframes". A medida que la computación evolucionaba, las
computadoras, fueron capaces de manejar aplicaciones múltiples
simultáneamente, convirtiéndose en procesadores centrales "hosts" a los que se
les
Conectaban muchos periféricos y terminales tontas que consistían solamente
de dispositivos de entrada/salida (monitor y teclado) y quizá poco espacio de
almacenamiento, pero que no podían procesar por sí mismas. Las terminales
locales se conectaban con el procesador central a través de interfaces seriales
ordinarias de baja velocidad, mientras que las terminales remotas se enlazaban
con
• El "host" usando módems y líneas telefónicas conmutadas. En este ambiente,
se ofrecían velocidades de transmisión de 1200, 2400, o 9600 bps. Un
ambiente como el descrito es lo que se conoce como procesamiento centralizado
en su forma más pura "host/terminal". Aplicaciones características de este tipo
de ambiente son:
• Administración de grandes tuses de datos integradas
• Algoritmos científicos de alta velocidad
• Control de inventarios centralizado
Al continuar la evolución de los "mainframes", estos se comenzaron a conectar a
enlaces de alta velocidad donde algunas tareas relacionadas con las
comunicaciones se delegaban a otros dispositivos
llamados procesadores comunicaciones "Front End Procesos" (I7EP’s) y
controladores de grupo"Cluster Controllers" (CC’s).
Procesamiento Distribuido:
El procesamiento centralizado tenía varios inconvenientes, entre los que
podemos mencionar que un número limitado de personas controlaba el acceso a
la información y a los reportes, se requería un grupo muy caro de
desarrolladores de sistemas para crear las aplicaciones, y los costos de
mantenimiento y soporte eran extremadamente altos. La evolución natural de
la computación fue en el sentido del procesamiento distribuido, así las
minicomputadoras (a pesar de su nombre siguen siendo máquinas potentes)
empezaron a tomar parte del procesamiento que tenían los "mainframes".
Ventajas
Existen cuatro ventajas del procesamiento de bases de datos distribuidas. La
primera, puede dar como resultado un mejor rendimiento que el que se obtiene
por un procesamiento centralizado. Los datos pueden colocarse cerca del punto
de su utilización, de forma que el tiempo de comunicación sea mas corto. Varias
computadoras operando en forma simultánea pueden entregar más volumen de
procesamiento que una sola computadora.
Segundo, los datos duplicados aumentan su confiabilidad. Cuando falla una
computadora, se pueden obtener los datos extraídos de otras computadoras. Los
usuarios no dependen de la disponibilidad de una sola fuente para sus datos
.Una tercera ventaja, es que los sistemas distribuidospueden variar su tamaño
de un modo más sencillo. Se pueden agregar computadoras adicionales a
la red conforme aumentan el número de usuarios y su carga de procesamiento.
A menudo es más fácil y más barato agregar una nueva computadora más
pequeña que actualizar una computadora única y centralizada. Después, si la
carga de trabajo se reduce, el tamaño de la red también puede reducirse.
Por último, los sistemas distribuidos se pueden adecuar de una manera más
sencilla a las estructuras de la organización de los usuarios.
Estructura de Datos utilizados en el proceso electrónico de datos
Arreglos
Son una agrupación de datos homogéneos, es decir, con un mismo tipo de dato
básico asociado. Se almacenan en forma contigua en la memoria y son
referenciados con un nombre común y una posición relativa.
Ejemplos:
Arreglo Lineal (1 dimensión ó vector)
Vista gráfica
Definición de tipo
Type
Linea: Array [1..5] of TipoBasico;
Var
MiArreglo:Linea;
Suponiendo que los punteros que aparecen en la figura son capaces de apuntar a
un nodo y que Dato pertenece a cualquiera de los tipos básicos o estructurados,
la definición de tipo sería:
TYPE
Puntero=^NodoPila;
NodoPila=Record
Info:AlgunTipo;
sgte:Puntero;
End;
Var tope:Puntero;
Un concepto por introducir es el de encapsulamiento, que significa que una vez
definida la estructura e implementadas las operaciones básicas, uno se remite a
utilizarlas sin importar su codificación interna, es decir, las llamadas a
PUSH(pila, x) o POP(pila, y) empilarán a x o desempilarán en y sin importar
cómo lo hagan.
c.)Listas Enlazadas:
Corresponde a una estructura lineal compuesta por una colección de datos
homogéneos con alguna relación entre ellos. Dicha estructura se crea a través
del método dinámico de memoria.
En una lista enlazada el orden de los elementos está determinado por un campo
enlace (puntero) explícito en cada elemento, por ejemplo: pilas y filas
dinámicas.
La representación de lista enlazada es la más óptima debido a que cualquier
proceso de actualización (modificación inserción o eliminación) se realiza en
base a reasignación de punteros. En este capítulo trataremos sólo con las listas
enlazadas ya que las listas secuénciales ya son bien conocidas por ustedes.
Tipos de Listas Enlazadas
• Listas lineales simplemente enlazadas
• Listas Circulares
• Listas doblemente enlazadas
• Listas múltiplemente enlazadas
Árboles
Es una estructura de datos no lineal que posee raíz, ramas y hojas, técnicamente
constituye un grafo finito y sin ciclos. Un árbol define ciertos niveles jerárquicos
precedidos por la raíz (1er. nivel), en donde las hojas constituyen el nivel más
bajo.
Componentes
Raíz: Nodo que constituye la única entrada a la estructura (por ello es necesario
tener un puntero sobre él).
Ramas o Arcos: Conexión entre dos nodos del árbol que representa una relación
de jerarquía.
Hojas: Nodo sin hijos.
Características
Nivel o profundidad de un nodo: Longitud del camino para ir desde la raíz al
nodo. Por definición la raíz está en el nivel 0. Por ejemplo: profundidad(Y)=2,
profundidad(raíz)=0, profundidad(árbol)= profundidad(hoja más profunda).
Altura de un nodo: Longitud del camino más largo desde el nodo a una hoja. Por
ejemplo:
Altura(X)=1, Altura(Y)=0, Altura(arbol)=Altura(raíz)=profundidad(árbol)
Grado de nodo: Cantidad de hijos de un nodo cualquiera.
Grado de árbol: Cantidad máxima de hijos posibles de asociar a un nodo del
árbol
Clasificación
a.)Según Número de Hijos:
b.)Según Estructura de Niveles:
Arbol completo: Es un árbol binario en el cual cada nodo es una hoja o posee
exactamente 2 hijos.
Arbol lleno: Es un árbol binario con hojas en a lo más dos niveles adyacentes l-1
y l, en las cuales los nodos terminales se encuentran ubicados en las posiciones
de más a la izquierda del árbol.
Si un árbol binario es completo, necesariamente es lleno
c.)Según Funcionalidad:
Árbol binario de búsqueda (ABB)
Árbol binario de expresión
Archivos:
Es una es estructura de datos que reside en memoria secundaria o
almacenamiento permanente (cinta magnética, disco
magnético, disco óptico, disco láser, etc.). La forma de clasificación más básica
se realiza de acuerdo al formato en que residen estos archivos, de esta forma
hablamos de archivos ASCII (de texto) y archivos binarios. En este capítulo nos
centraremos en estos últimos.
Definición archivo binario:
Estructura de datos permanente compuesto por registros (filas) y éstos a su vez
por campos (columnas). Se caracteriza por tener un tipo de dato asociado, el
cual define su estructura interna.
Definición archivo texto:
Estructura de datos permanente no estructurado formado por una secuencia de
caracteres ASCII.
Tipos de Acceso a los Archivos
Secuencial:
Se accesan uno a uno los registros desde el primero hasta el último o
hasta aquel que cumpla con cierta condición de búsqueda. Se permite sobre
archivos de Organización secuencial y Secuencial Indexada.
Random:
Se accesan en primera instancia la tabla de índices de manera de recuperar
la dirección de inicio de bloque en donde se encuentra el registro buscado.
(dentro del rea primaria o de overflow). Se permite para archivos con
Organización Sec.Indexada.
Dinámico:
Se accesan en primera instancia la tabla de índices de manera de recuperar
la dirección de inicio de bloque en donde se
encuentra el registro buscado. (dentro del rea primaria o de overflow ). Se
permite para archivos con Organización Sec.Indexada.
Directo:
Es aquel que utiliza la función de Hashing para recuperar los registros. Sólo se
permite para archivos con Organización Relativa.
Constantes
Las constantes son similares a una variable pero tienen un valor determinado
que se mantiene igual en toda la ejecución del programa. El contenido de una
variable puede cambiar tantas veces sea necesario. ¿Porque usar una constante
si no puede cambiar de valor?. Hacemos esto cuando deseamos usar un mismo
número o una palabra (string) varias veces.
Variables
Magnitud que puede tomar diferentes valores y se representa con una letra o
letras. La variable real es el conjunto de los números reales, y se puede
representar por cualquier letra o conjunto de letras y nos sirve
para poder utilizar dicha letra para calculos o para obtener resultados.
Sistema de Información
Almacenamiento de información: El almacenamiento es una de las
actividades o capacidades más importantes que tiene una computadora, ya que
a través de esta propiedad el sistema puede recordar la información guardada
en la sección o proceso anterior. Esta información suele ser almacenada
en estructuras de información denominadas archivos. La unidad típica de
almacenamiento son los discos magnéticos o discos duros, los discos flexibles o
diskettes y los discos compactos (CD-ROM).
Procesamiento de Información: Es la capacidad del Sistema de
Información para efectuar cálculos de acuerdo con una secuencia
de operacionespreestablecida. Estos cálculos pueden efectuarse con datos
introducidos recientemente en el sistema o bien con datos que están
almacenados. Estacaracterística de los sistemas permite la transformación de
datos fuente en información que puede ser utilizada para la toma de decisiones,
lo que hace posible, entre otras cosas, que un tomador de decisiones genere una
proyección financiera a partir de los datos que contiene un estado de
resultados o un balance general de un año base.
Salida de Información: La salida es la capacidad de un Sistema de
Información para sacar la información procesada o bien datos de entrada al
exterior. Las unidades típicas de salida son las impresoras, terminales,
diskettes, cintas magnéticas, la voz, los graficadores y los plotters, entre otros.
Es importante aclarar que la salida de un Sistema de Información puede
constituir la entrada a otro Sistema de Información o módulo. En este caso,
también existe una inter fase automática de salida. Por ejemplo, el Sistema
de Control de Clientes tiene una interface automática de salida con el Sistema
de Contabilidad, ya que genera las pólizas contables de los movimientos
procesales de los clientes.
A continuación se muestran las diferentes actividades que puede realizar un
Sistema de Información de Control de Clientes:
Proceso:
• Cálculo de antigüedad de saldos.
• Cálculo de intereses moratorios.
• Cálculo del saldo de un cliente.
Almacenamiento:
• Movimientos del mes (pagos, depuraciones).
• Catálogo de clientes.
• Facturas.
Salidas:
• Reporte de pagos.
• Estados de cuenta.
• Pólizas contables (interfase automática)
• Consultas de saldos en pantalla de una terminal.
• Son fáciles de justificar ante la dirección general, ya que sus beneficios son
visibles y palpables.
• Estos sistemas pueden ser desarrollados directamente por el usuario final sin
la participación operativa de los analistas y programadores del área
de informática.
• Las aplicaciones que con frecuencia se implantan en esta etapa son el resto de
los Sistemas Transaccionales no desarrollados en la etapa de inicio, tales
como facturación, inventarios, control de pedidos de clientes
y proveedores, cheques, etc.
Dato.
Información.
DATOS E INFORMACIÓN,
El computador Z3, creado por Konrad Zuse, fue la primera máquina programable y
completamente automática, características usadas para definir a uncomputador. Estaba
construido con 2200 relés (electroimanes), pesaba 1000Kg, se demoraba haciendo una
adición 0,7 segundos y una multiplicación o división de 3 segundos. Tenía una
frecuencia de reloj de ~5 Hz, y una longitud de palabra de 22 bits. Los cálculos eran
realizados con aritmética encoma flotante puramente binaria. La máquina fue
completada en 1941 (el 12 de mayo de ese mismo año fue presentada a una audiencia de
científicos en Berlín). El Z3 original fue destruido en 1944 durante un bombardeo
aliado a Berlín. Una réplica completamente funcional fue construida durante losaños
60 por la compañía del creador Zuse KG y está en exposición permanente en
el Deutsches Museum. En 1998 se demostró que el Z3 es Turing completo.
DEFINICIÓN DE INFORMÁTICA
La informática
La informática ha
sido una de las
áreas del
conocimiento que
mayor desarrollo ha
adquirido en los
últimos tiempos.
Casi la totalidad de
las disciplinas
científicas requieren
de ella.
La vida moderna,
sin la informática,
es muy difícil de
imaginar.
Concepto de informática
Como definición de informática se suele aceptar "ciencia que estudia
el tratamiento automático de la información". El término procede del
francés "informatique" formado a su vez por la conjunción de las
palabras "information" y "automatique". No obstante en sudamérica,
se suele utilizar más la palabra "computación", más cercano a la
expresión anglosajona de "Computer Sciences" (CS) o ciencias de la
computación.
En todo sistema existen datos que solo tienen relación con el `host`
que los alberga, fuera de este, pierden toda utilidad (o por lo menos pierden
su utilidad oficial :-), un ejemplo de este tipo de datos son los descriptores de
dispositivos o los `lock files` que crean algunos programas en ejecución.
Roles.
otros roles que no están directamente relacionados con la información pero que
interactúan directamente con las personas mencionadas son:
• System Administrator (SA): quien se encarga de toda la
infraestructura de servidores, discos, firewalls, etc.
• Programmers/Developers: el dolor de cabeza de los DBAs.
• Managers: a quien rendirle cuentas.
• Customers/End users: gente sin ningún conocimiento técnico.
• DBA vs DA
• DBA vs DA vs SA
• Técnicas:
o Conocimiento de bases de datos
o Conocimiento de desarrollo de aplicaciones
o Conocimiento de administración de sistemas/servidores
• Comerciales:
o Entender procesos de una organización
o Seguir tendencias de la industria
Sociales
o Comunicación
o Administración
o Resolución de problemas
o Educación continua
Modelado de Datos
Definición
Metas y beneficios
Basicamente son 3:
Figura 2.1 Notación E/R (1) Ross, (2) Bachmann, (3) Martin, (4) Chen, (5)
Rumbaugh
También debido al aumento de popularidad y uso de UML también se puede
emplear dicha notación (figura 2.3).
Notación UML
Componentes simbólicos
Cardinalidad
Componentes simbólicos
Guías de nombramiento
Relaciones de Cardinalidad
(Muchos a
Muchos)
(Uno a Muchos)
(Uno a Uno)
Relaciones Modelo E/R
Modelo E-R
Generalización
Generalización
Las tablas 2.1 y 2.3 muestran las reglas que se deben seguir para poder crear
dicho esquema.
Normalización
Una vez creadas las tablas hay que verificar si aún se puede reducir u optimizar
de alguna manera.
Dependencias funcionales
Ejemplo:
ID ---> Nombre
ID --> Puesto --> Sueldo
El ejemplo clásico:
En 1a. NF
Si tenemos la tabla:
calificaciones_cursos
NO se encuentra en 2a NF
Normalizando quedaría
Curso
depto clave_curso descripción
estud_curso