Tarea 1 (Base de Datos)

20
Antecedentes Los orígenes de las bases de datos se remontan a la Antigüedad donde ya existían bibliotecas y toda clase de registros. Además también se utilizaban para recoger información sobre las cosechas y censos. Sin embargo, su búsqueda era lenta y poco eficaz y no se contaba con la ayuda de máquinas que pudiesen reemplazar el trabajo manual. Posteriormente, el uso de las bases de datos se desarrolló a partir de las necesidades de almacenar grandes cantidades de información o datos. En 1884 Herman Hollerith creó la máquina automática de tarjetas perforadas, siendo nombrado así el primer ingeniero estadístico de la historia. En esta época, los censos se realizaban de forma manual llegando a tardar hasta 10 años en procesar toda la información. Ante esta situación, Hollerith comenzó a trabajar en el diseño de una maquina censadora basada en tarjetas perforadas. 121051 Jorge Emmanuel Cortés Rodríguez

description

Definiciones de bases de datos

Transcript of Tarea 1 (Base de Datos)

AntecedentesLos orgenes de las bases de datos se remontan a la Antigedad donde ya existan bibliotecas y toda clase de registros. Adems tambin se utilizaban para recoger informacin sobre las cosechas y censos. Sin embargo, su bsqueda era lenta y poco eficaz y no se contaba con la ayuda de mquinas que pudiesen reemplazar el trabajo manual.Posteriormente, el uso de las bases de datos se desarroll a partir de las necesidades de almacenar grandes cantidades de informacin o datos.En 1884 Herman Hollerith cre la mquina automtica de tarjetas perforadas, siendo nombrado as el primer ingeniero estadstico de la historia. En esta poca, los censos se realizaban de forma manual llegando a tardar hasta 10 aos en procesar toda la informacin.Ante esta situacin, Hollerith comenz a trabajar en el diseo de una maquina censadora basada en tarjetas perforadas.

Posteriormente, en la dcada de los cincuenta se da origen a las cintas magnticas, para automatizar la informacin y hacer respaldos.

En 1960 se dio inicio a las primeras generaciones de bases de datos de red y las bases de datos jerrquicas, ya que era posible guardar estructuras de datos en listas y rboles.Otro de los principales logros de esta poca fue la alianza de IBM y American Airlines para desarrollar SABRE, un sistema operativo que manejaba las reservas de vuelos, transacciones e informaciones sobre los pasajeros de la compaa American Airlines.Y, posteriormente, en esta misma dcada, se llev a cabo el desarrollo del IDS (Integrated Data Store) desarrollado por Charles Bachman supuso la creacin de un nuevo tipo de sistema de bases de datos conocido como modelo en red que permiti la creacin de un standard en los sistemas de bases de datos gracias a la creacin de nuevos lenguajes de sistemas de informacin.En los 70s Edgar Frank Codd, cientfico informtico ingles conocido por sus aportaciones a la teora de bases de datos relacionales, defini el modelo relacional a la par que public una serie de reglas para los sistemas de datos relacionales a travs de su artculo Un modelo relacional de datos para grandes bancos de datos compartidosEste hecho dio paso al nacimiento de la segunda generacin de los Sistemas Gestores de Bases de Datos; Lawrence J. Ellison, a partir del trabajo de Edgar F. Codd, desarroll el Relational Software System, lo que actualmente se conoce como Oracle Corporation, desarrollando as un sistema de gestin de bases de datos relacional.

Posteriormente se desarrollara SQL (Structured Query Language), un lenguaje de consultas de bases de datos relacionales que permite efectuar consultas con el fin de recuperar informacin y hacer cambios sobre la base de datos de forma sencilla, adems de analizar grandes cantidades de informacin.En la dcada de 1990 la investigacin en bases de datos gir en torno a las bases de datos orientadas a objetos. Las cuales han tenido bastante xito a la hora de gestionar datos complejos en los campos donde las bases de datos relacionales no han podido desarrollarse de forma eficiente. As se cre la tercera generacin de sistemas gestores de bases de datos.

DatoWikipedia lo define como Una representacin simblica (numrica, alfabtica, etc.) de un atributo o variable cuantitativa o cualitativa. Parafraseando un dato no tiene sentido en s mismo, pero al ser procesado puede servir para realizar clculos o tomar decisiones.

InformacinEs un conjunto organizado de datos significativos previamente procesados que tiene significado para quien la recibe.Los datos no se pueden considerar informacin ya que si no es procesada correctamente es basura.

CampoUn campo es la mnima unidad de informacin a la que se puede acceder. En las hojas de clculo (Excel) los campos son llamados celdas.La mayora de los campos tienen atributos asociados a ellos. Por ejemplo, algunos campos son numricos mientras otros almacenan texto, tambin vara el tamao de estos. Adicionalmente, cada campo tiene un nombre, hay un tipo de campo que es el genrico o tambin llamado llave

RegistroUn registro es un conjunto de campos que contienen los datos que pertenecen a una misma coleccin de objetos.Una fila en una tabla de una bases de datos.

ArchivoSon un conjunto de informacin sobre un mismo contenido, almacenado y organizado de forma estructurada para la consulta de un dato en particular.Un archivo est conformado por un conjunto de registros relacionados.

Base de datos Sin embargo una simple coleccin de ficheros (archivos) no organiza adecuadamente la totalidad de la informacin que se pretende gestionar ya que existes relaciones entre los distintos datos presentes en varios ficheros, que adems deben estar disponibles para distintas aplicaciones.Por ello a toda coleccin de ficheros alas que pueda accederse por un mltiples programas y que contienen todos ellos datos relacionados entre s se denomina base de datos.

DBMS o SGBDSon un tipo de software muy especfico, dedicado a servir de interfaz entre la base de datos, el usuario y las aplicaciones que la utilizan. Controla la organizacin, almacenamiento, recuperacin, seguridad e integridad de los datos en una base de datosDe una manera simple es un contenedor que permite almacenar la informacin de forma ordenada con diferentes propsitos y usos. Por ejemplo, en una base de datos se puede almacenar informacin de diferentes departamentos (Ventas, Recursos Humanos, Inventarios, entre otros). El almacenamiento de la informacin por s sola no tiene un valor, pero si combinamos o relacionamos la informacin con diferentes departamentos nos puede dar valor. Por ejemplo, combinar la informacin de las ventas del mes de enero del 2015 para un producto X y nos d una muestra del comportamiento de las ventas en un periodo de tiempo

Ejemplos de DBMS1. ORACLEOracle es bsicamente una herramienta cliente/servidor para la gestin de Bases de Datos. Es un producto vendido a nivel mundial, aunque la gran potencia que tiene y su elevado precio hacen que slo se vea en empresas muy grandes y multinacionales. En el desarrollo de pginas web pasa lo mismo: como es un sistema muy caro no est tan extendido como otras bases de datos, por ejemplo, Access, MySQL, SQL Server, etc. Oracle se basa en la tecnologa cliente/servidor, pues bien, para su utilizacin primero sera necesario la instalacin de la herramienta servidor (Oracle 8i) y posteriormente podramos atacar a la base de datos desde otros equipos con herramientas de desarrollo como Oracle Designer y Oracle Developer, que son las herramientas bsicas de programacin sobre Oracle. Para desarrollar en Oracle utilizamos PL/SQL un lenguaje de 5 generacin, bastante potente para tratar y gestionar la base de datos, tambin por norma general se suele utilizar SQL al crear un formulario. Se considera a Oracle como uno de los sistemas de bases de datos ms completos, destacando su: Soporte de transacciones. Estabilidad. Escalabilidad. Es multiplataforma

2. SQL ServerMicrosoft SQL Server en s es un buen producto, probablemente de los mejor acabados por Microsoft. Su instalacin es sencillsima, su interfaz es clara e intuitiva y viene acompaado de una suite de utilidades bastante completa. Si bien la interfaz de usuario es muy buena y sobre el papel tiene muchas funcionalidades, sin embargo Microsoft SQL Server adolece tambin de serios problemas. Las pruebas de rendimiento nunca son definitivas, es el producto de los tres evaluados con peor rendimiento en general, segn la experiencia comn de los administradores. Otro aspecto que no favorece a Microsoft SQL Server es la estabilidad. Sus tablas tienden a corromperse fcilmente, permitiendo la duplicacin de claves nicas y desastres de ese tipo. 3. MySQLMySQL es una empresa sueca que lleva desde 1995 desarrollando el SGBD homnimo. El servidor de bases de datos MySQL es de cdigo abierto. Se distribuye en dos versiones, una comercial, de pago y que incluye soporte, y otra gratuita, basada en el soporte de la comunidad. Hay que decir que este soporte comunitario es extenssimo. Este producto parece orientado a las necesidades de una organizacin media. Durante mucho tiempo, un argumento muy escrito en los foros que tratan el tema

Objetivos y Caractersticas de una base de datos1. Independencia lgica y fsica de los datos.Se refiere a la capacidad de modificar una definicin de esquema en un nivel de la arquitectura sin que esta modificacin afecte al nivel inmediatamente superior.El conjunto de datos contenidos en la base debe ser nica y estar integrada por los mismos datos.2. Redundancia mnima.Debe ser controlada, de forma que no exista duplicidad innecesarias, y que las redundancias fsicas, convenientes muchas veces a fin de responder a objetivos de eficiencia, sean tratadas por el mismo sistema, de modo que no puedan producirse inconsistencias.Se trata de usar la base de datos como repositorio comn de datos para distintas aplicaciones.Un dato se actualizar lgicamente por el usuario en forma nica, y el sistema se preocupar de cambiar fsicamente todos aquellos campos en los que el dato estuviese repetido en caso de existir redundancia fsica (redundancia controlada).3. Acceso concurrente por parte de mltiples usuariosLas bases de datos pretenden servir al conjunto de la organizacin, manejando los datos como otro recurso. Por lo tanto, las bases de datos han de atender a mltiples usuarios y a diferentes aplicaciones. En contraposicin a los sistemas de ficheros, en donde cada fichero atiende a determinada aplicacin.4. Distribucin espacial de los datos.Los datos pueden encontrarse en otra habitacin, otro edificio e incluso otro pas, el usuario no tiene por qu preocuparse de la localizacin espacial de los datos a los que accede.5. Integridad de los datos.Se refiere a las medidas de seguridad que impiden que se introduzcan datos errneos.Esto puede suceder tanto por motivos fsicos (defectos de hardware, actualizacin incompleta debido a causas externas), como de operacin (introduccin de datos incoherentes).6. Consultas complejas optimizadas.Permite la rpida y ejecucin de las mismas.7. Seguridad de acceso y auditora.Se refiere al derecho de acceso a los datos contenidos en la base por parte de personas y organismos.El sistema de auditora mantiene el control de acceso a la base, con el objeto de saber qu o quin realiz una determinada modificacin y en qu momento. Por ejemplo un profesor quiere cambiar una calificacin por alguna omisin, el sistema de la base le permitir hacer el cambio pero quedara el registro del da y el motivo del cambio, esto lo checan los jefes de academia y observan si el profesor le ayuda al alumno o realizan su trabajo adecuadamente.8. Respaldo y recuperacin.Se refiere a la capacidad de un sistema de base de datos de recuperar su estado en un momento previo a la prdida de datos.9. Acceso a travs de lenguajes de programacin estndar.Se refiere a la posibilidad ya mencionada de acceder a los datos de una base mediante lenguajes de programacin ajenos al sistema de base de datos. En pocas palabras son los programas o software con los que se mandaran llamar y disear los datos que aparecern en la pantalla.10. Beneficio econmico Se refiere a las ganancias o ahorros que una base de datos puede generar.Mediante estadsticas de venta de un producto en especfico en cierta temporada o incremento de clientes/ganancias gracias a la eficiencia que brinda una base de datos.

Bases de datos aplicadas en la actualidad

EmpresaDBMS

GoogleAunque se desconoce el verdadero tamao de su base de datos, s se puede estimar. La compaa recibe unos 91 millones de consultas al da, consultas que son almacenadas por la compaa. Se supone que almacena cientos de terabytes de informacin.

BigtableEs un sistema de almacenamiento distribuido (construido por Google) para la gestin de datos estructurados que est diseado para escalar a un tamao muy grande: petabytes de datos a travs de miles de servidores bsicos.BigTable no es una base de datos relacional

CFEOracle

Banco de MexicoOracle

AmazonSe la considera la tienda online ms grande del mundo, tanto en nmero de clientes como en los datos que almacena sobre ellos. Cuenta con 59 millones de clientes y ms de 42 terabytes de datos.

Dynamo (NoSQL)Amazon utiliza NoSQL para muchas cosas, como el carro de compras, lista de deseos, lista de best sellers, etc.

RDBMS de OraclePara llevar a cabo la transaccin financiera

Esquema de base de datosEs la estructura por la que est formada la base de datos, es decir la creacin del diseo original de la base de datos. Esto se logra escribiendo una serie de definiciones que el compilador de DDL traduce a un conjunto de tablas que se almacenan permanentemente en el diccionario de datos.Un esquema define las tablas, los campos en cada tabla y las relaciones entre cada campo y cada tabla.

DBA y sus funcionesUn DBA (Database Administrator) es el tcnico responsable de la informacin para garantizar la funcionalidad actual del funcionamiento y la eficiencia de las bases de datos de una organizacin y las aplicaciones que acceden a las bases de datos. El diseo de bases de datos Monitoreo y optimizacin del desempeo La disponibilidad de las bases de datos Seguridad Backup y recuperacin Integridad de datos La liberacin de migracin

Abstraccin de la informacinSimplificacin de la realidad en la que ciertas propiedades y caractersticas de los objetos reales se ignoran por que no interesan para el problema a resolver.Es decir, determinar lo que es importante y lo que no lo es.

Abstraccin de las bases de datosLos sistemas de base de datos muchas veces son utilizados por personas que no cuenta con conocimientos de computacin, esta complejidad debe estar escondida para los usuarios. Para ocultarla, se definen varios niveles de abstraccin en los que puede observarse la base de datos. Nivel Fsico. Es la representacin del nivel ms bajo de abstraccin, en ste se describe en detalle la forma en como de almacenan los datos en los dispositivos de almacenamiento (por ejemplo, mediante sealadores o ndices para el acceso aleatorio a los datos).

Nivel conceptual.El siguiente nivel ms alto de abstraccin, describe que datos son almacenados realmente en la base de datos y las relaciones que existen entre los mismos, describe la base de datos completa en trminos de su estructura de diseo. El nivel conceptual de abstraccin lo usan los administradores de bases de datos, quienes deben decidir qu informacin se va a guardar en la base de datos. Tiene las siguientes definiciones:

1. Definicin de los datos: Se describen el tipo de datos y la longitud de campo todos los elementos direccionales en la base. Los elementos por definir incluyen artculos elementales (atributos), totales de datos y registros conceptuales (entidades).

2. Relaciones entre datos: Se definen las relaciones entre datos para enlazar tipos de registros relacionados para el procesamiento de archivos mltiples.

En el nivel conceptual la base de datos aparece como una coleccin de registros lgicos, sin descriptores de almacenamiento. En realidad los archivos conceptuales no existen fsicamente. La transformacin de registros conceptuales a registros fsicos para el almacenamiento se lleva a cabo por el sistema y es transparente al usuario.

Nivel de visin.Nivel ms alto de abstraccin, es lo que el usuario final puede visualizar del sistema terminado, describe slo una parte de la base de datos al usuario acreditado para verla. El sistema puede proporcionar muchas visiones para la misma base de datos.

Modelos de DatosUn modelo de base de datos es un conjunto de conceptos que pueden servir para describir los tipos de datos, las relaciones y restricciones que deben cumplirse para esos datos.Es decir, el propsito de un modelo de datos es por una parte representar los datos y por otra ser comprensible.Categora de los modelos de datos: Conceptuales. Lgicos. Fsicos.ConceptualesLos conceptuales disponen de conceptos muy cercanos a la forma en que la mayora de los usuarios percibe los datos Un ejemplo conocido de modelo conceptual es el Modelo Entidad Relacin

LgicosLos Lgicos, cuyos conceptos pueden ser entendidos por los usuarios finales sin estar demasiado alejados de la forma en que los datos se organizan dentro de la computadora.Los modelos lgicos, entre los que se encuentra el modelo relacional son los ms utilizados en los DBMS comerciales

FsicosLos fsicos proporcionan conceptos que describen los detalles de cmo se almacenan los datos en la computadora (ip, num servidor, disco duro)Modelos de Base de DatosModelo JerrquicoLos registros se organizan como colecciones de rboles, en lugar de grafos dirigidos

Modelo de RedColecciones de registros y las relaciones entre datos se representan mediante enlaces

Modelo RelacionalEs una base de datos en donde todos los datos visibles al usuario estn organizados estrictamente como tablas de valores Por ejemplo, si una tabla contiene los campos NM-EMPLEADO, APELLIDO, NOMBRE y ANTIGUEDAD y otra tabla contiene los campos DEPARTAMENTO, NM-EMPLEADO y SALARIO, una base de datos relacional hace coincidir el campo NM-EMPLEADO de las dos tablas para encontrar informacin.

Instancias y esquemasLas bases de datos cambian con el tiempo al insertarse informacin en la base de datos y eliminarse de ella. El conjunto de informacin almacenado en la base de datos en cierto momento se denomina instancia en la base de datos. El diseo general de la base de datos se llama esquema de la base de datos. Los esquemas se alteran muy raras veces, o nunca.Una variable de un determinado tipo tiene un valor especfico en un momento dado. As, el concepto del valor de una variable en los lenguajes de programacin corresponde al concepto de una instancia del esquema de una base de datos.Existen varios esquemas en la base de datos, y stos se dividen de acuerdo con los niveles de abstraccin mencionados anteriormente.

Independencia de los datosIndependencia de los datos: La capacidad de modificar una definicin de esquema en un nivel sin afectar la definicin del esquema en el nivel inmediato superior se denomina independencia de los datos. Existen dos niveles de tal independencia:Independencia fsica: Es la capacidad de modificar el esquema fsico sin obligar a que se vuelvan a escribir los programas de aplicaciones. En algunas ocasiones es necesario para mejorar el rendimiento.Independencia lgica: Es la capacidad de modificar el esquema conceptual sin obligar a que se vuelvan a escribir los programas de aplicaciones. Las modificaciones en el nivel conceptual son necesarias siempre que se altera la estructura lgica de la base de datos.

Bases de datosNoSQL (Not only SQL)Con el aumento de informacin en los ltimos aos, los RDBMS han venido presentando algunos de los siguientes problemas: Alto costo en la recuperacin de datos. Ejecucin de transacciones innecesarias. Dificultad de escalamiento. Representacin de objetos al modelo relacional.Como respuesta a estos problemas surgi el trmino NoSQL (Not Only SQL) al buscar la mejor manera de describir las bases de datos distribuidas que no garantizan las propiedades de ACID (atomicidad, consistencia, aislamiento y durabilidad), para el procesamiento confiable de una base de datos. Estas bases de datos utilizan una combinacin de lenguajes como JSON, JAVASCRIPT, SQL, XML, Java, etctera.Estas nuevas bases de datos ya estn siendo utilizadas por grandes compaas con proyectos web como: Dynamo de Amazon y BigTable de Google y TwitterEjemplos de bases de datos NoSQL Bases de datos orientadas a documentos. Cassandra, HBase utilizada por Facebook, MongoDB y CouchDB, Googles BigTable Bases de datos orientadas a grafos. Neo4j. Bases de datos orientadas a objetos. Db4Objects de Versant y Objectivity/DB.

Bibliografahttp://www.monografias.com/trabajos72/base-datos/base-datos.shtmlhttp://robotica.uv.es/pub/Libro/PDFs/CAPI6.pdfhttp://es.slideshare.net/jazzme/paradigmas-de-bases-de-datoshttps://rommgusa.files.wordpress.com/2011/03/sistemas-gestores-de-base-de-datos.pdfhttp://highscalability.com/amazon-architecturehttp://es.slideshare.net/csalazarc/modelo-de-datos-14506949http://es.slideshare.net/DIOSANEGRA/abstraccion-de-datoshttp://www.angelfire.com/nf/tecvirtual/cursos/admonbd/DBA1.htmhttp://es.slideshare.net/hcumbicusr/sistemas-gestores-de-base-de-datos-sgbd-13333545http://es.slideshare.net/carlitosgm/comparativa-sgbdrhttp://comprendiendolastics.blogspot.mx/2011/04/modelo-de-datos-esquema-e-instancias.htmlhttp://es.slideshare.net/csalazarc/modelo-de-datos-14506949http://es.wikipedia.org/wiki/Modelo_relacionalhttp://es.wikipedia.org/wiki/Datohttp://es.wikipedia.org/wiki/Registro_%28base_de_datos%29http://es.wikipedia.org/wiki/Base_de_datoshttp://es.slideshare.net/jazzme/paradigmas-de-bases-de-datos

121051Jorge Emmanuel Corts Rodrguez