Sistemas de almacenamiento. IFCT0310

Tekst
0
Recenzje
Przeczytaj fragment
Oznacz jako przeczytane
Czcionka:Mniejsze АаWiększe Aa

2.3. Migraciones y archivado de datos

La migración de datos es el proceso de trasladar datos desde sistemas existentes a otros nuevos. Este proceso contempla los pasos de limpiar, corregir y mover datos al nuevo sistema.

Cuando se cambia de base de datos, aplicaciones o al cambiar de sistema operativo, se tiene que conseguir que los datos antiguos funcionen en el nuevo entorno. Se necesita transformar los datos a un formato conveniente para el nuevo entorno y preservar la información del viejo. Este proceso de migración se trata de una tarea delicada y es recomendable realizarlo primero en un entorno de pruebas. Una vez que se está seguro de haberse realizado correctamente se puede pasar a realizar la migración en el entorno real.

La migración de datos se puede dar por diversas circunstancias, como migrar por necesidad una base de datos, nueva versión del sistema, etc. Las ventajas de migrar se dan para aprovechar nuevas tecnologías, disminuir altos costes de licencias, disminuir costes de mantenimiento y actualización, etc. La desventaja de las migraciones puede ser el continuo proceso de migración, ya que se debe realizar esta una vez que los medios que se usan quedan obsoletos; también hay que tener medios extras para el almacenaje de datos, el archivado.

Por ejemplo, al migrar una base de datos de un tipo a otro, los datos alojados se deben convertir al formato de la base de datos nueva. Es posible que al realizar el proceso de migración se deban crear nuevas tablas o modificar las existentes al cambiar el formato.

Existen varias técnicas o pasos a seguir en el proceso de migración de datos:

Mapear tipos de datos. Al no soportar algunos tipos de datos algunas plataformas de bases de datos puede ser necesario mapear los campos en la base de datos a la que se migra.

Planificar y analizar el proceso de migración es lo más importante. Este proceso es más tedioso y largo, pero a la larga se tendrá un sistema totalmente correcto y sin errores. Este proceso debe aplicarse mientras se está creando la base de datos, para así controlar todos los parámetros. No es válido una vez creada.

Se debe controlar por medio de un contador de registros, aquellos que han sido migrados con éxito y los que no.

Para evitar errores o pérdidas de datos, la codificación de la base de datos de destino es importante ya que, si no coincide con la de origen, fallará.


Nota

Es recomendable realizar la migración de datos primero en un entorno de pruebas, ya que este proceso es muy delicado.

El archivado de datos consiste en archivar, eliminar datos o almacenar los datos en segundos medios, datos históricos transaccionales del sistema que tienen poco/mucho uso, con el fin de hacer la base de datos más manejable o reducirla cuando su tamaño es demasiado grande. Con el archivado, las empresas buscan un mejor crecimiento sostenible, reducir el tamaño de la estructura de datos de consulta.

Algunas plataformas no soportan algunos tipos de datos, por eso es necesario planificar el mapeo de los campos de la nueva base de datos, si se diera el caso. La migración se realiza mediante un conjunto de programas a medida y scripts, que automáticamente llevan a cabo la transferencia de los datos.

Los datos almacenados son el activo más valioso para una empresa, incluso a nivel usuario, por ello cualquier manipulación debe ser realizada sin interrupciones. Las migraciones deben ser cuidadosamente planificadas, y hay que comprobar los métodos y herramientas a utilizar, que toman los datos existentes, convirtiendo este complicado proceso en una gestión que minimice los riesgos.

Migrar da la oportunidad de diseñar una nueva arquitectura que permita el crecimiento y una operatividad eficaz. También facilitará la implantación de copias de seguridad y restauración, que ofrezcan una mejor recuperación en caso de un error fatal, la automatización de procesos que tal vez con el antiguo entorno se haría de manera manual y reorganizar las bases de datos para reducir la fragmentación del disco y así mejorar el rendimiento del sistema.


Recuerde

Mapear significa, en el más amplio sentido de la palabra, adaptar a las necesidades. Al cambiar de plataforma no todos los datos son válidos, así que a estos no válidos se debe cambiar el “formato” para que sean accesibles en el nuevo sistema.

3.Volúmenes lógicos y físicos

Para entender mejor el funcionamiento de los volúmenes lógicos y físicos hay que conocer algunos conceptos clave:

Volumen físico (Physical Volume)(PV):son los dispositivos de almacenamiento, normalmente los discos duros, pero podría ser cualquier dispositivo de bloques. Este dispositivo se habilitará para incluirlo en un Grupo de Volumen. Los PV pueden estar ubicados en una partición, si van a coexistir con sistemas tradicionales, o extenderse por toda una unidad de disco.

Volumen lógico (Logical Volume)(LV):es la forma en la que el sistema permite acceder al espacio de almacenamiento. Son visibles a través de los dispositivos de bloques y en ellos es donde se crearán los sistemas de archivos. Los LV son el equivalente a las particiones, con la excepción de que los LV pueden extenderse entre varios PV.

Grupos de volumen (Volume Group)(VG):constan de dos factores: por una parte, agrupan colecciones de PV uniendo su capacidad en un único espacio de almacenamiento; por otro lado, indican cómo será repartido el espacio de almacenamiento de los LV.

Extensión física (Physical Extend)(PE):los PV se dividen en bloques de datos, los PE. Estas áreas físicas tiene el mismo tamaño dentro del VG al que pertenecen. Por defecto, el tamaño de cada PE es de 4 MB y cada PE tiene un identificador que es único dentro del PV al que pertenece.

Extensión lógica (Logical Extend)(LE):es una forma de indicar qué PE forman un LV. Estas se necesitan porque los identificadores de las PE solo son únicos dentro del PV al que pertenecen, pudiendo repetirse en el VG. Las LE sirven para solventar este problema, existiendo un mapeado 1:1 entre un LE y un PR de un PV.

4.Concepto de particionamiento

Particionar en informática quiere decir segmentar un disco rígido para no mezclar datos. Se podría particionar un disco duro para tener más de un sistema operativo que no utilice el mismo sistema de archivos, realizar copias de seguridad en una partición distinta donde está instalado el sistema operativo, etc.

Se pueden distinguir tres tipos de particiones:

Partición primaria:son las particiones principales del disco, se deben formatear en forma lógica y asignarles un sistema de archivos en concordancia con el sistema operativo instalado. Un disco duro puede poseer como máximo cuatro particiones primarias y solo una de estas particiones primarias puede estar activa, que es donde se encuentra el sistema operativo principal.

Partición extendida:solo se puede crear una como máximo y contienen las unidades lógicas que se desean, por tanto no puede contener un sistema de archivos directamente. Estas particiones se crearon para superar el límite de cuatro particiones primarias; al no poder almacenar datos directamente sobre ellas se requiere como mínimo una unidad lógica.

Unidades lógicas:particiones que se pueden crear dentro de una partición extendida. En una partición extendida puede haber un máximo de 23 particiones lógicas. Normalmente es el espacio para los datos, tanto compartidos como exclusivos de sistemas operativos.


Nota

No puede haber dos sistemas operativos instalados en una misma partición, ya que entrarían en conflicto.

Un disco podría contener hasta cuatro particiones primarias, estas son las que contienen los sistemas operativos, pero solo una podría estar activa o tener tres particiones primarias y una extendida. Las particiones extendidas se pueden subdividir en contenedores adicionales llamados particiones lógicas.


Simulación de disco duro particionado

 

Al particionar un disco, dentro de la tabla de particionamiento se aloja una información referente a las distintas particiones que conforman un disco duro. Esta información indica el tamaño de los sectores, posición respecto a la partición primaria, sistemas operativos instalados, etc., de las particiones

Las ventajas de utilizar las particiones son varias. Se puede tener la información mucho mejor organizada ya que en una partición se puede tener lo que se refiere al sistema operativo, instalación de programas, etc., y en otra partición los datos de usuario, imágenes, música y video, ya que si hubiera que formatear la partición del sistema operativo por cualquier motivo no se perderían todos los archivos personales, además de que hoy en día las capacidades de disco duro son muy grandes y a la hora de formatear el dispositivo por completo se emplearía mucho más tiempo. Al igual que para guardar archivos personales, se podría usar una partición para guardar copias de seguridad.

Otra razón por la que tener particionado el disco duro es poder tener dos sistemas operativos, lo cual resulta muy útil.


Actividades

5.Señale qué función desempeña el Volume Group, Grupo de Volumen.

6.Defina los tipos de particionamiento que existen y qué ventajas aporta tener un disco duro particionado.

En Linux se debe tener en cuenta, a la hora de particionar un disco duro, reservar espacio para la memoria virtual o espacio de intercambio, llamada SWAP. Este espacio reservado de memoria virtual es utilizado por el disco duro para descargar la memoria RAM, así el sistema copia parte del contenido alojado en la RAM al espacio SWAP para poder seguir realizando otras tareas. La ventaja de utilizar la memoria SWAP es que se dispone de más memoria cuando la RAM es de poca capacidad, pero tiene el inconveniente de que es más lenta y se pierde capacidad del disco duro. Es conveniente asignar el doble de memoria al SWAP de la RAM que se tenga, según las necesidades, hasta memorias de 1 GB de capacidad, siendo del mismo tamaño la partición SWAP que la memoria RAM si esta es de 1 GB. Si la memoria se encuentra entre 2 GB y 4 GB, el espacio reservado para la SWAP será de la mitad de la RAM, y si la memoria RAM supera los 4 GB, la reserva para SWAP será como máximo de 2 GB.

4.1. Concepto de tabla de particiones y MBR

La tabla de particiones es un área del disco duro que contiene información de las particiones relacionada con el tamaño en sectores, posición de partición con respecto a la primaria, tipos de partición existente y sistemas operativos instalados. Si un virus afectara a dicha tabla de partición su eliminación sería muy complicada y también la recomposición del sistema de particiones.

La tabla de particiones se puede encontrar en el MBR (Master Boot Record), el registro de arranque principal o maestro, con una ocupación de 64 bytes, repartidos en 4 registros de 16 bytes. La tabla de particiones está alojada a partir del byte 446.

El MBR se aloja al principio del disco duro, de 512 bytes de longitud, y contiene una secuencia de comandos para cargar un sistema operativo. Además de ser el primer registro del disco duro contiene un pequeño programa ejecutable, bootstrap, que se emplea para arrancar el sistema operativo y la tabla de particiones, como se ha dicho anteriormente.

Todos los disco duros albergan un MBR, pero no todas las BIOS arrancan el sistema operativo desde cualquier disco duro. Cuando inicia desde disco duro la BIOS copia el contenido albergado en el MBR en una dirección fija de memoria RAM, para que luego sea este el que tenga el control.


Nota

Hasta 1990, la BIOS era almacenada en memorias tipo ROM o EPROM; en la actualizad se utilizan memorias Flash, con la ventaja de que pueden ser actualizadas sin tener que abrir la caja.

El esquema básico de un disco duro consta de MBR, que siempre está definida en cualquier disco duro, y las distintas particiones, como las primarias, que se usan para instalar los sistemas operativos, y las particiones extendidas, las cuales se usan para alojar los archivos de los distintos sistemas operativos y particiones creadas a criterio del usuario para almacenar otros archivos. Por ejemplo, crean una partición que sea accesible tanto de Linux como desde Windows. Hay que recordar que para discos duros instalados con el sistema operativo Linux hay que reservar espacio en el disco duro para SWAP.


4.2. Aplicación práctica

Se le ha asignado la tarea de formatear un nuevo equipo que llega a la empresa con las siguientes directrices:

Tiene que particionar un disco duro de 100 GB de capacidad con una memoria RAM de 2 GB y debe instalar Windows XP SP3 junto a Ubuntu 8.04.

Se precisa tener una parte del disco en el que pueda almacenar información tanto de Windows como de Ubuntu, definir las particiones que se deben realizar, el sistema de archivos para las particiones y nombre de las particiones.

Represente gráficamente cómo quedaría el disco duro particionado, sabiendo que la instalación de Windows ocupará 15 GB y la de Linux 12 GB, y debe quedar un espacio libre en disco de 7 GB. Distribuya según su criterio el espacio restante.

Solución

Cree un gráfico a modo de guía, donde dividirá el espacio del disco, para la partición primaria y la partición extendida y la tabla MBR.

Particione el disco en dos particiones primarias, una para cada sistema operativo, y otra partición de datos, donde albergará los datos compartidos y los datos pertenecientes a cada sistema operativo. La partición activa será la de Windows.


MBR contiene la tabla de particiones y el programa de inicialización.

Partición activa, debe ser una de las particiones primarias en este caso la partición de Windows.

Segunda partición primaria, perteneciente al SO Ubuntu.

Espacio de la partición extendida del disco, contiene el espacio SWAP y el espacio para los datos.

Espacio libre del disco sin asignación.

4.3. Descripción de sistemas de almacenamiento NAS y SAN

El sistema de almacenamiento NAS (Network Attached Storage) sirve archivos a través de una red local (LAN). Los sistemas NAS están compuestos por tres elementos: un procesador, unidades de almacenamiento, como discos duros, y un módulo de conexión a la red.

Una vez se ha conectado el sistema NAS a la red TCP/IP, detectará y ajustará los parámetros básicos para que sea visible en todos los puestos conectados a esa red y estará preparado para recibir peticiones de acceso para compartir archivos.

NAS proporciona acceso a ficheros mediante NFS, CIFS, FTP o TFTP, sobre TCP/IP. El cliente solicita el archivo por completo al servidor y lo maneja localmente, por esta razón los NAS están orientados a datos almacenados de pequeño tamaño y una gran cantidad. NAS permite dar servicio a ordenadores y sistemas operativos diferentes. Los NAS proporcionan servicios de seguridad avanzados como las políticas de acceso, RAID y alimentación redundante para así aumentar su confiabilidad y prestaciones. Además, este sistema de almacenamiento es muy escalable, solo se tendrían que conectar más unidades NAS o añadir más sistemas de almacenamiento.

El NAS head es el hardware que actúa como interfaz entre NAS y el cliente, el cliente se conecta mediante el NAS head, nunca a los dispositivos de almacenamiento que alberga, a través de una conexión Ethernet.

Para administrar el NAS se ejecuta un pequeño programa desde cualquier equipo. Desde este software y una herramienta web se definen los recursos compartidos, los usuarios y los niveles de acceso.


Por otro lado, el SAN (Storage Area Network) es una red dedicada de datos de alta velocidad (fibra óptica) y capacidad, que conecta diferentes tipos de unidades de almacenamiento actuando independientemente de la red local, pero sin llegar a ser excluyente. El tipo de tráfico en SAN es similar al de los discos duros ATA, SATA y SCSI; este último es el protocolo más usado. La petición de datos se hace por bloques y no por archivos como en NAS.

La fibra óptica está compuesta por fibra de vidrio, que transmite pulsos luminosos generalmente de láser o LED. En el interior de la fibra óptica, la luz se refleja contra las paredes en ángulos abiertos, avanzando casi por el centro, permitiendo transmitir la señal casi sin pérdida alguna.


Ampliación de cable de fibra óptica


Nota

La fibra óptica ha reemplazado al cobre por su relación precio/beneficio. Es más rápida y no está afectada por interferencias.

El SAN hace posible que el almacenamiento sea accesible a todos los servidores de la red, facilitando que los datos se compartan entre los diferentes servidores sin ninguna repercusión en la red local (LAN). De esta manera, la información no reside directamente en un servidor, y estos pueden utilizarse para otras tareas al tener mucha más capacidad de almacenamiento libre. Los dispositivos SAN tienen una buena escalabilidad, solventando este problema agregando dispositivos adicionales, los cuales serían accesibles desde cualquier servidor de la red.

Según el tipo de red que se utilice en SAN la velocidad puede variar. En caso de la fibra óptica, el ancho de banda aproximadamente está en 100 MB/seg; otro protocolo de red utilizado en la SAN es iSCSI,aunque no es tan rápido como la fibra.



Recuerde

En NAS los ordenadores se conectan a los dispositivos de almacenamiento directamente a través de LAN e influye negativamente en el rendimiento de la LAN. En SAN, al ser una red dedicada conectada a la LAN, la velocidad es mayor y no interfiere en la red local.

Comparación y aplicaciones

La comparativa de ambos sistemas de almacenamiento se centra en los tres puntos siguientes:

Capacidad y escalabilidad:la capacidad de los dispositivos SAN crece mucho más rápido que la de los dispositivos NAS, la capacidad de SAN se puede ampliar de forma ilimitada hasta llegar a los miles de TB. Esta característica se debería tener en cuenta si el objetivo es la consolidación del almacenamiento y sacar partido y mejorar el tiempo de respuesta de los datos. Esta ventaja permite la recuperación de equipos o aplicaciones en caso de error de una manera rápida y segura. Por su parte, NAS también es escalable, y su capacidad de almacenamiento oscila entre GB y algunos TB. Si se quisiera añadir más capacidad siempre quedaría añadir más dispositivos NAS, teniendo en cuenta que cada dispositivo operaría de forma independiente, complicando así la gestión. En definitiva, para gestionar una empresa con gran cantidad de volúmenes de información la opción es SAN, siendo el NAS la opción más recomendada para una empresa con menor necesidad de almacenamiento, con la ventaja también de los costes, mucho más reducidos que ofrece NAS.

 

Rendimiento:NAS ofrece un menor rendimiento que SAN. En NAS el acceso a los datos almacenados consume más recursos al procesar los datos entre el cliente y el servidor. Una mayor ventaja de SAN con respecto a NAS es que no utiliza la misma red local (LAN) que se usa para el resto de funciones, permitiendo otros beneficios, como realizar copias de seguridad con poco impacto en los servidores y llevar a cabo actualizaciones en un menor tiempo. Si el rendimiento es la prioridad se debería considerar SAN, pero teniendo en cuenta muchos más factores, como su alto precio y su mayor complejidad, y habría que tener en cuenta el NAS si se va a trabajar con diferentes sistemas operativos y ordenadores, ya que de estas características carecen los sistemas SAN.

Costes:en relación a los costes, como ya se ha visto anteriormente, SAN resulta mucho más costoso que NAS. El usuario, normalmente una empresa, es quien debe decidir si el uso de SAN y su gasto está justificado.


Recuerde

LAN, Red de Área Local, está formada por una serie de equipos que pertenecen a una misma “organización”, casa, edificio, etc., conectados dentro de un área pequeña. La conexión de varios equipos a la misma red permite envío/recibo de archivos y componentes hardware como impresoras.


Aplicación práctica

Imagine que le encargan la tarea de sopesar qué sistema de almacenamiento implantará en su empresa, teniendo en cuenta el gran volumen de datos que genera la actividad en la misma. Debe tener en cuenta que la conexión que usará será de fibra óptica y que todos los equipos utilizan un mismo sistema operativo. Argumente claramente cuál es la decisión final elegida.

SOLUCIÓN

De primera mano dispone de fibra óptica, por tanto deberá aprovechar sus características en cuanto a velocidad, rendimiento y fiabilidad que aporta, consiguiendo velocidades de 100 MB/seg, aproximadamente. También la seguridad ofrecida es mayor al quedar aisladas del tráfico normal.

Debido al gran volumen de datos que se maneja en su empresa debe tener en cuenta que el sistema que elija tiene que ser escalable y no tener límite de escalabilidad a ser posible.

Con respecto al rendimiento, debe escoger un sistema de almacenamiento el cual no consuma demasiados recursos, como los sistemas SAN, y que, además, no utilice la misma red local que se usa para el resto de tareas. Además SAN comparte el almacenamiento entre los servidores de la red, así no carga la red local y la información no reside en un único servidor

Analizando los puntos anteriores la mejor opción es optar por un sistema de almacenamiento SAN, con el inconveniente de que es más caro que el NAS.

To koniec darmowego fragmentu. Czy chcesz czytać dalej?