Upload
pedro-antonio
View
271
Download
1
Embed Size (px)
Citation preview
Características alta disponibilidad Oracle.
1.1 ¿Qué es la alta disponibilidad?
Disponibilidad es el grado en que una aplicación, servicio o función es accesible en la demanda. La disponibilidad se mide por la percepción del usuario final de una aplicación.
Si un usuario no puede acceder al sistema, se dice que no está disponible. Generalmente, el término tiempo de inactividad se utiliza para referirse a los períodos en que un sistema no está disponible.
Los usuarios que quieren que sus sistemas estén listos para servir en todo momento necesita alta disponibilidad. Un sistema que es de alta disponibilidad está diseñado para proporcionar un servicio ininterrumpido durante períodos de tiempo de computación esenciales, durante la mayoría de las horas del día, y la mayoría de los días de la semana durante todo el año, esta medida se han mostrado como24x365 . Sin embargo, se pueden hacer excepciones para el tiempo de inactividad mínimo para llevar a cabo ciertas operaciones como actualizar el hardware del sistema o software.
Las operaciones de fiabilidad, capacidad de recuperación, detección oportuna de errores, y continua son las características principales de una solución de alta disponibilidad:
Fiabilidad : El hardware confiable es un componente de una solución de alta disponibilidad. Confiable de software, incluyendo la base de datos, servidores web y aplicaciones-es tan fundamental para implementar una solución de alta disponibilidad. Una característica relacionada es la resiliencia. Por ejemplo, hardware de bajo costo de los productos básicos, combinada con un software como Oracle Real Application Clusters (Oracle RAC), se puede utilizar para implementar un sistema muy fiable. La capacidad de recuperación de una base de datos Oracle RAC permite que continúe el procesamiento a pesar de que los servidores individuales puede fallar.
Recuperabilidad : Puede haber muchas maneras de recuperarse de un fracaso. Por lo tanto, es importante determinar qué tipo de fallas pueden ocurrir en su entorno de alta disponibilidad y la forma de recuperarse de las fallas en forma oportuna que satisfaga sus necesidades empresariales. Por ejemplo, si una tabla crítica se elimina accidentalmente de la base de datos, ¿qué medidas debe tomar para recuperarlo? ¿Tiene su arquitectura de ofrecer la posibilidad de recuperar en el tiempo especificado en un acuerdo de nivel de servicio (SLA)?
Oportuna detección de errores : Si un componente de la arquitectura de su falla, la detección rápida es esencial para recuperarse del error inesperado. Aunque usted puede ser capaz de recuperarse rápidamente de un corte de luz, si se toma 90 minutos adicionales para descubrir el problema, entonces usted no puede cumplir con su SLA.
La operación continua : Facilitar el acceso continuo a los datos es esencial cuando el tiempo de inactividad muy poco o nada es aceptable para realizar actividades de mantenimiento.
Más específicamente, una arquitectura de alta disponibilidad debe tener los siguientes rasgos:
Tolerar fallos de tal manera que el procesamiento continúe con una interrupción mínima o ninguna
Proporcionar incorporado en las medidas preventivas
Realizar un seguimiento activo y la detección rápida de fallas
Proporcionar la capacidad de recuperación rápida
Automatización de operaciones de detección y recuperación
Proteger los datos para minimizar o prevenir la pérdida de datos
Implementar las mejores prácticas operacionales para administrar el entorno
Lograr los objetivos establecidos en los SLA (por ejemplo, los objetivos de tiempo de recuperación (RTO) y los objetivos de punto de recuperación (RPO)) para el costo total de propiedad más bajo.
1.2 Importancia de la disponibilidad
La importancia de una alta disponibilidad varía entre aplicaciones. Bases de Datos e Internet han permitido la colaboración en todo el mundo y el intercambio de información mediante la ampliación del alcance de las aplicaciones de bases de datos a través de organizaciones y comunidades.Este alcance pone de relieve la importancia de la alta disponibilidad en soluciones de gestión de datos. Tanto las pequeñas
empresas y las empresas globales tienen los usuarios de todo el mundo que necesitan tener acceso a los datos 24 horas al día. Sin este acceso a los datos, las operaciones pueden parar, y los ingresos se pierde. Ahora, los usuarios demandan acuerdos de nivel de servicio de su tecnología de la información (TI) departamentos y proveedores de soluciones, que reflejan la creciente dependencia de estas soluciones. Cada vez más, la disponibilidad se mide en dólares, euros y yenes, y no sólo en el tiempo y la comodidad.
1.3 El costo del tiempo de inactividad
La necesidad de ofrecer mayores niveles de disponibilidad continúa acelerándose como las empresas rediseñar sus soluciones para obtener una ventaja competitiva. Muy a menudo, estas nuevas soluciones se basan en el acceso inmediato a los datos críticos de negocio. Cuando los datos no está disponible, la operación se puede dejar de funcionar. El tiempo de inactividad puede conducir a la pérdida de productividad, pérdida de ingresos, deterioro de las relaciones de los clientes, la mala publicidad, y los pleitos.
Otro factores a considerar en el costo del tiempo de inactividad son:
-La longitud máxima tolerable de una interrupción imprevista sola.
-La máxima frecuencia de incidentes admisibles
2- Determinación de Requerimientos de alta disponibilidad
• Acerca de Determinación de los requisitos de alta disponibilidad
• Análisis del Marco para la Determinación de los requisitos de alta disponibilidad
• Requisitos de disponibilidad de Arquitectura
2.1 Acerca de Determinación de los requisitos de alta disponibilidad
Cualquier empresa que está diseñando e implementando una estrategia de alta disponibilidad debe empezar por realizar un análisis exhaustivo de los factores de negocio que requieren alta disponibilidad. Implementación de alta disponibilidad puede implicar tareas críticas tales como:
Retirar los sistemas heredados
Invertir en sistemas más capaces y robustos e instalaciones
El rediseño de la arquitectura de TI en general y las operaciones para adaptarse a este modelo de alta disponibilidad
El rediseño de los procesos de negocio
Contratar y capacitar al personal
Usted puede utilizar el alta disponibilidad marco de análisis de:
1. Completar un análisis del impacto empresarial
2. Identificar y clasificar los procesos críticos de negocio que tienen los requisitos de alta disponibilidad
3. Formular el costo de la inactividad
4. Establecer la utilización, Recovery Time Objective (RTO) , y objetivo de punto de recuperación (RPO) los objetivos de estos diversos procesos de negocio
5. Entender los objetivos de gestión y el coste total de propiedad (TCO) y retorno sobre la inversión (ROI)
Puede clasificar sus procesos de negocio en varios niveles de alta disponibilidad:
Nivel 1 los procesos de negocio tienen un impacto máximo. Estos son los requisitos más exigentes de alta disponibilidad, con el RTO y RPO cercano a cero, y que requieren los sistemas de apoyo disponibles continuamente. Para una empresa con un alto volumen de presencia de comercio electrónico, esto puede ser el sistema del cliente basado en Web interacción.
Nivel 2 procesos que se han relajado un poco alta disponibilidad y RTO y RPO requisitos. El segundo nivel de un negocio de comercio electrónico puede ser su cadena de suministro y sistemas de comercialización. Por ejemplo, estos sistemas no es necesario para mantener grados muy altos de disponibilidad y pueden tener RTO distinto de cero y los valores RPO. Así, los sistemas de alta disponibilidad y tecnologías elegidas para soportar los procesos de nivel 2 es probable que sean diferentes de las de los procesos de nivel 1.
Nivel 3 procesos puede estar relacionado con el desarrollo interno y los procesos de aseguramiento de la calidad. Sistemas de apoyo a estos procesos no tienen que tener los rigurosos requisitos de alta disponibilidad de los otros niveles.
2.2 Análisis del Marco para la Determinación de los requisitos de alta disponibilidad
Los elementos de este marco de análisis son los siguientes:
Análisis del impacto empresarial Costo del tiempo de inactividad Objetivo de Tiempo de Recuperación (RTO) Objetivo de Punto de Recuperación (RPO) Objetivo de administración Costo Total de Propiedad (TCO) y retorno sobre la inversión (ROI)
3 Oracle Database Solutions de alta disponibilidad para las paradas no planificadas
Base de Datos Oracle ofrece una suite integrada de soluciones de alta disponibilidad que aumentan la disponibilidad y eliminar o reducir al mínimo el tiempo de inactividad planificados y no planificados. Estas soluciones ayudan a las empresas a mantener la continuidad del negocio 24 horas al día, siete días a la semana. Sin embargo, las soluciones de alta disponibilidad de Oracle van más allá de la reducción
de tiempo de inactividad mediante el suministro de soluciones para aumentar la utilización del sistema en los sistemas de primaria y secundaria y para ayudar a mejorar el rendimiento general, escalabilidad y manejabilidad.
Oracle ofrece las siguientes características para una alta disponibilidad de tiempo de inactividad no planificado:
Fast-Start Recuperación de errores Oracle Reiniciar Oracle Real Application Clusters y Oracle Clusterware Oracle RAC One Node Oracle Data Guard Oracle GoldenGate y Oracle Streams Tecnología Oracle Flashback Oracle Automatic Storage Management Área de Recuperación Rápida Recovery Manager Data Recovery Advisor Oracle Secure Backup Características de Seguridad de Oracle LogMiner Oracle Exadata Storage Server Software (Cell Exadata) Oracle Exadata Database Machine Oracle Database File System (DSPF) Cliente de conmutación por error Reparación de Bloqueo Automático Prevención de la Corrupción, Detección y Reparación
Tabla de tipos de derrame 3-1 y las soluciones de Oracle de alta disponibilidad para las paradas no planificadas
Interrupció
n Alcance Solución de Oracle Beneficios
Fallas en el
sitio
Oracle Data Guard (MAA
recomendado)
Fast-Start Failover y FAN integrado con los clientes de
Oracle
Réplica física, alto rendimiento, soporta todos los tipos
Interrupció
n Alcance Solución de Oracle Beneficios
de datos
Fallas en el
sitio
Oracle GoldenGate y Oracle
Streams
Flexible activo-activo de alta disponibilidad solución
de los pies 1
Fallas en el
sitio
Recovery Manager La base de datos completamente gestionado de
recuperación y la integración conOracle Secure Backup
Fallas de las
computado
ras
Oracle Real Application
Clusters y Oracle
Clusterware (MAA
recomendado)
La recuperación automática de nodos fallidos y las
instancias
Notificación de aplicación rápida (FAN) con tolerancia
a fallos integrada de cliente de Oracle
Fallas de las
computado
ras
Oracle RAC One Node Siempre-en la instancia de una sola base de datos de
los servicios
Base de datos de una mejor disponibilidad de las
soluciones tradicionales de conmutación por error de
frío
Consolidación de servidores de bases de datos
Fallas de las
computado
ras
Fast-Start Recuperación de
errores
Caché ajustable y previsible recuperación de fallas de
las computadoras
Fallas de las
computado
ras
Oracle Data Guard Fast-Start Failover y FAN integrado con los clientes de
Oracle
Fallas de las
computado
ras
Oracle GoldenGate y Oracle
Streams
Facilita la creación de una copia local o remoto de una
base de datos de producción que se puede utilizar
para reanudar el procesamiento en caso de fallo
Las fallas de
almacenam
iento
Oracle Automatic Storage
Management (MAA
recomendado)
Duplicación y copias automáticas en línea lugares de
reequilibrio redundantes de los datos en grupos
separados de fallo.
Las fallas de
almacenam
iento
Oracle Data Guard (MAA
recomendado)
Fast-Start Failover y FAN integrado con los clientes de
Oracle
Las fallas de
almacenam
iento
Recovery Manager con
el área de recuperación
rápida y Oracle Secure
Backup
Totalmente logrado la recuperación de bases de datos
y gestión de copias de seguridad de disco y cinta
Interrupció
n Alcance Solución de Oracle Beneficios
Las fallas de
almacenam
iento
Oracle GoldenGate y Oracle
Streams
El proceso se reanuda en la copia de réplica (local o
remoto) en línea de la base de datos de producción
Datos de la
Corrupción
Oracle Exadata Storage
Server Software (Cell
Exadata) y Oracle Automatic
Storage Management(MAA
recomendado)
Si Oracle ASM detecta una corrupción y tiene un buen
espejo, Oracle ASM devuelve el buen bloque y repara
la corrupción durante la escritura posterior de E / S
Celular Exadata es la solución más completa, para
evitar la corrupción de la que se escriben en el disco
Datos de la
Corrupción
Prevención de la Corrupción,
Detección y
Reparación (MAA
recomendado)
Configuración de base de
datos de inicialización
comoDB_BLOCK_CHECKING ,
DB_BLOCK_CHECKSUM yDB_
LOST_WRITE_PROTECT
Diferentes niveles de prevención de la corrupción y la
detección de bloque a nivel de base de datos
Datos de la
Corrupción
Data Advisor de
recuperación yRecovery
Manager con el Área de
Recuperación Rápida (MAA
recomendado)
Data Recovery Advisor detecta automáticamente
daños en los datos y recomienda que el mejor plan de
recuperación.
RMAN en línea bloque de medios de comunicación el
tiempo de recuperación es más rápido porque RMAN
de utilizar los registros de flashback para restaurar una
copia más actual del bloque de datos para la
recuperación.
Datos de la
Corrupción
Oracle Data Guard (MAA
recomendado)
Reparación de los bloques de datos primarios en
tiempo real por ir a buscar una buena versión de una
base de datos standby física
Fast-Start Failover y FAN integrado con los clientes de
Oracle
Datos de la
Corrupción
Oracle GoldenGate y Oracle
Streams
El proceso se reanuda en la copia de réplica (local o
remoto) en línea de la base de datos de producción
Errores
Humanos
Características de Seguridad
de Oracle
Restringir el acceso a la prevención
Interrupció
n Alcance Solución de Oracle Beneficios
Errores
Humanos
Tecnología Oracle Flashback Rebobinado de grano fino y de gran capacidad de la
base de datos
Errores
Humanos
LogMiner Rehacer análisis del registro
Perdida
escribe
Oracle Data Guard , Recovery
Manager y
elDB_LOST_WRITE_PROTECT
parámetro de inicialización
DB_LOST_WRITE_PROTECT parámetro de inicialización
proporciona perdió escribir detección.
Si una escritura perdida que tuvo lugar en la base de
datos principal se detecta ya sea por la base de datos
standby física o durante la recuperación de los medios
de comunicación de la base de datos principal, la
recuperación se detiene para preservar la consistencia
de la base de datos. Sin embargo, en su defecto a la
base de datos standby con Oracle Data Guard se
traducirá en una pérdida de datos.
Si una escritura perdida se detecta en la base de datos
standby, puede restaurar el archivo afectado y reinicie
Redo Apply si la escritura se pierde aislados y el
problema de hardware se corrige.
Nota: Perdida escribe puede corromper la base de
datos completa, que puede que tenga que reconstruir
la base de datos afectada después de resolver el
problema de hardware.
Perdida
escribe
Oracle Data Guard
Oracle Exadata Storage
Server Software (Cell
Exadata)
Detección y prevención de la desviación o mal dirigida
escribe a otro archivo de datos.
Para la protección de escritura más completo perdida,
el uso de Oracle Data Guard y establecer
el DB_LOST_WRITE_PROTECT parámetro
(al Típica o COMPLETO ) tanto en las bases de datos
principal y de reserva
Se bloquea
o ralentizar
Oracle Database y Oracle
Enterprise Manager
Base de Datos Oracle supervisa automáticamente para
la base de datos se bloquea y trata de resolverlos.
Oracle Enterprise Manager, o un latido del corazón de
aplicación personalizada puede ser configurado para
detectar la aplicación o desaceleración tiempo de
respuesta y reaccionar ante estas violaciones de los
Interrupció
n Alcance Solución de Oracle Beneficios
SLA.
Por ejemplo, puede configurar el Beacon Enterprise
Manager para supervisar y detectar los tiempos de
respuesta. Entonces, después de un cierto umbral
expira, Enterprise Manager puede llamar al Oracle
Data GuardDBMS_DG.INITIATE_FS_FAILOVER PL / SQL
para iniciar una conmutación por error.Vea la sección
sobre "Aplicación Iniciado Fast-Start Failover"
en Oracle Data Guard Broker .
3.2 Fast-Start Fault Recovery
Base de Datos Oracle ofrece una recuperación rápida y predecible a partir de las fallas del sistema y fallos de base de datos.
Recovery from instance, database, and computer failures
Database checkpointing that is self-tuning to maintain a desired recovery time objective
3.3 Oracle Restart
Oracle Restart es una nueva característica de Oracle 11 g Release 2 (11.2) que mejora la disponibilidad de single-instance (nonclustered) base de datos Oracle y sus componentes. Oracle Restart se utiliza en entornos de una sola instancia. Para los entornos Oracle Real Application Clusters (Oracle RAC), la funcionalidad para reiniciar automáticamente los componentes es proporcionado por Oracle Clusterware.
3.4 Oracle Real Application Clusters y Oracle Clusterware
Si un servidor de clúster falla, entonces la base de datos Oracle continúa ejecutándose en los servidores sobrevivientes. Cuando más potencia de procesamiento que se necesita, puede agregar otro servidor sin interrumpir el acceso a los datos.
Oracle RAC permite que varias instancias que están vinculados por la interconnect puedan compartir el acceso a una base de datos Oracle. En un
entorno Oracle RAC, Oracle Database se ejecuta en dos o más sistemas en un cluster, mientras que al mismo tiempo acceder a una base de datos compartida.El resultado es un sistema de base de datos único que abarca varios sistemas de hardware, permitiendo a Oracle RAC proporcionar alta disponibilidad y redundancia durante las fallas en el clúster.
Oracle Clusterware es un software que, una vez instalado en
servidores que ejecutan el mismo sistema operativo, permite a los
servidores que se unen para operar como si fueran un solo servidor, y
gestiona la disponibilidad de las aplicaciones de usuario y bases de
datos de Oracle. Oracle Clúster también proporciona todas las
características necesarias para la gestión de cluster, incluida la
pertenencia de nodo, los servicios de grupos, gestión de los recursos
mundiales, y las funciones de alta disponibilidad:
Para alta disponibilidad, puede colocar las bases de datos de
Oracle (de una sola instancia o bases de datos Oracle RAC) y las
aplicaciones de usuario (Oracle y no Oracle), bajo la gestión y
protección de clúster Oracle, para que las bases de datos y
aplicaciones de reiniciar cuando un proceso falla o algo así que
una conmutación por error a otro nodo se produce después de un
fallo de nodo.
Para la gestión de clúster, software de clúster Oracle presenta
múltiples servidores independientes como si fueran una sola
imagen del sistema o de un servidor virtual. Este servidor virtual
se conserva en el clúster para todas las operaciones de gestión,
permitiendo a los administradores realizar las instalaciones,
configuraciones, copias de seguridad, actualizaciones, y las
funciones de supervisión. A continuación, Oracle Clusterware
distribuye automáticamente la ejecución de estas funciones de
gestión de los nodos correspondientes en el clúster.
3.4.1 Ventajas del uso de software de clúster Oracle
Clúster Oracle proporciona los siguientes beneficios:
Tolera y se recupera rápidamente de fallas de las computadoras y
de la instancia.
Simplifica la gestión y el apoyo mediante el uso de software de
clúster Oracle con Oracle Database. Mediante el uso de un menor
número de proveedores y una pila de todos los de Oracle se
obtiene una mejor integración de comparación con el uso de
terceros de clúster.
Realiza actualizaciones sucesivas de cambios en el sistema y el
hardware. Por ejemplo, puede aplicar las actualizaciones del
software de clúster Oracle, conjuntos de parches y parches
provisionales en forma de rodadura, de la siguiente manera:
o Actualiza el software de clúster de Oracle Oracle Database
10 gde Oracle Database 11 g
o Actualiza el software de clúster de Oracle de base de datos
Oracle versión 11.1 a la versión 11.2
o Parche de software de clúster Oracle Oracle Database
11.1.0.6 a 11.1.0.7
o Parche de software de clúster Oracle Oracle Database
10.2.0.2 Paquete 1 a Oracle Database 10.2.0.2 Bundle 2
No se reinicia automáticamente los procesos de Oracle.
Gestiona automáticamente el IP virtual (VIP) de modo que cuando
un nodo falla, entonces la dirección VIP del nodo por error a otro
nodo en el que la dirección VIP puede aceptar conexiones.
Reinicia automáticamente los recursos de los nodos fallidos en los
nodos sobrevivientes.
Controla los procesos de Oracle de la siguiente manera:
o Para bases de datos Oracle RAC, Oracle Clusterware controla
todos los procesos de Oracle por defecto.
o Para instancias de Oracle de una sola base de datos,
software de clúster Oracle le permite configurar los procesos
de Oracle en un grupo de recursos que está bajo el control
de clúster Oracle.
Proporciona una interfaz de programación de aplicaciones (API)
para las aplicaciones de Oracle y no Oracle, que permite controlar
otros procesos de Oracle con Oracle Clusterware, tales como
reiniciar o reaccionar a los fracasos y las reglas determinadas.
Administra la suscripción del nodo y evita el síndrome de la
división del cerebro en el cual dos o más instancias de tratar de
controlar la base de datos.
Proporciona la capacidad de realizar actualizaciones sucesivas de
liberación de software de clúster Oracle, sin tiempo de inactividad
de las aplicaciones.