RAID (Redundant Array of Independent Disks), originalmente conocido como Redundant Array of Inexpensive Disks, fue propuesto por primera vez por el profesor D. A. Patterson de la Universidad de California,Berkeley en el artículo "Un caso de redundante matriz de discos baratos" en 1988En ese momento, los discos de gran capacidad eran caros, por lo que la idea básica de RAID era combinar orgánicamente múltiples discos de pequeña capacidad y relativamente baratos para obtener la capacidad,rendimiento y fiabilidad equivalentes a los discos de gran capacidad caros a un costo menorA medida que el costo y el precio de los discos continuaban disminuyendo, el término "barato" perdió su significado, y el Consejo Asesor de RAID (RAB) decidió reemplazar "barato" por "independiente".
Esta idea de diseño de RAID fue rápidamente adoptada por la industria. La tecnología RAID, como una tecnología de almacenamiento de alto rendimiento y altamente confiable, se ha aplicado ampliamente.tecnologías de reflexión y paridad de datos para lograr un alto rendimientoEn el caso de las tecnologías que se utilizan en el sector de la telecomunicación, la mayor parte de las tecnologías que se utilizan en el sector de la telecomunicación son las que se utilizan en el sector de la telecomunicación.RAID se puede dividir en diferentes niveles para satisfacer las necesidades de diferentes aplicaciones de datosLos niveles RAID originales RAID1-RAID5 fueron definidos en un artículo de D. A. Patterson et al., y RAID0 y RAID6 se han ampliado desde 1988.Los proveedores de almacenamiento han introducido continuamente niveles RAID como RAID7, RAID10/01, RAID50, RAID53 y RAID100, pero no existe un estándar unificado.y los cuatro niveles excepto RAID2 se han establecido como estándares industrialesLos niveles de RAID más utilizados en el campo de aplicación real son RAID0, RAID1, RAID3, RAID5, RAID6 y RAID10.
Desde la perspectiva de la implementación, RAID se divide principalmente en tres tipos: RAID de software, RAID de hardware y RAID híbrido.todas las funciones son completadas por el sistema operativo y la CPU, y no hay un chip de control / procesamiento RAID independiente y un chip de procesamiento de E / S, por lo que la eficiencia es la más baja.El RAID de hardware está equipado con un chip de control/procesamiento RAID especial y un chip de procesamiento de E/S, así como un búfer de matriz, y no ocupa recursos de CPU, pero el costo es muy alto. RAID híbrido tiene un chip de control / procesamiento RAID, pero carece de un chip de procesamiento I / O, y necesita la CPU y los programas de controladores para completar,y su rendimiento y costo están entre el software RAID y hardware RAID.
Cada nivel RAID representa un método y una tecnología de implementación, y no hay distinción entre niveles altos y bajos.el nivel RAID adecuado y el método de implementación específico deben seleccionarse de acuerdo con las características de las aplicaciones de datos de usuario., y la disponibilidad, el rendimiento y el coste deben considerarse de forma exhaustiva.
RAID, es decir, Redundant Array of Independent Disks, se suele abreviar como disk array.que proporciona un mayor rendimiento de almacenamiento y tecnología de redundancia de datos que un solo disco. RAID es una tecnología de gestión de múltiples discos que proporciona rentabilidad, alta confiabilidad de datos y almacenamiento de alto rendimiento al entorno host.una matriz de disco en la que parte del espacio de almacenamiento físico se utiliza para registrar la información redundante de los datos del usuario almacenados en el espacio restanteCuando un disco o una ruta de acceso falla, la información redundante se puede utilizar para reconstruir los datos del usuario.Por lo general también se llama RAID (i.e, RAID0).
La intención original de RAID era proporcionar funciones de almacenamiento de gama alta y seguridad de datos redundantes para servidores grandes.RAID se considera un espacio de almacenamiento compuesto por dos o más discosLa mayoría de los niveles RAID tienen medidas completas de verificación y corrección de datos.y hasta los métodos de reflexión, que mejoran enormemente la confiabilidad del sistema, y de ahí viene "redundante".
Aquí necesitamos mencionar JBOD (Just a Bunch of Disks). Inicialmente, JBOD fue utilizado para representar una colección de discos sin software de control para proporcionar control coordinado,que es el principal factor que distingue al RAID del JBODEn la actualidad, JBOD a menudo se refiere a un recinto de disco, independientemente de si proporciona funcionalidad RAID o no.
Los dos objetivos clave de RAID son mejorar la confiabilidad de los datos y el rendimiento de E / S. En la matriz de discos, los datos están dispersos entre múltiples discos, pero para el sistema informático,Parece un solo disco.La redundancia se logra escribiendo los mismos datos a múltiples discos (normalmente de espejo) o escribiendo los datos de paridad calculados en la matriz,para que la pérdida de datos no se produzca cuando un solo disco fallaAlgunos niveles de RAID permiten que más discos fallen al mismo tiempo, como RAID6, donde dos discos pueden dañarse al mismo tiempo.el disco fallido puede ser reemplazado por otro nuevo, y RAID reconstruirá automáticamente los datos perdidos de acuerdo con los datos y datos de paridad en los discos restantes para garantizar la consistencia e integridad de los datos.Los datos están dispersos y almacenados en varios discos diferentes en RAID, y la lectura y escritura simultáneas de datos es mucho mejor que la de un solo disco, por lo que se puede obtener un mayor ancho de banda agregado de E / S. Por supuesto,la matriz de disco reducirá el espacio de almacenamiento total disponible de todos los discosPor ejemplo, la utilización del espacio de almacenamiento de RAID1 es sólo del 50%, y RAID5 perderá la capacidad de almacenamiento de un disco,y la utilización del espacio es (n-1)/n.
La matriz de discos puede garantizar el funcionamiento continuo del sistema sin interrupción cuando algunos discos (únicos o múltiples, dependiendo de la implementación) están dañados.Durante el proceso de reconstrucción de los datos del disco fallido al nuevo disco, el sistema puede seguir funcionando normalmente, pero el rendimiento se reducirá en cierta medida.Mientras que algunos apoyan el intercambio calienteEsta matriz de discos de gama alta se utiliza principalmente en sistemas de aplicaciones con altos requisitos de fiabilidad,y el sistema no puede ser apagado o el tiempo de apagado debe ser lo más corto posibleEn términos generales, RAID no puede reemplazar la copia de seguridad de datos. Es impotente para la pérdida de datos causada por fallas que no sean de disco, como virus, destrucción humana, eliminación accidental, etc. En este momento,la pérdida de datos es relativa al sistema operativoPara el sistema RAID en sí, los datos están intactos y no se ha producido ninguna pérdida.La recuperación de desastres y otras medidas de protección de datos son muy necesarias, que complementan el RAID y protegen la seguridad de los datos en diferentes niveles para evitar la pérdida de datos.
Hay tres conceptos y tecnologías clave en RAID: espejo, tira de datos y paridad de datos.y por otro lado, puede leer datos de dos o más copias simultáneamente para mejorar el rendimiento de lectura.y se necesita más tiempo para asegurarse de que los datos se escriben correctamente a varios discos. Data striping almacena las rebanadas de datos en varios discos diferentes, y múltiples rebanadas de datos juntos forman una copia completa de los datos,que es diferente de las copias múltiples de reflejo y se utiliza generalmente para consideraciones de rendimiento. La extracción de datos tiene una granularidad de concurrencia más alta. Al acceder a los datos, es posible leer y escribir datos en diferentes discos al mismo tiempo,obteniendo así una mejora muy significativa del rendimiento de E/SLa paridad de datos utiliza datos redundantes para la detección y reparación de errores de datos. Los datos redundantes generalmente se calculan mediante algoritmos como el código de Hamming y la operación XOR.El uso de la función de paridad puede mejorar en gran medida la fiabilidadSin embargo, la paridad de datos necesita leer datos de múltiples lugares y realizar cálculos y comparaciones, lo que afectará el rendimiento del sistema.Los diferentes niveles de RAID adoptan una o más de las tres tecnologías anteriores para obtener una confiabilidad de datos diferenteEn cuanto a qué tipo de RAID (incluso nuevos niveles o tipos) diseñar o qué modo de RAID adoptar,Es necesario hacer una elección razonable bajo la premisa de comprender profundamente los requisitos del sistema y evaluar de manera exhaustiva la fiabilidad, el rendimiento y el coste para hacer una elección de compromiso.
-
Gran capacidad: Esta es una ventaja obvia de RAID. Amplía la capacidad del disco, y el sistema RAID compuesto de varios discos tiene un enorme espacio de almacenamiento. Ahora la capacidad de un solo disco puede alcanzar más de 1 TB,Así que la capacidad de almacenamiento de RAID puede alcanzar el nivel PBEn términos generales, la capacidad disponible de RAID es menor que la capacidad total de todos los discos miembros.Los diferentes niveles de algoritmos RAID requieren una cierta redundancia de gastos generales, y el gasto general de capacidad específica está relacionado con el algoritmo adoptado. Si se conoce el algoritmo y la capacidad de RAID, se puede calcular la capacidad disponible de RAID.la utilización de la capacidad del RAID está entre el 50% y el 90%.
-
Alto rendimiento: El alto rendimiento de RAID se beneficia de la tecnología de extracción de datos.y es a menudo el cuello de botella del rendimiento del sistemaA través de la separación de datos, RAID distribuye los datos de E/S a cada disco miembro, obteniendo así el rendimiento agregado de E/S que es varias veces mayor que el de un solo disco.
-
Confiabilidad: La disponibilidad y fiabilidad son otras características importantes de RAID. Teóricamente, la fiabilidad de un sistema RAID compuesto por múltiples discos debería ser peor que la de un solo disco.Hay una suposición implícita aquí: un solo fallo del disco hará que todo el RAID no esté disponible.El espejo es la tecnología de redundancia más primitiva, que copia completamente los datos de un determinado grupo de unidades de disco a otro grupo de unidades de disco para garantizar que siempre haya una copia de datos disponible.En comparación con el 50% de redundancia de los gastos generales de espejo, la paridad de datos es mucho menor, y utiliza la información redundante de paridad para verificar y corregir los datos.La tecnología de redundancia de RAID mejora en gran medida la disponibilidad y fiabilidad de los datos, y garantiza que cuando varios discos fallan, los datos no se perderán y el funcionamiento continuo del sistema no se verá afectado.
-
Gestión: De hecho, RAID es una tecnología de virtualización que virtualiza múltiples unidades de disco físicas en una unidad lógica de gran capacidad.unidad de disco de gran capacidad rápida y confiableDe esta manera, los usuarios pueden organizar y almacenar los datos del sistema de aplicaciones en esta unidad virtual. Desde la perspectiva de la aplicación del usuario, puede hacer que el sistema de almacenamiento sea simple y fácil de usar y administrar.Dado que RAID ha completado una gran cantidad de trabajo de gestión de almacenamiento internamente, el administrador solo necesita administrar una sola unidad virtual, lo que puede ahorrar mucho trabajo de administración.RAID puede agregar o eliminar unidades de disco dinámicamente y realizar automáticamente la verificación de datos y la reconstrucción de datos, lo que puede simplificar en gran medida el trabajo de gestión.