Al elegir un tipo de SCD para un almacén de datos, ¿qué cosas debe tener en cuenta? ¿Cómo afectan estos cambios a las tablas de hechos?

SCD – Dimensión que cambia lentamente. En la forma más simple de evaluar el tipo de SCD, lo primero y principal a considerar es si necesita mantener el historial en la dimensión.

Tipo 0: las filas de una tabla de tipo 0 son estáticas y no cambian.

Tipo 1: las filas de una tabla de tipo 1 son todas las últimas iteraciones de esos datos. Los datos antiguos se sobrescriben con nuevos

Tipo 2: las filas de una tabla de tipo 2 mantienen el historial de los datos y se incrementan mediante el uso de una fecha efectiva o una clave secuencial. Esto da como resultado cambios capturados en filas separadas.

Tipo 3: las filas de una tabla de tipo 3 usan una columna separada para los valores modificados que dan como resultado mantener un historial limitado. Cada fila es una única iteración de los datos con valores nuevos y antiguos.

Tipo 4: los datos históricos se mantienen en una tabla separada. La tabla actual mantiene una sola fila y todo o un subconjunto del historial se mantiene en una tabla separada.

Tipo 6 – Híbrido (Tipo 1 + Tipo 2 + Tipo 3). La tabla captura las filas históricas y el rol actual mantiene el valor actual y el valor anterior en dos filas separadas.

A partir de la decisión de mantener el historial – Tipo 1 u otros, los factores son la cantidad de iteraciones de datos modificados que necesita conservar, el volumen de cambios y el rendimiento de las consultas que acceden a las tablas.

La última consideración es en qué estado necesita ver las tablas de hechos. Si necesita mantener el contexto de los datos de hechos, debe mantener los datos dimensionales tal como estaban en el momento de los datos de hechos. Si no lo hace, entonces la imagen dimensional actual es suficiente.

Por ejemplo. Puede optar por no mantener el historial de datos dimensionales de la dirección porque todas las consultas deben conocer la dirección actual. En el comercio minorista, cuando las tiendas están cerradas a mediados del año financiero, debe cambiar los datos de hechos de ventas para reflejarlos en la ‘nueva’ tienda, por lo que mantener el historial de ese tipo de consultas es contraproducente.

Gracias por el A2A.

Algunas cosas importantes a tener en cuenta al diseñar dimensiones que cambian lentamente (SCD) en un almacén de datos.

  • ¿Qué cambios de columna / atributo desea rastrear? Si bien puede ser más fácil rastrear los cambios en cada columna para una dimensión determinada, algunas dimensiones son realmente amplias y el seguimiento de los cambios para cada columna puede aumentar el tamaño de la dimensión en un orden de magnitud. Por lo tanto, asegúrese de que el seguimiento de los cambios en ese atributo agregue valor.
  • Incluya indicadores para obtener el registro más reciente / activo y para responder consultas de “valor efectivo”. Esto generalmente se realiza agregando dos campos: Código de estado de registro para identificar el último valor (cuál es el precio actual de un producto). Fecha de vigencia y finalización para responder consultas como “cuál fue el precio del producto el 1 de enero de este año”
  • ¿Cómo almacena la referencia a las claves en la tabla de hechos? (¿Almacena el valor actual de la clave de dimensión o la clave de dimensión en el momento de la transacción? ¿Cuándo las actualiza?)

El último punto es importante desde una perspectiva de análisis, por lo que debe comprender qué preguntas se le pueden hacer a su modelo y luego diseñar el SCD y la tabla de hechos para responder esas preguntas.

More Interesting

Como científico de datos, ¿no está satisfecho con su carrera? ¿Por qué?

Si una persona no tiene un título universitario pero conoce muy bien la programación. ¿Hay alguna posibilidad de conseguir un trabajo?

Si se me da la opción de solicitar uno de los dos puestos en una empresa, uno para el que definitivamente estoy calificado y otro para el que puedo estar poco calificado, ¿para qué debo solicitar y por qué?

¿Cómo decide Uber en qué hora del día debería agregar más controladores? ¿Qué parámetros se utilizan para decidir? ¿Se basa en ceros, globos oculares, solicitudes o cualquier otra relación de parámetros?

¿Debo seleccionar mi carrera en el campo de TI?

¿Cómo se ingresa a la política estadounidense?

¿Es posible conseguir un trabajo de auxiliar de vuelo para una aerolínea europea como estadounidense?

¿En qué campos puede ser gerente de proyectos?

Cómo mejorarme a mí mismo, como estudiante de CS de una universidad de nivel 2 en India, cuando la mayoría de las empresas quieren estudiantes de IIT y NIT

¿Qué tipo de proyectos puedes incluir en tu currículum?

Cómo mantenerse al día después de mi MBA

¿Está bien estar desempleado por un tiempo y darse un tiempo para explorar las mejores opciones de carrera para usted?

¿Puedo tener un cambio de carrera / perfil uniéndome a un buen instituto (ISB, IIM, etc.) para un programa de MBA a tiempo completo de un año?

¿Cómo debo prepararme para el GNR escrito y la entrevista en IITB? ¿Debo ir a GNR si soy de un fondo CSE?

¿Es posible pasar de la consultoría tecnológica a la gestión de productos?