Mirroring Azure SQL Database


Mirroring en Fabric es una solución empresarial de tecnología SaaS, basada en la nube y sin la necesidad de ETL. En este artículo, exploraremos cómo configurar una base de datos Azure SQL reflejada, la cual genera una copia continuamente replicada y de solo lectura de los datos de Azure SQL Database en OneLake.
¿Cómo funciona el mirroring de Azure SQL Database en Fabric?
El mirroring de Azure SQL Database en Fabric asegura la constante actualización y disponibilidad de su base de datos SQL transaccional de origen en Fabric OneLake, proporcionando una base sólida para generación de informes, análisis avanzado, inteligencia artificial (IA) y ciencia de datos. El uso de Mirroring no implica configuraciones complejas ni procesos ETL. La configuración de la réplica se realiza desde la experiencia de Almacenamiento de Datos (Data Warehouse) de Fabric, donde se proporciona el servidor Azure SQL y los detalles de conexión de la base de datos. Además, se definen los datos que deben reflejarse en Fabric, ya sea toda la información o solo las tablas seleccionadas por el usuario. Una vez configurado, el proceso de mirroring está listo para funcionar. La duplicación de la base de datos Azure SQL genera una instantánea inicial en Fabric OneLake, seguida de la sincronización en tiempo casi real con cada transacción.
El Mirroring para Azure SQL Database se fundamenta en Change Data Capture (CDC) de SQL, optimizada para la arquitectura lake-centric. CDC registra los cambios localmente en la base de datos, mientras que Mirroring lee los datos del registro de transacciones de la base de datos recopilada y publica los datos de cambio en el almacenamiento OneLake. Estos datos de cambio se transforman en tablas delta que se integran en Fabric OneLake. Además, el Mirroring es compatible con operaciones DDL como añadir o eliminar columnas en las tablas reflejadas.
Mirroring Azure SQL Database
Habilitación de la identidad gestionada asignada por el sistema (SAMI) de su servidor lógico Azure SQL
La identidad gestionada asignada por el sistema (System Assigned Managed Identity (SAMI)) de su servidor lógico Azure SQL debe estar activada. Para configurar o verificar que SAMI está habilitada, siga estos pasos:
Vaya a su servidor lógico SQL en el portal de Azure.
En el menú de recursos, selecciona «Seguridad».
Luego, en la sección «Identidad», selecciona «Identidad gestionada asignada por el sistema».
Verificamos de que el estado esté establecido en On.
Crear una base de datos Azure SQL reflejada
En el portal de Microsoft Fabric, siga estos pasos:
Selecciona el icono «Crear» en la parte superior izquierda de la pantalla.
Ve hasta la sección Almacén de datos (Data Warehouse) y elige Mirrored Azure SQL Database.
Introduzca el nombre de la base de datos Azure SQL que desea reflejar.
Finalmente, haz clic en «Crear» para iniciar el proceso.
Selecciona Azure SQL Database en la opción de Nueva conexión o elija una conexión existente. Si se opta por crear una Nueva conexión, ingresa los detalles de la conexión a Azure SQL Database:
Servidor: Se puede encontrar el nombre del servidor navegando a la página Azure SQL Database Overview en el portal de Azure. Por ejemplo, «nombre-servidor.base-de-datos.windows.net».
Base de datos: Introduzca el nombre de su Azure SQL Database.
Conexión: Selecciona «Crear nueva conexión».
Nombre de la conexión: Se proporciona un nombre automático que puede cambiar.
Tipo de autenticación:
Básica (Autenticación SQL)
Cuenta de organización (Microsoft Entra ID)
Tenant ID (Azure Service Principal)
Haga clic en «Conectar» para completar el proceso.
Iniciar el proceso de mirroring
En la pantalla de configuración del mirroring, se reflejan todos los datos de la base de datos de forma predeterminada.
Al seleccionar Reflejar todos los datos (Mirror all data), se asegura que todas las tablas nuevas creadas después de iniciar el reflejo sean reflejadas automáticamente. Sin embargo, también tiene la opción de elegir reflejar solo ciertos objetos. Para ello, desactive la opción Reflejar todos los datos y seleccione las tablas individuales de su base de datos que desea reflejar.
Podemos visualizar las advertencias asociadas a cada tabla. En caso de que alguna columna no sea compatible, dicha columna no se replicará.
Selecciona Reflejar base de datos para iniciar el proceso de mirroring. Una vez iniciada la duplicación, selecciona Supervisar replicación (Monitor replication) para verificar el estado. Después de unos minutos, el estado debería cambiar a «En ejecución», indicando que las tablas están en proceso de sincronización.
Una vez completada la copia inicial de las tablas, aparecerá una fecha en la columna Última actualización (Last refresh). A partir de este punto, los datos reflejados en formato delta están listos para ser consumidos de inmediato en todas las experiencias de Fabric. Las funciones, como Power BI con el nuevo modo Direct Lake, Data Warehouse, Data Engineering, Lakehouse, KQL Database, Notebooks y copilot, funcionan de manera instantánea.
Aplicando cambios en la base de datos
A continuación, vamos a realizar cambios en la base de datos insertando registros y viendo como actúa el mirroring.
Revisamos la cantidad de registros de las siguientes tablas:
Generamos una nueva línea en cada tabla
Si regresamos a Microsoft Fabric y revisamos el monitor de la replicación, podremos observar cómo el total de filas replicadas ha aumentado.
Informe de Power BI con Direct Lake
Dado que el modo Direct Lake también permite la lectura directa de tablas Delta desde OneLake, la base de datos SQL reflejada está lista para ser utilizada con Power BI. Al acceder al endpoint de SQL Analytics, es posible crear un informe sobre la base de datos reflejada en modo Direct Lake.
Resumen
En resumen, el Mirroring en Fabric desempeña un papel crucial en la habilitación del análisis y la obtención de información a partir de los datos, garantizando la disponibilidad de los datos más recientes para el análisis, reduciendo el riesgo de discrepancias entre los datos de origen y los replicados, y siendo fundamental para el análisis predictivo y los modelos de IA que requieren datos actualizados.
Subscribe to my newsletter
Read articles from Kilian Baccaro Salinas directly inside your inbox. Subscribe to the newsletter, and don't miss out.
Written by
