Dela via


Spegling av Azure Cosmos DB

Mirroring i Microsoft Fabric ger en sömlös no-ETL-upplevelse för att integrera dina befintliga Azure Cosmos DB data med resten av dina data i Microsoft Fabric för sann hybridtransaktions-/analysbearbetning (HTAP) med fullständig arbetsbelastningsisolering mellan transaktions- och analyssystem. Dina Azure Cosmos DB data replikeras kontinuerligt direkt till Fabric OneLake nästan i realtid, utan prestandapåverkan på dina transaktionella arbetsbelastningar eller användning av enheter för begäranden (RU).

Data i OneLake lagras i deltaformat med öppen källkod och görs automatiskt tillgängliga för alla analysmotorer i Fabric.

Du kan använda inbyggda Power BI funktioner för att komma åt data i OneLake i DirectLake-läge. Med Copilot förbättringar i Fabric kan du använda kraften i generativ AI för att få viktiga insikter om dina affärsdata. Förutom Power BI kan du använda T-SQL för att köra komplexa aggregerade frågor eller använda Spark för datautforskning. Du kan sömlöst komma åt data i notebook-filer och använda datavetenskap för att skapa maskininlärningsmodeller.

Viktigt!

För närvarande stöds endast Azure Cosmos DB för NoSQL konton.

Varför använda spegling i Fabric?

Med spegling i Fabric behöver du inte pussla ihop olika tjänster från flera leverantörer. I stället kan du njuta av en mycket integrerad, heltäckande och lätthanterad produkt som är utformad för att förenkla dina analysbehov och skapa för öppenhet.

Om du letar efter BI-rapportering eller analys av dina driftdata i Azure Cosmos DB tillhandahåller spegling:

  • Ingen ETL, kostnadseffektiv nära realtidsåtkomst till dina Azure Cosmos DB data utan att påverka enhetsförbrukningen för begäran
  • Enkel att föra data över olika källor till Fabric OneLake
  • Deltatabelloptimeringar med v-order för blixtsnabba läsningar
  • Integrering med ett klick med Power BI med Direct Lake och Copilot
  • Omfattande affärsinsikter genom att koppla data mellan olika källor
  • Mer omfattande appintegrering för åtkomst till frågor och vyer

OneLake-data lagras i Delta Lake-formatet med öppen källkod, så att du kan använda dem med olika lösningar inom och utanför Microsoft. Det här dataformatet gör det enklare att skapa en enda dataegendom för dina analytiska behov.

Vilka analysupplevelser är inbyggda?

Speglade databaser är ett objekt i Fabric Data Warehousing som skiljer sig från slutpunkten för lager- och SQL-analys.

Diagram över Fabric Mirroring för Azure Cosmos DB.

Varje speglad Azure Cosmos DB objekt skapar de här objekten som du kan interagera med i din infrastrukturarbetsyta:

  • Det speglade databasobjektet. Spegling hanterar replikering av data till OneLake och konvertering till Parquet i ett analysklart format. Detta möjliggör nedströmsscenarier som datateknik, datavetenskap med mera.
  • SQL-analysslutpunkt, som genereras automatiskt

Spegeldatabas

Den speglade databasen visar replikeringsstatusen och kontrollerna för att stoppa eller starta replikeringen i Fabric OneLake. Du kan också visa källdatabasen i skrivskyddat läge med hjälp av datautforskaren i Azure Cosmos DB. Med datautforskaren kan du visa dina containrar i källdatabasen Azure Cosmos DB och köra frågor mot dem. Dessa åtgärder förbrukar enheter för begäranden (RU:er) från ditt Azure Cosmos DB-konto. Alla ändringar i källdatabasen återspeglas omedelbart i Fabrics källdatabasvy. Det går inte att skriva till källdatabasen från Fabric eftersom du bara kan visa data.

SQL-analysslutpunkt

Varje speglad databas har en autogenererad SQL-analysslutpunkt som ger en omfattande analysupplevelse ovanpå OneLakes Delta-tabeller som skapats av speglingsprocessen. Du har åtkomst till välbekanta T-SQL-kommandon som kan definiera och köra frågor mot dataobjekt men inte ändra data från SQL-analysslutpunkten, eftersom det är en skrivskyddad kopia.

Du kan utföra följande åtgärder i SQL-analysslutpunkten:

  • Utforska Delta Lake-tabeller med T-SQL. Varje tabell mappas till en container från din Azure Cosmos DB databas.
  • Skapa frågor och vyer utan kod och utforska dem visuellt utan att skriva en kodrad.
  • Koppla och fråga efter data i andra speglade databaser, datalager och lakehouses på samma arbetsyta.
  • Du kan enkelt visualisera och skapa BI-rapporter baserat på SQL-frågor eller vyer.

Förutom SQL-frågeredigeraren finns det ett brett ekosystem med verktyg. Dessa verktyg omfattar MSSQL-tillägget för Visual Studio Code, SQL Server Management Studio (SSMS) och även GitHub Copilot. Du kan förbättra och öka genereringen av analys och insikter med det verktyg du väljer.

Semantisk modell

Du kan skapa en Power BI semantisk modell i databasen så att affärsmått kan skapas, delas och återanvändas. Mer information finns i Skapa en Power BI semantisk modell.

Hur fungerar replikering i nära realtid?

När du aktiverar spegling på din Azure Cosmos DB databas replikeras kontinuerligt infognings-, uppdaterings- och borttagningsåtgärder på dina OLTP-data (Online Transaction Processing) till Fabric OneLake för analysförbrukning.

Funktionen för kontinuerlig säkerhetskopiering är en förutsättning för spegling. Du kan aktivera antingen 7- eller 30 dagars kontinuerlig säkerhetskopiering på ditt Azure Cosmos DB konto. Om du aktiverar kontinuerlig säkerhetskopiering specifikt för spegling rekommenderas 7 dagars kontinuerlig säkerhetskopiering, eftersom det är kostnadsfritt.

Anmärkning

Spegling använder inte Azure Cosmos DB analysarkiv eller ändringsflöde som en datainsamlingskälla för ändringar. Du kan fortsätta att använda dessa funktioner oberoende av varandra, tillsammans med spegling.

Det kan ta några minuter att replikera dina Azure Cosmos DB Data till Fabric OneLake. Beroende på dina datas första ögonblicksbild eller frekvensen för uppdateringar/borttagningar kan replikeringen också ta längre tid i vissa fall. Replikeringen påverkar inte de RUs (request units) som du allokerade för dina transaktionsarbetsbelastningar.

Vad du kan förvänta dig av spegling

Det finns några överväganden och stödda scenarier att tänka på innan du speglar.

Konfigurationsöverväganden

För att spegla en databas bör den redan ha tillhandahållits i Azure. Du måste aktivera kontinuerlig säkerhetskopiering av kontot som en förutsättning.

  • Du kan bara spegla varje databas individuellt i taget. Du kan välja vilken databas som ska speglas.
  • Du kan spegla samma databas flera gånger på samma arbetsyta. Som bästa praxis kan en enda kopia av databasen återanvändas i sjöhus, lager eller andra speglade databaser. Du behöver inte konfigurera flera speglar till samma databas.
  • Du kan också spegla samma databas på olika Fabric-arbetsytor eller klientorganisationer.
  • Du kan välja vilka containrar som ska speglas i databasen.
  • Ändringar i Azure Cosmos DB-containrar, till exempel att lägga till nya containrar och ta bort befintliga, replikeras sömlöst till Fabric. Du kan till exempel börja spegla en tom databas utan containrar, och speglingen hämtar sömlöst de containrar som läggs till vid en senare tidpunkt.

Stöd för kapslade data

Kapslade data visas som en JSON-sträng i SQL Analytics-slutpunktstabeller. Du kan använda OPENJSON, CROSS APPLYoch OUTER APPLY i T-SQL-frågor eller vyer för att expandera dessa data selektivt. Om du använder Power Query kan du även använda funktionen ToJson för att expandera dessa data.

Genom automatisk schemainferens kan kapslade data plattas ut OPENJSON utan att uttryckligen behöva definiera det kapslade schemat. Detta är särskilt användbart för arbetsbelastningar med dynamiska eller oförutsägbara kapslade scheman. Mer information finns i fråga efter kapslade data.

Hantera schemaändringar

Spegling replikerar automatiskt egenskaper mellan Azure Cosmos DB objekt med schemaändringar. Alla nya egenskaper som identifieras i ett objekt visas som nya kolumner och eventuella saknade egenskaper representeras som null i Fabric.

Om du byter namn på en egenskap i ett objekt behåller Fabric-tabeller både de gamla och nya kolumnerna. Den gamla kolumnen visar null och den nya visar det senaste värdet för alla objekt som replikeras efter namnbytet.

Om du ändrar datatypen för en egenskap i Azure Cosmos DB objekt stöds ändringarna för kompatibla datatyper som kan konverteras. Om datatyperna inte är kompatibla för konvertering i Delta representeras de som null-värden.

SQL-analysslutpunktstabeller konverterar Delta-datatyper till T-SQL-datatyper.

Duplicera kolumnnamn

Azure Cosmos DB stöder skiftlägesokänsliga kolumnnamn baserat på JSON-standarden. Spegling stöder dessa duplicerade kolumnnamn genom att lägga till _n till kolumnnamnet, där n skulle vara ett numeriskt värde.

Om det Azure Cosmos DB objektet till exempel har addressName och AddressName som unika egenskaper, har Fabric-tabeller motsvarande addressName och AddressName_1 kolumner. Mer information finns i replikeringsbegränsningar.

Stöd för AI-arbetsbelastningar

Azure Cosmos DB Spegling stöder konton som använder vektorsökning och indexering, vilket gör att AI- och maskininlärningsarbetsbelastningar kan dra full nytta av Microsoft Fabric kraftfulla analys – samtidigt som du fortsätter att utnyttja Azure Cosmos DB funktioner för högpresterande vektorer.

Mer information finns i dokumentationen om vektorsökning och indexering för Cosmos DB - och Fabric Data Science- och AI-upplevelser.

Security

Du kan ansluta till ett källkonto med hjälp av Microsoft Entra ID och rollbaserad åtkomstkontroll eller nycklar på kontonivå.

Om du använder nycklar och roterar eller återskapar nycklarna måste du uppdatera anslutningarna för att säkerställa att replikeringen fungerar. Mer information finns i anslutningar. Kontonycklar visas inte direkt för andra Fabric-användare när anslutningen har konfigurerats. Du kan begränsa vem som har åtkomst till de anslutningar som skapats i Fabric. Skrivningar tillåts inte till den Azure Cosmos DB-databasen från datautforskaren eller analysslutpunkten i den speglade databasen. Spegling stöder för närvarande inte autentisering med skrivskyddade kontonycklar.

För Microsoft Entra ID autentisering krävs följande RBAC-behörigheter: & . Mer information finns i dokumentationen om rollbaserad åtkomstkontroll för dataplanet.

Tips/Råd

När data har replikerats till Fabric OneLake bör du också skydda åtkomsten till dessa data.

Dataskyddsfunktioner

Granulär säkerhet kan konfigureras i den speglade databasen i Microsoft Fabric. Mer information finns i granular permissions in Microsoft Fabric.

Du kan skydda kolumnfilter och predikatbaserade radfilter på tabeller till roller och användare i Microsoft Fabric:

Du kan också maskera känsliga data från icke-administratörsanvändare med hjälp av dynamisk datamaskning:

Nätverkssäkerhet

Azure Cosmos DB-konton med virtuella nätverk eller privata slutpunkter stöds med Fabric-spegling med hjälp av funktionen Network ACL Bypass. På så sätt kan din auktoriserade infrastrukturarbetsyta komma åt Cosmos DB-kontot utan att kräva en datagateway, samtidigt som nätverkssäkerheten förbättras. Detaljerade konfigurationsinstruktioner finns i Konfigurera privata nätverk för Microsoft Fabric speglade databaser från Azure Cosmos DB.

För tillfället stöder spegling inte kundhanterade nycklar (CMK) i OneLake.

Haveriberedskap och replikeringsfördröjning

I Fabric kan du distribuera innehåll till datacenter i andra regioner än den primära regionen för Fabric-klientorganisationen. Mer information finns i multi-geo-stöd.

För ett Azure Cosmos DB konto med en primär skrivregion och flera läsregioner väljer spegling den Azure Cosmos DB läsregion som är närmast den region där infrastrukturresurserna har konfigurerats. Det här valet hjälper till att ge replikering med låg latens för spegling.

När du växlar ditt Azure Cosmos DB konto till en återställningsregion väljer spegling automatiskt den närmaste Azure Cosmos DB regionen igen.

Anmärkning

Spegling stöder inte konton med flera skrivregioner.

Dina Cosmos DB-data som replikeras till OneLake måste konfigureras för att hantera regionomfattande avbrott. Mer information finns i Haveriberedskap i OneLake.

Utforska dina data med spegling

Du kan visa och komma åt speglade data direkt i OneLake. Du kan också sömlöst komma åt speglade data utan ytterligare dataflytt.

Läs mer om hur du kommer åt OneLake med api:er för ADLS Gen2 eller SDK, OneLake File Explorer och Azure Storage explorer.

Du kan ansluta till SQL-analysslutpunkten från verktyg som SQL Server Management Studio (SSMS) eller använda drivrutiner som Microsoft Open Database Connectivity (ODBC) och Java Database Connectivity (JDBC). Mer information finns i SQL Analytics-slutpunktsanslutning.

Du kan också komma åt speglade data med tjänster som:

  • Azure tjänster som Azure Databricks, Azure HDInsight eller Azure Synapse Analytics
  • Fabric Lakehouse med genvägar för datahantering och datavetenskapliga tillämpningar
  • Andra speglade databaser eller datavaruhus i arbetsytan Fabric

Du kan också bygga medallion-arkitekturlösningar och rensa och transformera data som landar i en replikerad databas, vilket utgör bronsskiktet. Mer information finns i stöd för medaljongarkitektur i Fabric.

Pricing

Fabric compute som används för att replikera dina Cosmos DB-data i Fabric OneLake är kostnadsfri. Lagring i OneLake är kostnadsfritt baserat på kapacitetsstorleken. Mer information finns i OneLake-priser för spegling. Beräkningsanvändningen för att fråga efter data via SQL, Power BI eller Spark debiteras fortfarande baserat på infrastrukturresursernas kapacitet.

Om du använder datautforskaren i Fabric-spegling ackumulerar du typiska kostnader baserat på ru-användning (request unit) för att utforska containrarna och fråga objekten i källdatabasen Azure Cosmos DB. Funktionen Azure Cosmos DB kontinuerlig säkerhetskopiering är en förutsättning för spegling: Standardavgifter för kontinuerlig säkerhetskopiering gäller. Det tillkommer inga extra avgifter för spegling vid fakturering av kontinuerlig säkerhetskopiering. Mer information finns i Azure Cosmos DB prissättning.

Nästa steg