Vectorwinkel in Azure Cosmos DB voor MongoDB vCore

2025-05-19
Van toepassing op: ✅ MongoDB vCore

Gebruik de Integrated Vector Database in Azure Cosmos DB for MongoDB (vCore) om uw AI-toepassingen naadloos te verbinden met uw gegevens die zijn opgeslagen in Azure Cosmos DB. Deze integratie kan apps bevatten die u hebt gemaakt met behulp van Azure OpenAI-insluitingen. Met de systeemeigen geïntegreerde vectordatabase kunt u efficiënt high-dimensionale vectorgegevens opslaan, indexeren en er query's op uitvoeren die rechtstreeks zijn opgeslagen in Azure Cosmos DB voor MongoDB (vCore), samen met de oorspronkelijke gegevens waaruit de vectorgegevens worden gemaakt. Het elimineert de noodzaak om uw gegevens over te dragen naar alternatieve vectorarchieven en extra kosten in rekening te brengen.

Wat is een vectoropslag?

Een vectorarchief of vectordatabase is een database die is ontworpen voor het opslaan en beheren van vector-insluitingen, die wiskundige representaties van gegevens in een hoogdimensionale ruimte zijn. In deze ruimte komt elke dimensie overeen met een functie van de gegevens en kunnen tienduizenden dimensies worden gebruikt om geavanceerde gegevens weer te geven. De positie van een vector in deze ruimte vertegenwoordigt de kenmerken. Woorden, woordgroepen of volledige documenten en afbeeldingen, audio en andere typen gegevens kunnen allemaal worden gevectoriseerd.

Hoe werkt een vectoropslag?

In een vectorarchief worden vectorzoekalgoritmen gebruikt om insluitingen te indexeren en op te vragen. Sommige bekende vectorzoekalgoritmen omvatten Hiërarchische Navigable Small World (HNSW), Inverted File (IVF), DiskANN, enzovoort. Vectorzoekopdracht is een methode waarmee u vergelijkbare items kunt vinden op basis van hun data-eigenschappen in plaats van op basis van exacte overeenkomsten in een eigenschapsveld. Deze techniek is handig in toepassingen zoals het zoeken naar vergelijkbare tekst, het vinden van gerelateerde afbeeldingen, het maken van aanbevelingen of zelfs het detecteren van afwijkingen. Het wordt gebruikt om een query uit te voeren op de vector-insluitingen (lijsten met getallen) van uw gegevens die u hebt gemaakt met behulp van een machine learning-model met behulp van een insluitings-API. Voorbeelden van insluitings-API's zijn Azure OpenAI Embeddings of Hugging Face in Azure. Vectorzoekopdrachten meten de afstand tussen de gegevensvectoren en uw queryvector. De datavectoren die zich het dichtst bij uw zoekvector bevinden, zijn degene die het meest semantisch vergelijkbaar zijn.

In de Integrated Vector Database in Azure Cosmos DB for MongoDB (vCore) kunnen insluitingen naast de oorspronkelijke gegevens worden opgeslagen, geïndexeerd en opgevraagd. Deze aanpak elimineert de extra kosten voor het repliceren van gegevens in een afzonderlijke pure vectordatabase. Bovendien houdt deze architectuur de vector insluitingen en oorspronkelijke gegevens bij elkaar, waardoor multimodale gegevensbewerkingen beter worden gefaciliteerd en betere gegevensconsistentie, schaal en prestaties mogelijk zijn.

Vector Similarity-zoekopdracht uitvoeren

Azure Cosmos DB voor MongoDB (vCore) biedt robuuste vectorzoekmogelijkheden, zodat u snelle overeenkomsten kunt uitvoeren in complexe gegevenssets. Als u vectorzoekopdrachten wilt uitvoeren in Azure Cosmos DB voor MongoDB, moet u eerst een vectorindex maken. Hoewel Azure Cosmos DB voor MongoDB (vCore) meerdere opties biedt, vindt u hier enkele algemene richtlijnen om aan de slag te gaan op basis van de grootte van uw gegevensset:

	IVF	HNSW	DiskANN (aanbevolen)
Beschrijving	Een IVFFlat-index verdeelt vectoren in lijsten en doorzoekt vervolgens een subset die zich het dichtst bij de queryvector bevindt.	Een HNSW-index maakt een graaf met meerdere lagen.	DiskANN is een benaderde dichtstbijzijnde buurzoekalgoritme dat is ontworpen voor efficiënte vectorzoekopdracht op elke schaal.
Belangrijke afwegingen	Pros: Snellere buildtijden, lager geheugengebruik. Nadelen: Lagere queryprestaties (wat betreft de afweging tussen snelheid en nauwkeurigheid).	Pros: Betere queryprestaties (in termen van snelheid-herinnerings-afweging), kan worden gecreëerd op een lege tabel. Tegens: Tragere buildtijden, hoger geheugengebruik.	Voordelen: Efficiënt op elke schaal, hoge recall, hoge doorvoer, lage latentie.
Aantal vectoren	Minder dan 10.000	Tot 50.000	Tot 500.000+
Aanbevolen clusterlaag	M10 of M20	M30 en hoger	M30 en hoger

DiskANN-indexen zijn beschikbaar op M30-lagen en hoger. Om de DiskANN-index te maken, stelt u de "kind"-parameter in volgens de volgende sjabloon: "vector-diskann"

{ 
    "createIndexes": "<collection_name>",
    "indexes": [
        {
            "name": "<index_name>",
            "key": {
                "<path_to_property>": "cosmosSearch"
            },
            "cosmosSearchOptions": { 
                "kind": "vector-diskann", 
                "dimensions": <integer_value>,
                "similarity": <string_value>,
                "maxDegree" : <integer_value>, 
                "lBuild" : <integer_value>, 
            } 
        } 
    ] 
}

Veld	Typologie	Omschrijving
`index_name`	tekenreeks	Unieke naam van de index.
`path_to_property`	tekenreeks	Pad naar de eigenschap die de vector bevat. Dit pad kan een topniveaueigenschap of een puntnotatiepad naar de eigenschap zijn. Vectoren moeten worden `number[]` geïndexeerd en gebruikt in vectorzoekresultaten. Als u een ander type gebruikt, zoals `double[]`, voorkomt u dat het document wordt geïndexeerd. Niet-geïndexeerde documenten worden niet geretourneerd in het resultaat van een vectorzoekactie.
`kind`	tekenreeks	Type vectorindex dat moet worden gemaakt. De opties zijn `vector-ivf`, `vector-hnsw`en `vector-diskann`.
`dimensions`	geheel getal	Aantal dimensies voor vector-gelijkenis. DiskANN ondersteunt maximaal 16.000 dimensies (met Product Quantization), met toekomstige ondersteuning gepland voor 40.000+.
`similarity`	tekenreeks	Overeenkomstmetriek om te gebruiken met de index. Mogelijke opties zijn `COS` (cosinusafstand), `L2` (Euclidische afstand) en `IP` (binnenste product).
`maxDegree`	geheel getal	Maximum aantal randen per knooppunt in de grafiek. Deze parameter varieert van 20 tot 2048 (standaard is 32). Hoger `maxDegree` is geschikt voor gegevenssets met hoge dimensionaliteit en/of hoge nauwkeurigheidsvereisten.
`lBuild`	geheel getal	Hiermee stelt u het aantal kandidaat-buren in dat tijdens de opbouw van de DiskANN-index wordt geëvalueerd. Deze parameter, die varieert van 10 tot 500 (standaard 50), zorgt voor balans tussen nauwkeurigheid en rekenoverhead: hogere waarden verbeteren de kwaliteit en nauwkeurigheid van de index, maar verhogen de buildtijd

Een vectorzoekopdracht uitvoeren met DiskANN

Als u een vectorzoekopdracht wilt uitvoeren, gebruikt u de fase van de $search aggregatiepijplijn en voert u een query uit met de cosmosSearch operator. DiskANN maakt zoekopdrachten met hoge prestaties mogelijk in grote gegevenssets met optionele filters, zoals georuimtelijke of op tekst gebaseerde filters.

{
  "$search": {
    "cosmosSearch": {
      "path": "<path_to_property>",
      "query": "<query_vector>",  
      "k": <num_results_to_return>,  
      "filter": {"$and": [
        { "<attribute_1>": { "$eq": <value> } },
        {"<location_attribute>": {"$geoWithin": {"$centerSphere":[[<longitude_integer_value>, <latitude_integer_value>], <radius>]}}}
      ]}
    }
  }
},

Veld	Typologie	Omschrijving
`lSearch`	geheel getal	Hiermee specificeert u de grootte van de dynamische kandidatenlijst voor de zoekopdracht. De standaardwaarde is `40`, met een configureerbaar bereik van `10` tot `1000`. Het verhogen van de waarde verbetert de herinnering, maar kan de zoeksnelheid verminderen.
`k`	geheel getal	Hiermee definieert u het aantal zoekresultaten dat moet worden geretourneerd. De `k` waarde moet kleiner dan of gelijk zijn aan `lSearch`.

Voorbeeld van een DiskANN-index met filteren

Vectoren toevoegen aan uw database

Als u vectorzoekopdrachten wilt gebruiken met georuimtelijke filters, voegt u documenten toe die zowel vectorinsluitingen als locatiecoördinaten bevatten. U kunt de insluitingen maken met behulp van uw eigen model, Azure OpenAI Embeddings of een andere API (zoals Hugging Face in Azure).

from pymongo import MongoClient

client = MongoClient("<your_connection_string>")
db = client["test"]
collection = db["testCollection"]

documents = [
    {"name": "Eugenia Lopez", "bio": "CEO of AdventureWorks", "is_open": 1, "location": [-118.9865, 34.0145], "contentVector": [0.52, 0.20, 0.23]},
    {"name": "Cameron Baker", "bio": "CFO of AdventureWorks", "is_open": 1, "location": [-0.1278, 51.5074], "contentVector": [0.55, 0.89, 0.44]},
    {"name": "Jessie Irwin", "bio": "Director of Our Planet initiative", "is_open": 0, "location": [-118.9865, 33.9855], "contentVector": [0.13, 0.92, 0.85]},
    {"name": "Rory Nguyen", "bio": "President of Our Planet initiative", "is_open": 1, "location": [-119.0000, 33.9855], "contentVector": [0.91, 0.76, 0.83]}
]

collection.insert_many(documents)

Een DiskANN-vectorindex maken

In het volgende voorbeeld ziet u hoe u een DiskANN-vectorindex instelt met filtermogelijkheden. Dit omvat het maken van de vectorindex voor overeenkomsten zoeken, het toevoegen van documenten met vector- en georuimtelijke eigenschappen en het indexeren van velden voor extra filtering.

db.command({
    "createIndexes": "testCollection",
    "indexes": [
        {
            "name": "DiskANNVectorIndex",
            "key": {
                "contentVector": "cosmosSearch"
            },
            "cosmosSearchOptions": {
                "kind": "vector-diskann",
                "dimensions": 3,
                "similarity": "COS",
                "maxDegree": 32,
                "lBuild": 64
            }
        },
        { 
            "name": "is_open",
            "key": { 
                "is_open": 1 
            }      
        },
        {
            "name": "locationIndex",
            "key": {
                "location": 1
            }
        }
    ]
})

Met deze opdracht maakt u een DiskANN-vectorindex op het veld contentVector in exampleCollection, waardoor gelijkeniszoekopdrachten worden mogelijk gemaakt. Er wordt ook het volgende toegevoegd:

Een index op het is_open veld, zodat u resultaten kunt filteren op basis van of bedrijven open zijn.
Een georuimtelijke index in het location veld om te filteren op geografische nabijheid.

Een vectorzoekopdracht uitvoeren

Als u documenten wilt zoeken met vergelijkbare vectoren binnen een specifieke geografische radius, geeft u het queryVector zoeken naar overeenkomsten op en voegt u een georuimtelijk filter toe.

query_vector = [0.52, 0.28, 0.12]
pipeline = [
    {
        "$search": {
            "cosmosSearch": {
                "path": "contentVector",
                "vector": query_vector,
                "k": 5,
                "filter": {
                    "$and": [
                        {"is_open": {"$eq": 1}},
                        {"location": {"$geoWithin": {"$centerSphere": [[-119.7192861804, 34.4102485028], 100 / 3963.2]}}}
                    ]
                }
            }
        }
    }
]

results = list(collection.aggregate(pipeline))
for result in results:
    print(result)

In dit voorbeeld retourneert de vector-gelijkeniszoekopdracht de meest k dichtstbijzijnde vectoren op basis van de opgegeven COS overeenkomstwaarde, terwijl het filteren van resultaten alleen open bedrijven binnen een straal van 100 mijl bevat.

[
  {
    similarityScore: 0.9745354109084544,
    document: {
      _id: ObjectId("645acb54413be5502badff94"),
      name: 'Eugenia Lopez',
      bio: 'CEO of AdventureWorks',
      is_open: 1,
      location: [-118.9865, 34.0145],
      contentVector: [0.52, 0.20, 0.23]
    }
  },
  {
    similarityScore: 0.9006955671333992,
    document: {
      _id: ObjectId("645acb54413be5502badff97"),
      name: 'Rory Nguyen',
      bio: 'President of Our Planet initiative',
      is_open: 1,
      location: [-119.7302, 34.4005],
      contentVector: [0.91, 0.76, 0.83]
    }
  }
]

Dit resultaat toont de meest vergelijkbare documenten voor queryVector, beperkt tot een straal van 100 mijl en bedrijven die open zijn. Elk resultaat bevat de overeenkomstenscore en metagegevens, waarmee wordt gedemonstreerd hoe DiskANN in Cosmos DB voor MongoDB gecombineerde vector- en georuimtelijke query's ondersteunt voor verrijkte, locatiegevoelige zoekervaringen.

U kunt HNSW-indexen (Hierarchical Navigable Small World) maken op M30-clusterlagen en hoger. Om de HSNW-index te maken, moet u een vectorindex maken met de "kind"-parameter ingesteld op "vector-hnsw" volgens de onderstaande sjabloon:

{ 
    "createIndexes": "<collection_name>",
    "indexes": [
        {
            "name": "<index_name>",
            "key": {
                "<path_to_property>": "cosmosSearch"
            },
            "cosmosSearchOptions": { 
                "kind": "vector-hnsw", 
                "m": <integer_value>, 
                "efConstruction": <integer_value>, 
                "similarity": "<string_value>", 
                "dimensions": <integer_value> 
            } 
        } 
    ] 
}

Veld	Typologie	Omschrijving
`m`	geheel getal	Het maximum aantal verbindingen per laag (`16` standaard minimumwaarde is `2`, maximumwaarde is `100`). Hogere m is geschikt voor gegevenssets met hoge dimensionaliteit en/of hoge nauwkeurigheidsvereisten.
`efConstruction`	geheel getal	de grootte van de dynamische kandidaatlijst voor het maken van de grafiek (`64` standaard is de minimumwaarde , `4`maximumwaarde is `1000`). Hoger `efConstruction` resulteert in betere indexkwaliteit en hogere nauwkeurigheid, maar het verhoogt ook de tijd die nodig is om de index te bouwen. `efConstruction` moet ten minste `2 * m`

Een vectorzoekopdracht uitvoeren met HNSW

Als u een vectorzoekopdracht wilt uitvoeren, gebruikt u de $search aggregatiepijplijnfase van de query met de cosmosSearch operator.

{
    "$search": {
        "cosmosSearch": {
            "vector": <query_vector>,
            "path": "<path_to_property>",
            "k": <num_results_to_return>,
            "efSearch": <integer_value>
        },
    }
}

Veld	Typologie	Omschrijving
`efSearch`	geheel getal	De grootte van de dynamische lijst met kandidaten voor zoeken (`40` standaard). Een hogere waarde biedt een betere terugroepactie ten koste van snelheid.

Notitie

Het maken van een HSNW-index met grote gegevenssets kan ertoe leiden dat uw Azure Cosmos DB voor MongoDB vCore-resource onvoldoende geheugen heeft of de prestaties van andere bewerkingen die in uw database worden uitgevoerd, kan worden beperkt. Als u dergelijke problemen ondervindt, kunnen deze worden beperkt door uw resource te schalen naar een hogere clusterlaag of door een nieuwe DiskANN-vectorindex te maken.

Voorbeeld van een HNSW-index

In de volgende voorbeelden ziet u hoe u vectoren indexeert, documenten toevoegt die vectoreigenschappen hebben, een vectorzoekopdracht uitvoert en de indexconfiguratie ophaalt.

use test;

db.createCollection("exampleCollection");

db.runCommand({ 
    "createIndexes": "exampleCollection",
    "indexes": [
        {
            "name": "VectorSearchIndex",
            "key": {
                "contentVector": "cosmosSearch"
            },
            "cosmosSearchOptions": { 
                "kind": "vector-hnsw", 
                "m": 16, 
                "efConstruction": 64, 
                "similarity": "COS", 
                "dimensions": 3
            } 
        } 
    ] 
});

Met deze opdracht maakt u een HNSW-index op basis van de contentVector eigenschap in de documenten die zijn opgeslagen in de opgegeven verzameling, exampleCollection. Met cosmosSearchOptions de eigenschap worden de parameters voor de HNSW-vectorindex opgegeven. Als in uw document de vector is opgeslagen in een genest eigenschap, kunt u deze eigenschap instellen met behulp van een puntnotatie-pad. U kunt bijvoorbeeld gebruiken text.contentVector als contentVector een subeigenschap van text.

Vectoren toevoegen aan uw database

Als u vectoren wilt toevoegen aan de verzameling van uw database, moet u eerst de insluitingen maken met behulp van uw eigen model, Azure OpenAI Embeddings of een andere API (zoals Hugging Face in Azure). In dit voorbeeld worden nieuwe documenten toegevoegd via voorbeeld-insluitingen:

db.exampleCollection.insertMany([
  {name: "Eugenia Lopez", bio: "Eugenia is the CEO of AdvenureWorks.", contentVector: [0.51, 0.12, 0.23]},
  {name: "Cameron Baker", bio: "Cameron Baker CFO of AdvenureWorks.", contentVector: [0.55, 0.89, 0.44]},
  {name: "Jessie Irwin", bio: "Jessie Irwin is the former CEO of AdventureWorks and now the director of the Our Planet initiative.", contentVector: [0.13, 0.92, 0.85]},
  {name: "Rory Nguyen", bio: "Rory Nguyen is the founder of AdventureWorks and the president of the Our Planet initiative.", contentVector: [0.91, 0.76, 0.83]},
]);

Een vectorzoekopdracht uitvoeren

Als u doorgaat met het laatste voorbeeld, maakt u een andere vector. queryVector Vectorzoekopdrachten meten de afstand tussen queryVector en de vectoren in het contentVector pad van uw documenten. U kunt het aantal resultaten instellen dat de zoekopdracht retourneert door de parameter kin te stellen, die hier is ingesteld 2 . U kunt ook instellen efSearch, wat een geheel getal is dat de grootte van de kandidaatvectorlijst bepaalt. Een hogere waarde kan de nauwkeurigheid verbeteren, maar de zoekopdracht zal hierdoor langzamer zijn. Dit is een optionele parameter met een standaardwaarde van 40.

const queryVector = [0.52, 0.28, 0.12];
db.exampleCollection.aggregate([
  {
    "$search": {
        "cosmosSearch": {
            "vector": queryVector,
            "path": "contentVector",
            "k": 2,
            "efSearch": 40
        },
    }
  }
}
]);

In dit voorbeeld wordt een vectorzoekopdracht uitgevoerd met behulp van queryVector als invoer via de Mongo-shell. Het zoekresultaat is een lijst met twee items die het meest lijken op de queryvector, gesorteerd op hun overeenkomstenscores.

[
  {
    similarityScore: 0.9465376,
    document: {
      _id: ObjectId("645acb54413be5502badff94"),
      name: 'Eugenia Lopez',
      bio: 'Eugenia is the CEO of AdvenureWorks.',
      vectorContent: [ 0.51, 0.12, 0.23 ]
    }
  },
  {
    similarityScore: 0.9006955,
    document: {
      _id: ObjectId("645acb54413be5502badff97"),
      name: 'Rory Nguyen',
      bio: 'Rory Nguyen is the founder of AdventureWorks and the president of the Our Planet initiative.',
      vectorContent: [ 0.91, 0.76, 0.83 ]
    }
  }
]

Als u een vectorindex wilt maken met behulp van het IVF-algoritme (omgekeerd bestand), gebruikt u de volgende createIndexes sjabloon en stelt u de "kind" parameter in "vector-ivf"op:

{
  "createIndexes": "<collection_name>",
  "indexes": [
    {
      "name": "<index_name>",
      "key": {
        "<path_to_property>": "cosmosSearch"
      },
      "cosmosSearchOptions": {
        "kind": "vector-ivf",
        "numLists": <integer_value>,
        "similarity": "<string_value>",
        "dimensions": <integer_value>
      }
    }
  ]
}

Veld	Typologie	Omschrijving
`numLists`	geheel getal	Dit gehele getal is het aantal clusters dat door de IVF-index (omgekeerd bestand) wordt gebruikt om de vectorgegevens te groeperen. We raden aan `numLists` in te stellen voor maximaal 1 miljoen documenten en `documentCount/1000` voor meer dan 1 miljoen documenten `sqrt(documentCount)`. Het gebruik van een `numLists` waarde van `1` is vergelijkbaar met het uitvoeren van brute-force zoekopdrachten, wat beperkte prestaties oplevert.

Belangrijk

Het correct instellen van de parameter numLists is belangrijk voor het bereiken van een goede nauwkeurigheid en prestaties. We raden aan dat numLists wordt ingesteld op documentCount/1000 voor maximaal 1 miljoen documenten. Voor meer dan 1 miljoen documenten raden we u aan de DiskANN-vectorindex te gebruiken voor optimale resultaten.

Naarmate het aantal items in uw database groeit, moet u numLists afstemmen op groter om goede latentieprestaties voor vectorzoekopdrachten te bereiken.

Als u experimenteert met een nieuw scenario of een kleine demo maakt, kunt u beginnen door numLists in te stellen op 1 om een brute-force zoekopdracht op alle vectoren uit te voeren. Dit moet u de meest nauwkeurige resultaten van de vectorzoekopdracht bieden, maar houd er rekening mee dat de zoeksnelheid en latentie traag zijn. Na de eerste installatie moet u de numLists parameter afstemmen met behulp van de bovenstaande richtlijnen.

Een vectorzoekopdracht uitvoeren met IVF

Als u een vectorzoekopdracht wilt uitvoeren, gebruikt u de fase van de $search aggregatiepijplijn in een MongoDB-query. Als u de cosmosSearch index wilt gebruiken, gebruikt u de nieuwe cosmosSearch operator.

{
  {
  "$search": {
    "cosmosSearch": {
        "vector": <query_vector>,
        "path": "<path_to_property>",
        "k": <num_results_to_return>,
      },
      "returnStoredSource": True }},
  {
    "$project": { "<custom_name_for_similarity_score>": {
           "$meta": "searchScore" },
            "document" : "$$ROOT"
        }
  }
}

Om de overeenkomstenscore (searchScore) samen met de documenten die door de vectorzoekopdracht zijn gevonden op te halen, gebruikt u de $project-operator om searchScore op te nemen en deze als <custom_name_for_similarity_score> in de resultaten te hernoemen. Dan wordt het document ook als een genest object geprojecteerd. Houd er rekening mee dat de overeenkomstscore wordt berekend met behulp van de metrische waarde die is gedefinieerd in de vectorindex.

Belangrijk

Vectors moeten een number[] zijn om geïndexeerd te worden. Als u een ander type gebruikt, zoals double[], voorkomt u dat het document wordt geïndexeerd. Niet-geïndexeerde documenten worden niet geretourneerd in het resultaat van een vectorzoekactie.

Voorbeeld van een IVF-index

Indexering van omgekeerd bestand (IVF) is een methode die vectoren in clusters ordent. Tijdens een vectorzoekopdracht wordt de queryvector eerst vergeleken met de centra van deze clusters. De zoekopdracht wordt vervolgens uitgevoerd in het cluster waarvan het midden zich het dichtst bij de queryvector bevindt.

De numListparameter s bepaalt het aantal clusters dat moet worden gemaakt. Eén cluster impliceert dat de zoekopdracht wordt uitgevoerd op alle vectoren in de database, vergelijkbaar met een brute-force of kNN-zoekopdracht. Deze instelling biedt de hoogste nauwkeurigheid, maar ook de hoogste latentie.

Het verhogen van de numLists waarde resulteert in meer clusters, elk met minder vectoren. Bijvoorbeeld, als numLists=2, bevat elk cluster meer vectoren dan wanneer numLists=3, enzovoort. Minder vectoren per cluster versnellen de zoekopdracht (lagere latentie, hogere query's per seconde). Dit verhoogt echter de kans dat de meest vergelijkbare vector in uw database ontbreekt bij de queryvector. Dit komt door de onvolmaakte aard van clustering, waarbij de zoekopdracht zich mogelijk richt op één cluster terwijl de werkelijke 'dichtstbijzijnde' vector zich in een ander cluster bevindt.

De nProbes parameter bepaalt het aantal clusters dat moet worden doorzocht. Deze is standaard ingesteld op 1, wat betekent dat alleen het cluster met het midden het dichtst bij de queryvector wordt gezocht. Door deze waarde te verhogen, kan de zoekopdracht meer clusters omvatten, de nauwkeurigheid verbeteren, maar ook de latentie verhogen (dus query's per seconde verlagen) naarmate er meer clusters en vectoren worden doorzocht.

In de volgende voorbeelden ziet u hoe u vectoren indexeert, documenten toevoegt die vectoreigenschappen hebben, een vectorzoekopdracht uitvoert en de indexconfiguratie ophaalt.

Een vectorindex maken

use test;

db.createCollection("exampleCollection");

db.runCommand({
  createIndexes: 'exampleCollection',
  indexes: [
    {
      name: 'vectorSearchIndex',
      key: {
        "vectorContent": "cosmosSearch"
      },
      cosmosSearchOptions: {
        kind: 'vector-ivf',
        numLists: 3,
        similarity: 'COS',
        dimensions: 3
      }
    }
  ]
});

Met deze opdracht maakt u een vector-ivf index op basis van de vectorContent eigenschap in de documenten die zijn opgeslagen in de opgegeven verzameling. exampleCollection De cosmosSearchOptions eigenschap geeft de parameters voor de IVF-vectorindex op. Als in uw document de vector is opgeslagen in een genest eigenschap, kunt u deze eigenschap instellen met behulp van een puntnotatie-pad. U kunt bijvoorbeeld gebruiken text.vectorContent als vectorContent een subeigenschap van text.

Vectoren toevoegen aan uw database

db.exampleCollection.insertMany([
  {name: "Eugenia Lopez", bio: "Eugenia is the CEO of AdvenureWorks.", vectorContent: [0.51, 0.12, 0.23]},
  {name: "Cameron Baker", bio: "Cameron Baker CFO of AdvenureWorks.", vectorContent: [0.55, 0.89, 0.44]},
  {name: "Jessie Irwin", bio: "Jessie Irwin is the former CEO of AdventureWorks and now the director of the Our Planet initiative.", vectorContent: [0.13, 0.92, 0.85]},
  {name: "Rory Nguyen", bio: "Rory Nguyen is the founder of AdventureWorks and the president of the Our Planet initiative.", vectorContent: [0.91, 0.76, 0.83]},
]);

Een vectorzoekopdracht uitvoeren

{
  {
  "$search": {
    "cosmosSearch": {
        "vector": <vector_to_search>,
        "path": "<path_to_property>",
        "k": <num_results_to_return>,
      },
      "returnStoredSource": True }},
  {
    "$project": { "<custom_name_for_similarity_score>": {
           "$meta": "searchScore" },
            "document" : "$$ROOT"
        }
  }
}

Queryvectoren en vectorafstanden (similariteitsscores) met behulp van $search

Als u doorgaat met het laatste voorbeeld, maakt u een andere vector. queryVector Vectorzoekopdrachten meten de afstand tussen queryVector en de vectoren in het vectorContent pad van uw documenten. U kunt het aantal resultaten instellen dat de zoekopdracht retourneert door de parameter kin te stellen, die hier is ingesteld 2 . U kunt ook een geheel getal instellen nProbeswaarmee het aantal clusters in de buurt wordt bepaald dat in elke zoekopdracht wordt geïnspecteerd. Een hogere waarde kan de nauwkeurigheid verbeteren, maar de zoekopdracht zal hierdoor langzamer zijn. Dit is een optionele parameter met een standaardwaarde van 1 en kan niet groter zijn dan de numLists waarde die is opgegeven in de vectorindex.

const queryVector = [0.52, 0.28, 0.12];
db.exampleCollection.aggregate([
  {
    $search: {
      "cosmosSearch": {
        "vector": queryVector,
        "path": "vectorContent",
        "k": 2
      },
    "returnStoredSource": true }},
  {
    "$project": { "similarityScore": {
           "$meta": "searchScore" },
            "document" : "$$ROOT"
        }
  }
]);

[
  {
    similarityScore: 0.9465376,
    document: {
      _id: ObjectId("645acb54413be5502badff94"),
      name: 'Eugenia Lopez',
      bio: 'Eugenia is the CEO of AdvenureWorks.',
      vectorContent: [ 0.51, 0.12, 0.23 ]
    }
  },
  {
    similarityScore: 0.9006955,
    document: {
      _id: ObjectId("645acb54413be5502badff97"),
      name: 'Rory Nguyen',
      bio: 'Rory Nguyen is the founder of AdventureWorks and the president of the Our Planet initiative.',
      vectorContent: [ 0.91, 0.76, 0.83 ]
    }
  }
]

Vectorindexdefinities ophalen

Gebruik de listIndexes opdracht om uw vectorindexdefinitie op te halen uit de verzameling:

db.exampleCollection.getIndexes();

In dit voorbeeld vectorIndex wordt geretourneerd met alle cosmosSearch parameters die zijn gebruikt om de index te maken:

[
  { v: 2, key: { _id: 1 }, name: '_id_', ns: 'test.exampleCollection' },
  {
    v: 2,
    key: { vectorContent: 'cosmosSearch' },
    name: 'vectorSearchIndex',
    cosmosSearch: {
      kind: <index_type>, // options are `vector-ivf`, `vector-hnsw`, and `vector-diskann`
      numLists: 3,
      similarity: 'COS',
      dimensions: 3
    },
    ns: 'test.exampleCollection'
  }
]

Gefilterde vectorzoekopdrachten

U kunt nu vectorzoekopdrachten uitvoeren met elk ondersteund queryfilter zoals $lt, , $lte$eq, $neq, $gte, $gt, , $inen $nin$regex.

Als u vooraf filteren wilt gebruiken, moet u eerst een standaardindex definiëren voor de eigenschap waarop u wilt filteren, naast uw vectorindex. Hier volgt een voorbeeld van het maken van een filterindex:

db.runCommand({
  "createIndexes": "<collection_name>",
  "indexes": [ {
    "key": {
      "<property_to_filter>": 1
    },
    "name": "<name_of_filter_index>"
  }
  ]
});

Zodra uw filterindex is ingesteld, kunt u de "filter" component rechtstreeks opnemen in uw vectorzoekquery, zoals hieronder wordt weergegeven. In dit voorbeeld ziet u hoe u resultaten filtert waarbij de waarde van de "title" eigenschap niet aanwezig is in de opgegeven lijst:

db.exampleCollection.aggregate([
  {
    '$search': {
      "cosmosSearch": {
        "vector": "<query_vector>",
        "path": <path_to_vector>,
        "k": num_results,
        "filter": {<property_to_filter>: {"$nin": ["not in this text", "or this text"]}}
      },
      "returnStoredSource": True }},
  {'$project': { 'similarityScore': { '$meta': 'searchScore' }, 'document' : '$$ROOT' }
}
]);

Belangrijk

Als u de prestaties en nauwkeurigheid van uw vooraf gefilterde vectorzoekopdrachten wilt optimaliseren, kunt u overwegen uw vectorindexparameters aan te passen. Voor DiskANN-indexen kan het verhogen van maxDegree of lBuild betere resultaten opleveren. Voor HNSW-indexen kunt u experimenteren met hogere waarden voor m, efConstructionof efSearch de prestaties verbeteren. Voor IVF-indexen kan het afstellen van numLists of nProbes leiden tot meer bevredigende resultaten. Het is van cruciaal belang om uw specifieke configuratie te testen met uw gegevens om ervoor te zorgen dat de resultaten voldoen aan uw vereisten. Deze parameters zijn van invloed op de indexstructuur en het zoekgedrag, en optimale waarden kunnen variëren op basis van uw gegevenskenmerken en querypatronen.

LLM Orchestration-hulpprogramma's gebruiken

Gebruiken als een vectordatabase met Semantische kernel

Gebruik Semantic Kernel om uw gegevens op te halen uit Azure Cosmos DB voor MongoDB vCore en uw LLM. Meer informatie hier.

https://github.com/microsoft/semantic-kernel/tree/main/python/semantic_kernel/connectors/memory_stores/azure_cosmosdb

Gebruiken als vectordatabase met LangChain

Gebruik LangChain om uw gegevens op te halen uit Azure Cosmos DB voor MongoDB vCore en uw LLM. Meer informatie hier.

Gebruiken als een semantische cache met LangChain

Gebruik LangChain en Azure Cosmos DB voor MongoDB (vCore) om Semantic Caching te organiseren met behulp van eerder vastgelegde LLM-antwoorden waarmee u LLM API-kosten kunt besparen en latentie voor antwoorden kunt verminderen. Meer informatie hier

Kenmerken en beperkingen

Ondersteunde metrische gegevens over afstand: L2 (Euclidean), binnenproduct en cosinus.
Ondersteunde indexeringsmethoden: IVFFLAT, HNSW en DiskANN.
Met DiskANN en Product Quantization kunt u vectoren tot 16.000 dimensies indexeren.
Met HNSW of IVF met halve precisie kunt u vectoren tot 4000 dimensies indexeren.
Zonder compressie is de standaard maximale vectordimensie voor indexeren 2000.
Indexering is van toepassing op slechts één vector per pad.
Er kan slechts één index per vectorpad worden gemaakt.

Samenvatting

In deze handleiding ziet u hoe u een vectorindex maakt, documenten toevoegt die vectorgegevens bevatten, een overeenkomstenzoekopdracht uitvoert en de indexdefinitie ophaalt. Met behulp van onze geïntegreerde vectordatabase kunt u efficiënt high-dimensionale vectorgegevens opslaan, indexeren en er query's op uitvoeren in Azure Cosmos DB voor MongoDB vCore. Hiermee kunt u het volledige potentieel van uw gegevens ontgrendelen via vector-insluitingen en kunt u hiermee nauwkeurigere, efficiënte en krachtige toepassingen bouwen.

Volgende stap

Een levenslange gratis laag vCore-cluster maken voor Azure Cosmos DB voor MongoDB

Delen via

Vectorwinkel in Azure Cosmos DB voor MongoDB vCore

Wat is een vectoropslag?

Hoe werkt een vectoropslag?

Vector Similarity-zoekopdracht uitvoeren

Een vectorzoekopdracht uitvoeren met DiskANN

Voorbeeld van een DiskANN-index met filteren

Vectoren toevoegen aan uw database

Een DiskANN-vectorindex maken

Een vectorzoekopdracht uitvoeren

Vectorindexdefinities ophalen

Gefilterde vectorzoekopdrachten

LLM Orchestration-hulpprogramma's gebruiken

Gebruiken als een vectordatabase met Semantische kernel

Gebruiken als vectordatabase met LangChain

Gebruiken als een semantische cache met LangChain

Kenmerken en beperkingen

Samenvatting

Gerelateerde inhoud

Volgende stap

Feedback

Aanvullende resources