Qdrant, een aanbieder van samenstelbare vectorzoek- en databaseoplossingen, heeft verbeterde indexeringsprestaties, drievoudige cluster failover-mechanismen en op compliance gerichte functies voor auditregistratie uitgerold.
Het bedrijf ontwikkelt een stand-alone vectordatabase voor het opslaan van inbedding die nodig is voor grote taalmodellen (LLM's) en autonome AI-agents, die gewoonlijk AI-inferentieworkflows zoals Retrieval-Augmented Generation (RAG) aandrijven. Volgens Qdrant beoordelen inkoopteams vectorzoektools altijd op basis van drie kerncriteria: schaalbaarheid voor groeiende werklasten, servicecontinuïteit te midden van infrastructuurstoringen en traceerbare operationele audits.
André Zayarni, medeoprichter en CEO van Qdrant, merkte op: "GPU's zijn niet langer beperkt tot modelinferentie; ze optimaliseren ook de data-indexering. Sinds v1.13 hebben we GPU-versnelde HNSW-constructie mogelijk gemaakt in onze open-sourceversie, en deze mogelijkheid is nu officieel beschikbaar op Qdrant Cloud. Gecombineerd met multi-AZ-replicatie en auditlogging stelt de geïntegreerde suite bedrijven in staat Qdrant in te zetten voor kritieke productieworkloads."
De nieuwste productupgrades van Qdrant omvatten drie belangrijke verbeteringen:
GPU-versnelde indexering: Benchmarktests bevestigen dat speciale GPU's de constructiesnelheid van de HNSW-index tot wel vier keer verhogen op Qdrant Cloud. Gebruikers kunnen GPU-bronnen aan bestaande clusters koppelen om indexeringsbursts met hoge intensiteit efficiënt af te handelen.
Clusters met meerdere beschikbaarheidszones (AZ).: Het cross-AZ-replicatiemechanisme dupliceert gegevens over drie beschikbaarheidszones in één regio. Het elimineert handmatige failover-latentie en zorgt voor ononderbroken lees- en schrijfbewerkingen, zelfs als een beschikbaarheidszone uitvalt.
Auditregistratie: De functie registreert alle API-gebaseerde bewerkingen, inclusief dataquery's, upserts, verwijderingen, collectiebeheer en snapshot-taken. Elk logboekitem heeft een gestructureerd JSON-formaat, waarbij gebruikersidentiteiten, API-sleutels, tijdstempels, doelverzamelingen en de autorisatiestatus van de bewerking worden gemarkeerd. Wanneer autonome systemen taken uitvoeren op basis van opgehaalde gegevens, leveren de logs duidelijke audittrails voor verzoekbronnen, uitvoeringstijd en toegangslegitimiteit. Gebruikers kunnen de bewaarcycli van logboeken aanpassen en records extern exporteren via API's voor archivering op lange termijn.
Momenteel is GPU-versnelde indexering toegankelijk op AWS, met lopende plannen om de dekking uit te breiden naar meer cloudleveranciers en -regio's. Multi-AZ-clusters behoren tot de Premium-laag van Qdrant en leveren een SLA-ondersteunde uptime van 99,95%. De auditregistratiefunctie staat open voor alle betaalde Qdrant Cloud-clusters.
Officiële documentatie biedt meer details over de drie nieuwe mogelijkheden.
Voetnoot
Hierarchical Navigable Small World (HNSW) is een algoritme dat is ontworpen om de dichtstbijzijnde buren van vectoren te identificeren. Het brengt vectoren in kaart in onderling verbonden grafiekstructuren, die drastisch uitbreiden naarmate het datavolume toeneemt. HNSW stapelt meerdere virtuele grafieklagen: de bovenste dunne laag bevat minimale vectoren voor snel voorlopig zoeken, terwijl lagere lagen steeds meer vectoren opslaan totdat de onderste laag alle gegevenspunten bedekt. Elke laag fungeert als een geoptimaliseerd toegangspunt voor de volgende laag, waardoor de algehele zoeklatentie aanzienlijk wordt verkort.
Qdrant heeft te maken met concurrentie van meerdere branchegenoten. Pinecone maakt ook gebruik van HNSW-algoritmen en maakt gebruik van NVIDIA GPU's om de insluiting en herschikking van prestaties te optimaliseren. Zilliz levert zowel HNSW-compatibiliteit als GPU-versnelling; de onderliggende Milvus-database integreert Nvidia CUDA-Accelerated Graph Index for Vector Retrieval (CAGRA) uit de RAPIDS cuVS-bibliotheek om GPU-indexering mogelijk te maken.
Beijing Qianxing Jietong Technologie Co., Ltd.
Sandy Yang/directeur mondiale strategie
WhatsApp / WeChat: +86 13426366826
E-mail: yangyd@qianxingdata.com
Website: www.qianxingdata.com/www.storagesserver.com
Zakelijke focus:
ICT-productdistributie/Systeemintegratie en -diensten/Infrastructuuroplossingen
Met meer dan 20 jaar ervaring in IT-distributie werken we samen met toonaangevende wereldwijde merken om betrouwbare producten en professionele diensten te leveren.
“Technologie gebruiken om een intelligente wereld te bouwen”Uw vertrouwde ICT-productdienstverlener!