c 做网站设计,wordpress cms下载,阿里云1m宽带做网站卡吗,门户网站建设使用语言向量数据库可以做哪些事情
存储和索引向量检索相似向量#xff0c;还具有过滤功能自动将文档转变成向量#xff0c;所以会自动化分词、向量化、索引等操作
目前存在的向量数据库#xff1a;
名称github开源协议chromahttps://github.com/chroma-core/chromaApache 2.0Mil…向量数据库可以做哪些事情
存储和索引向量检索相似向量还具有过滤功能自动将文档转变成向量所以会自动化分词、向量化、索引等操作
目前存在的向量数据库
名称github开源协议chromahttps://github.com/chroma-core/chromaApache 2.0Milvushttps://github.com/milvus-io/milvusApache 2.0Pinecone未开源/weaviatehttps://github.com/weaviate/weaviateBSD-3-Clause licenseqdranthttps://github.com/qdrant/qdrantApache 2.0vespahttps://github.com/vespa-engine/vespaApache 2.0zilliz基于Milvus的商业版向量数据库/
其他跟向量数据库相关严格来说不算向量数据库
Faiss 是一个提供高维向量相似性搜索和聚类的算法库不算向量数据库向量数据库的相似性检索可以使用到Faiss中的算法。ScaNN 是google开源的相似向量搜索方法vald 是一个可扩展的向量搜索引擎pgvector 为Postgres 提供向量相似度搜索的库typesense 可替代ElasticSearch 也有向量搜索功能
对于文本如何挑选向量类型可参考比较基准MTEB: Massive Text Embedding Benchmark 参考资料
https://towardsdatascience.com/milvus-pinecone-vespa-weaviate-vald-gsi-what-unites-these-buzz-words-and-what-makes-each-9c65a3bd0696https://byby.dev/vector-databaseshttps://platform.openai.com/docs/guides/embeddings/what-are-embeddings