性能优化问题

    为什么重启 Milvus 服务端之后,第一次搜索时间非常长?

    为什么搜索的速度非常慢?

    请首先检查 server_config.yamlcache.cache_size 参数是否大于集合中的数据量。

    如何进行性能调优?

    • 确保配置文件中的参数 cache.cache_size 值大于集合中的数据量。
    • 确保所有数据文件都建立了索引。
    • 检查服务器上是否有其他进程在占用 CPU 资源。
    • 调整参数 index_file_sizenlist 的值。
    • 如果检索性能不稳定,可在启动 Milvus 时添加参数 ,其中 NUM 为 CPU 逻辑核数的 2/3。

    详见 性能调优

    建立索引时需要设置 nlist 值,如何选择该值大小?

    该值需要根据具体的使用情况去设置。详见 性能调优 > 索引 和 。

    为什么有时候小的数据集查询时间反而更长?

    如果数据文件的大小小于创建集合时 index_file_size 参数的值,Milvus 则不会为此数据文件构建索引。因此,小的数据集有可能查询时间会更长。你还可以调用 create_index 建立索引。

    为什么查询时 GPU 一直空闲?

    为什么数据插入后不能马上被搜索到?

    因为数据还没有落盘。要确保数据插入后立刻能搜索到,可以手动调用 接口。但是频繁调用 flush 接口可能会产生大量小数据文件,从而导致查询变慢。

    为什么我的 CPU 利用率始终不高?

    nq = 100 以下,且数据量也不大的时候确实会出现这个现象。Milvus 在计算时,批量内的查询是并行处理的,如果批量不大且数据量也不大的话,并行度不高,CPU 利用率也就不高了。

    创建集合时 index_file_size 如何设置能达到性能最优?

    使用客户端创建集合时有一个 index_file_size 参数,用来指定数据存储时单个文件的大小,其单位为 MB,默认值为 1024。当向量数据不断导入时,Milvus 会把数据增量式地合并成文件。当某个文件达到 index_file_size 所设置的值之后,这个文件就不再接受新的数据,Milvus 会把新的数据存成另外一个文件。这些都是原始向量数据文件,如果建立了索引,则每个原始文件会对应生成一个索引文件。Milvus 在进行搜索时,是依次对每个索引文件进行搜索。

    根据我们的经验,当 index_file_size 从 1024 改为 2048 时,搜索性能会有 30% ~ 50% 左右的提升。但要注意如果该值设得过大,有可能导致大文件无法加载进显存(甚至内存)。比如显存只有 2 GB,该参数设为 3 GB,显存明显放不下。

    可参阅 。

    Milvus 的导入性能如何?

    客户端和服务端在同一台物理机上时,10 万条 128 维的向量导入需要约 0.8 秒(基于 SSD 磁盘)。这个具体也要看磁盘的 I/O 速度。

    边插入边搜索会影响搜索速度吗?

    • 当插入向量没有达到建索引条件时,新插入向量在初次被搜索时需要从磁盘加载到内存。
    • 当插入向量达到建索引条件时,Milvus 开始为新增向量创建索引。v0.9.0 之后,新出现的搜索请求会打断建索引任务,这需要 1 秒左右的延时。

    批量搜索时,用多线程的收益大吗?

    多线程查询,如果是小批量(nq < 64)的话,后台会合并查询请求。如果是大批量查询的话,就不会有什么优势。

    为什么同样的数据量,用 GPU 查询比 CPU 查询慢?

    一般来说,当 nq(每次查询的向量条数)较小时,用 CPU 查询比较快。只有当 较大(约大于 500)时,用 GPU 查询才会更有优势。

    仍有问题没有得到解答?

    如果仍有其他问题,你可以:

    • 加入我们的 ,与其他用户讨论交流。