性能优化问题

为什么重启 Milvus 服务端之后，第一次搜索时间非常长？
如何进行性能调优？
为什么有时候小的数据集查询时间反而更长？
为什么数据插入后不能马上被搜索到？
创建集合时 index_file_size 如何设置能达到性能最优？
批量搜索时，用多线程的收益大吗？
仍有问题没有得到解答？

为什么重启 Milvus 服务端之后，第一次搜索时间非常长？

为什么搜索的速度非常慢？

请首先检查 server_config.yaml 的 cache.cache_size 参数是否大于集合中的数据量。

如何进行性能调优？

确保配置文件中的参数 cache.cache_size 值大于集合中的数据量。
确保所有数据文件都建立了索引。
检查服务器上是否有其他进程在占用 CPU 资源。
调整参数 index_file_size 和 nlist 的值。
如果检索性能不稳定，可在启动 Milvus 时添加参数，其中 NUM 为 CPU 逻辑核数的 2/3。

详见性能调优。

建立索引时需要设置 `nlist` 值，如何选择该值大小？

该值需要根据具体的使用情况去设置。详见性能调优 > 索引和。

为什么有时候小的数据集查询时间反而更长？

如果数据文件的大小小于创建集合时 index_file_size 参数的值，Milvus 则不会为此数据文件构建索引。因此，小的数据集有可能查询时间会更长。你还可以调用 create_index 建立索引。

为什么查询时 GPU 一直空闲？

为什么数据插入后不能马上被搜索到？

因为数据还没有落盘。要确保数据插入后立刻能搜索到，可以手动调用接口。但是频繁调用 flush 接口可能会产生大量小数据文件，从而导致查询变慢。

为什么我的 CPU 利用率始终不高？

nq = 100 以下，且数据量也不大的时候确实会出现这个现象。Milvus 在计算时，批量内的查询是并行处理的，如果批量不大且数据量也不大的话，并行度不高，CPU 利用率也就不高了。

创建集合时 `index_file_size` 如何设置能达到性能最优？

使用客户端创建集合时有一个 index_file_size 参数，用来指定数据存储时单个文件的大小，其单位为 MB，默认值为 1024。当向量数据不断导入时，Milvus 会把数据增量式地合并成文件。当某个文件达到 index_file_size 所设置的值之后，这个文件就不再接受新的数据，Milvus 会把新的数据存成另外一个文件。这些都是原始向量数据文件，如果建立了索引，则每个原始文件会对应生成一个索引文件。Milvus 在进行搜索时，是依次对每个索引文件进行搜索。

根据我们的经验，当 index_file_size 从 1024 改为 2048 时，搜索性能会有 30% ~ 50% 左右的提升。但要注意如果该值设得过大，有可能导致大文件无法加载进显存（甚至内存）。比如显存只有 2 GB，该参数设为 3 GB，显存明显放不下。

可参阅。

Milvus 的导入性能如何？

客户端和服务端在同一台物理机上时，10 万条 128 维的向量导入需要约 0.8 秒（基于 SSD 磁盘）。这个具体也要看磁盘的 I/O 速度。

边插入边搜索会影响搜索速度吗？

当插入向量没有达到建索引条件时，新插入向量在初次被搜索时需要从磁盘加载到内存。
当插入向量达到建索引条件时，Milvus 开始为新增向量创建索引。v0.9.0 之后，新出现的搜索请求会打断建索引任务，这需要 1 秒左右的延时。

批量搜索时，用多线程的收益大吗？

多线程查询，如果是小批量（nq < 64）的话，后台会合并查询请求。如果是大批量查询的话，就不会有什么优势。

为什么同样的数据量，用 GPU 查询比 CPU 查询慢？

一般来说，当 nq（每次查询的向量条数）较小时，用 CPU 查询比较快。只有当较大（约大于 500）时，用 GPU 查询才会更有优势。

仍有问题没有得到解答？

如果仍有其他问题，你可以：

加入我们的，与其他用户讨论交流。

性能优化问题

性能优化问题

为什么重启 Milvus 服务端之后，第一次搜索时间非常长？

为什么搜索的速度非常慢？

如何进行性能调优？

建立索引时需要设置 nlist 值，如何选择该值大小？

为什么有时候小的数据集查询时间反而更长？

为什么查询时 GPU 一直空闲？

为什么数据插入后不能马上被搜索到？

为什么我的 CPU 利用率始终不高？

创建集合时 index_file_size 如何设置能达到性能最优？

Milvus 的导入性能如何？

边插入边搜索会影响搜索速度吗？

批量搜索时，用多线程的收益大吗？

为什么同样的数据量，用 GPU 查询比 CPU 查询慢？

仍有问题没有得到解答？

建立索引时需要设置 `nlist` 值，如何选择该值大小？

创建集合时 `index_file_size` 如何设置能达到性能最优？