[Qdrant] 컬렉션 변경 & 마이그레이션

벡터 관련 인덱스 옵션을 바꾼다거나, 양자화를 건드린다거나 하면 컬렉션을 새로 생성해서 옮겨야 할 일이 종종 생긴다.




init_from을 통한 복제

컬렉션 생성 옵션에는 init_from이라는 언뜻 보면 간편해보이는 명령이 하나 있다.

그럴때는 init_from 옵션을 사용하면 데이터를 빠르게 가져와서 2번째 컬렉션을 만들 수 있다.


init_from과 함께하는 컬렉션 생성은 비동기적으로 이루어진다.
바로 데이터 전체를 복제하는건 아니고


비동기적으로 내부에서 알아서 옮기는 형태다.
복제 속도는 꽤 빠르다.


유의사항

다만 이게 잘 제어되는건 아니라서, 진행상태를 알기 어렵고, 메모리가 부족하면 복제가 내부적으로 중지된다는 문제가 있다. 그래서 라이브 환경에서는 그리 권장하지 않고, 내가 repo에서 좀 물어보니까 deprecate할 계획도 있다는 것 같았다.
안정적인 방법은 컬렉션을 만들고, 수동으로 옮기는 것이다.




컬렉션 업데이트

qdrant는 컬렉션을 부분적으로 변경하는 기능 또한 제공한다.

상당수의 옵션을 PATCH API를 통해서 수정할 수 있다.
이렇게 변경한 값은 점진적으로 백그라운드 프로세스를 통해서 반영되고 재구성된다.




https://cloud.qdrant.io/calculator




참조
https://qdrant.tech/documentation/concepts/collections/
https://api.qdrant.tech/api-reference/collections/update-collection