[Qdrant] ์์ํ (Quantization)
๋ฒกํฐ ์์ํ์ ๋ํด์ ์ ๋ชจ๋ฅธ๋ค๋ฉด, ๋ณ๋ ํฌ์คํธ๋ฅผ ์ฐธ์กฐํ๋ค.
https://blog.naver.com/sssang97/223848217468
qdrant๋ ์ผ๋ฐ์ ์ธ ์์ํ์ธ binary, ์ค์นผ๋ผ, product๋ฅผ ๋ชจ๋ ์ง์ํ๋ค.
์ฌ๊ธฐ์๋ ๊ฐ์ฅ ์ผ๋ฐ์ ์ด๊ณ ๋ฆฌ์คํฌ๋ ์ ์ ์ค์นผ๋ผ ์์ํ๋ฅผ ๋ง๋ค์ด์ ์์ฉํ๋ ๋ฒ์ ๋ค๋ค๋ณด๊ฒ ๋ค.
๋ค๋ฅธ ๊ฒ๋ค์ ์ต์
ํํ๊ฐ ์ข ๋ค๋ฅด๊ธด ํ์ง๋ง, ์ ๊ทผ๋ฒ์ ๋น์ทํ๋ค.
์์ํ ์ต์
์ collection ์์ฑ์์ ์ฃผ๊ฑฐ๋, ์ปฌ๋ ์
์ ๋ณ๊ฒฝํ๋ ํํ๋ก๋ง ์กฐ์ ํ ์ ์๋ค.
quantization_config ๊ฐ์ ์ค์ ํด์ฃผ๋ฉด ๋๋ค.
quantile์ ์์ํํ ๊ฐ ๋ฒ์?๋ผ๊ณ ํ ์ ์์ ๊ฒ์ด๋ค. 0.5~1.0 ๋ฒ์์ ๊ฐ์ ์ง์ ํ ์ ์๊ณ , ๋ฎ์ถ์๋ก ๋ ๋ง์ ๊ฐ์ด ์์ค๋์ด์ ์ ํ์ฑ์ด ๋จ์ด์ง๋ค.
์ด๊ฒ๋ ์์ํ๋ ๋ฒกํฐ๋ฅผ ๋ฉ๋ชจ๋ฆฌ์ ์ฌ๋ฆด์ง, ๋์คํฌ์ ์ฌ๋ฆด์ง๋ฅผ ๊ฒฐ์ ํ ์ ์๋ค. always_ram: true๋ฅผ ์ฃผ๋ฉด ์์ํ๋ ๋ฒกํฐ๋ฅผ ๋ฉ๋ชจ๋ฆฌ์ ์ฌ๋ฆฌ๊ฒ ๋๋ค.

๋ ๊ธฐ์กด ๋ฐ์ดํฐ๋ฅผ ๊ธฐ์ค์ผ๋ก 256 ๊ธธ์ด ๋ฒกํฐ 1000๋ง๊ฐ ์ ๋๋ฅผ ๊ฐ๋จํ ํ
์คํธํด๋ดค๋ค.
์คํ ์๋์ ๊ฒฝ์ฐ์๋ ๊ฝค ๋๋๋ฌ์ง ์ฐจ์ด๊ฐ ๋ณด์๋ค.

๊ฑฐ์ 2-3๋ฐฐ๋ ๋นจ๋ผ์ก๋ค.
๊ทธ๋ฆฌ๊ณ ๋ฉ๋ชจ๋ฆฌ ์ฌ์ฉ๋์ ์๊ฐ๋ณด๋ค ํฐ ์ฐจ์ด๋ ์์๋ค. ์๋ 4-5๊ธฐ๊ฐ ์ ๋๋ฅผ ์ค๊ฐ๋์ง๋ผ.
์ ์ด์ ๋ฒกํฐ ๊ธธ์ด๊ฐ ์งง์์ ๋๋ผ๋งํฑํ ์ฐจ์ด๊ฐ ์๋ ๊ฒ ๊ฐ๊ธฐ๋ ํ๋ค.
ํ์ง๋ง ๋ฌด์ธ๊ฐ๋ฅผ ์ป์ผ๋ฉด ์๋ ๊ฒ๋ ์๋ ๋ฒ์ด๋ค.
์์ํ ์ ์๋ ์ ํ์ฑ์ด ๊ฑฐ์ 98%์ ์๋ ดํ๋ ๊ฒ์ด

์ค์นผ๋ผ ์์ํ๋ฅผ ์ ์ฉํ์ ๊ฒฝ์ฐ์๋ 84%๋๋ก ์ค์ด๋ค์๋ค.
์์ค ์ ๋๋ ๋ฐ์ดํฐ ์ํ์ ๋ฐ๋ผ์ ์ข ๋ค๋ฅผ ์ ์์ผ๋, ์ง์ ๊ฒ์ฆ์ ํด๋ณด๋ ๊ฒ์ ๊ถํ๋ค.
์์ค๋ ์ ํ๋๋ rescoring ๊ฐ์ ๋ฐฉ๋ฒ์ ๋์ํด์ ์ข ๋ณด์ํ ์๋ ์์ง๋ง, ํ๊ณ๋ ์๋ค.
rescore๋ฅผ ํตํ ์ ํ๋ ๋ณด์
rescore๋ ์์ํ ์ ์์ค๋ ์ ํ๋๋ฅผ ๋์ด์ฌ๋ฆฌ๊ณ ์ ์ฌ์ฉ๋๋ ๋ณด์กฐ์ ์ธ ๊ธฐ๋ฒ ์ค ํ๋๋ค.
์ด๊ฑด ์ธ๋ฑ์ค์ ์ถ๊ฐ์ ์ธ ์ค์ ์ ๋ํ๋๊ฑด ์๋๊ณ , ์ฟผ๋ฆฌ๋ฅผ ๋ ๋ฆฌ๋ ์์ ์ ์ ์ฉํ๋ ๊ฒ์ด๋ค.
์๋ฅผ ๋ค์ด, ์ด๋ฐ ์์ผ๋ก ์ต์
์ ์ฃผ๋ฉด ๊ฐ์ฅ ์ ์ฌํ 20๊ฐ๋ฅผ ๊ฐ์ ธ์จ ๋ค์์, "์์ํ๋์ง ์์ ์๋ณธ ๋ฒกํฐ"๋ฅผ ๋์คํฌ์์ ์ฝ์ด์จ ๋ค์ ๋ค์ ์ฌํ๊ฐ(rescore)๋ฅผ ํด์ ์ต์ข
10๊ฐ๋ฅผ ๊ฐ์ ธ์จ๋ค.
์ ํ๋๋ฅผ ์กฐ๊ธ ๋์ผ ์ ์๋ค๋ ์ฅ์ ์ด ์์ง๋ง, ์ค๋ฒ์ํ๋ง ๊ฐ์๋งํผ ์กฐํํ๋๋ฐ์ ๋ถํ๊ฐ ๋ฐ์ํ๊ณ , ๋์คํฌ๋ฅผ ์ฝ๋๋ฐ ์ถ๊ฐ ๋น์ฉ์ด ๋ฐ์ํ๋ค.
์ด๊ฒ๋ ๊ทธ๋ฆฌ ์๋ฒฝํ ๋ฐฉ๋ฒ์ด ์๋๋ผ๋ ์ ์ ์ ์ํ๋ค.
์ง์ ๋ณธ์ธ์ ๋ฐ์ดํฐ์
์์ ํ์ธํด๋ด์ผ ํ๋ค.
๊ณ์ฐ๊ธฐ
qdrant๋ ์์ ๊ผฝ์ ์ ๋๋ก ํธ๋ฆฌํ ์์ฒด ๊ณ์ฐ๊ธฐ๋ฅผ ์ ๊ณตํ๋ค.
๋จ์ ๋น์ฉ๋ฟ๋ง ์๋๋ผ, ์์ํ๋ฅผ ์ ์ฉํ์ ๊ฒฝ์ฐ ์ ์ฝ๋๋ ์ฌ์ด์ฆ๊ฐ ์ด๋ ์ ๋์ธ์ง๋ ๊ฐ๋จํ๊ฒ ํ์
ํด๋ณผ ์ ์๋ค.
https://cloud.qdrant.io/calculator
์ฐธ์กฐ
https://qdrant.tech/documentation/guides/quantization/
https://www.unite.ai/comparing-quantization-techniques-for-scalable-vector-search/