docs+sky: simplify SkyPilot flow (auto-build on launch, rsync copy-back); clarify HNSW auto non-compact when no-recompute

2025-08-13 14:30:14 -07:00
parent 737dfc960c
commit fa2a775867
2 changed files with 8 additions and 17 deletions
--- a/docs/configuration-guide.md
+++ b/docs/configuration-guide.md
@@ -288,23 +288,18 @@ Offload embedding generation and index building to a GPU VM using [SkyPilot](htt
 # One-time: install and configure SkyPilot
 pip install skypilot
-# Launch with defaults (L4:1) and mount ./data to ~/leann-data
+# Launch with defaults (L4:1) and mount ./data to ~/leann-data; the build runs automatically
 sky launch -c leann-gpu sky/leann-build.yaml
-# Override parameters via -e key=value
+# Override parameters via -e key=value (optional)
 sky launch -c leann-gpu sky/leann-build.yaml \
  -e index_name=my-index \
  -e backend=hnsw \
  -e recompute=false \
  -e compact=false \
  -e embedding_mode=sentence-transformers \
  -e embedding_model=Qwen/Qwen3-Embedding-0.6B
-# Build remotely (template installs uv + leann CLI)
+# Copy the built index back to your local .leann (use rsync)
-sky exec leann-gpu -- "leann build my-index --docs ~/leann-data --backend hnsw --complexity 64 --graph-degree 32 --no-recompute --no-compact"
+rsync -Pavz leann-gpu:~/.leann/indexes/my-index ./.leann/indexes/
 # Copy the built index back to your local .leann
 sky cp leann-gpu:~/.leann/indexes/my-index ./.leann/indexes/
 ```
 ### 3) Disable recomputation to trade storage for speed
@@ -325,7 +320,7 @@ When to use:
 - Environments without a stable embedding server
 Constraints:
- HNSW: must use `--no-compact` when `--no-recompute` (compact/pruned graphs rely on recomputation)
+- HNSW: when `--no-recompute` is set, LEANN automatically disables compact mode during build
 - DiskANN: supported; `--no-recompute` skips selective recompute during search
 Storage impact:
--- a/sky/leann-build.yaml
+++ b/sky/leann-build.yaml
@@ -19,8 +19,8 @@ env:
  embedding_mode: sentence-transformers   # sentence-transformers | openai | mlx | ollama
  embedding_model: facebook/contriever
  # Storage/latency knobs
-  recompute: true             # true => selective recomputation; false => store full embeddings
+  recompute: true             # true => selective recomputation (recommended)
-  compact: true               # for HNSW only: false when recompute=false
+  compact: true               # for HNSW only
  # Optional pass-through
  extra_args: ""
@@ -45,10 +45,6 @@ run: |
  if [ "${recompute}" = "false" ] || [ "${recompute}" = "0" ]; then
    recompute_flag="--no-recompute"
  fi
  compact_flag=""
  if [ "${compact}" = "false" ] || [ "${compact}" = "0" ]; then
    compact_flag="--no-compact"
  fi
  # Build command
  leann build ${index_name} \
@@ -59,4 +55,4 @@ run: |
    --num-threads ${num_threads} \
    --embedding-mode ${embedding_mode} \
    --embedding-model ${embedding_model} \
-    ${recompute_flag} ${compact_flag} ${extra_args}
+    ${recompute_flag} ${extra_args}