This commit is contained in:
Andy Lee
2025-11-24 08:05:29 +00:00
parent cd1d853a46
commit 9ac9eab48d

View File

@@ -28,7 +28,7 @@ def generate_test_data(num_chunks=90000, chunk_size=2000):
# 90K chunks * 2000 chars ≈ 180MB # 90K chunks * 2000 chars ≈ 180MB
chunks = [] chunks = []
base_text = ( base_text = (
"这是一个测试文档。LEANN是一个创新的向量数据库通过图基选择性重计算实现97%的存储节省。" "这是一个测试文档。LEANN是一个创新的向量数据库, 通过图基选择性重计算实现97%的存储节省。"
) )
for i in range(num_chunks): for i in range(num_chunks):