在 Next.js 应用中集成 Zig WebAssembly 模块对 Algolia 搜索结果进行实时客户端重排序

后端架构

文章字数: 3.6k

阅读时长: 15 分

项目初期，Algolia 提供了无与伦比的搜索性能，毫秒级的响应速度让用户体验极为流畅。我们的技术栈是经典的组合：后端使用 Ruby on Rails 管理数据和业务逻辑，并负责将数据同步至 Algolia；前端则采用 Next.js 构建交互界面。然而，随着业务复杂度提升，一个新的性能瓶颈浮出水面，它不在服务端，也不在网络传输，而是在客户端。

我们的一个核心场景是在一个包含数千个商品的数据集上进行搜索，并根据用户的实时、高度个性化的偏好进行二次排序。这些偏好非常动态，例如“我更看重环保评分，但如果折扣大于30%，则优先考虑价格”，或者根据一组复杂的、非线性的权重公式计算出一个“匹配分”。将这种瞬息万变的逻辑全部置入 Algolia 的 Ranking Formula 不仅管理困难，而且在某些情况下无法实现。因此，我们选择在客户端获取一个较大的结果集（比如2000条），然后用 JavaScript 在浏览器端执行重排序。

最初的 JavaScript 实现是直观的，但很快就暴露了问题。当结果集超过500条，且排序算法涉及多个浮点数乘法和条件判断时，主线程会被阻塞超过300ms，导致页面卡顿和输入无响应。

// 原始的、性能不佳的JS重排序函数
function reRankProducts(products, userPreferences) {
  const { ecoWeight, priceWeight, discountThreshold, noveltyWeight } = userPreferences;

  return products
    .map(product => {
      let score = 0;
      // 环保分加权
      score += (product.attributes.eco_score || 0) * ecoWeight;
      // 新鲜度加权
      score += (product.attributes.days_since_added || 365) < 30 ? noveltyWeight : 0;
      // 价格加权，但受折扣影响
      if (product.price.discount_percentage > discountThreshold) {
        score += (1 / (product.price.final_price || 1)) * priceWeight * 1.5; // 折扣商品有额外加成
      } else {
        score += (1 / (product.price.final_price || 1)) * priceWeight;
      }
      // ... 可能还有十几个类似的条件判断和计算
      return { ...product, relevance_score: score };
    })
    .sort((a, b) => b.relevance_score - a.relevance_score);
}

这段代码在小数据集上工作良好，但在生产环境中，userPreferences 结构复杂，products 数组庞大，map 和 sort 的组合成为了性能灾难。使用 Web Worker 能避免阻塞主线程，但数据在主线程和 Worker 间的序列化与反序列化开销（postMessage）又引入了新的延迟。我们需要的是在主线程或近主线程环境中进行的高性能计算。这自然而然地将目光引向了 WebAssembly (WASM)。

选择哪种语言来编译到 WASM 是个关键决策。Rust 是一个强有力的竞争者，它的生态系统成熟，工具链完善。但对于我们这个特定、独立的计算任务而言，Rust 引入的生命周期、借用检查等概念显得有些“重”。我们寻求一个更简单、更直接的方案。Zig 在此时进入了我们的视野。它以简洁的语法、对 C ABI 的良好兼容性以及对底层内存布局的精确控制而著称。最关键的是，Zig 的交叉编译能力和生成 WASM 的体验非常顺滑，几乎没有额外的配置负担。这对于一个专注于解决单一性能点的团队来说，学习曲线和集成成本都更低。

使用 Zig 构建 WASM 计算核心

我们的目标是创建一个 WASM 模块，它能接收一个 JSON 字符串（包含 Algolia 返回的产品列表和用户偏好），在 WASM 内部完成解析、计算和排序，最终返回一个排好序的产品索引数组。

第一步是定义 Zig 中的数据结构，使其能承载从 JavaScript 传来的数据。Zig 的标准库提供了 JSON 解析能力，我们需要小心地处理内存分配。

src/reranker.zig

const std = @import("std");
const Allocator = std.mem.Allocator;
const json = std.json;

// 定义产品价格结构
const ProductPrice = struct {
    final_price: f64,
    discount_percentage: f32,
};

// 定义产品属性结构
const ProductAttributes = struct {
    eco_score: ?f32 = null,
    days_since_added: ?u32 = null,
};

// 核心产品结构
const Product = struct {
    objectID: []const u8,
    price: ProductPrice,
    attributes: ProductAttributes,
};

// 用户偏好设置
const UserPreferences = struct {
    eco_weight: f32,
    price_weight: f32,
    discount_threshold: f32,
    novelty_weight: f32,
};

// 用于排序的临时结构，包含原始索引和计算出的得分
const ScoredProduct = struct {
    original_index: u32,
    score: f64,
};

// 全局分配器，在WASM中需要我们自己管理
var gpa = std.heap.GeneralPurposeAllocator(.{}){};
const allocator = gpa.allocator();

// 这是暴露给JavaScript的入口函数
// 它接收两个指针：一个指向输入JSON数据的内存地址，另一个是该数据的长度
// 返回一个指针，指向一个包含两个u64的数组：[结果数组的地址, 结果数组的长度]
export fn re_rank(json_ptr: [*]const u8, json_len: u32) [*]u64 {
    const json_slice = json_ptr[0..json_len];
    var stream = json.TokenStream.init(json_slice);

    // 定义JSON输入的整体结构
    const InputPayload = struct {
        products: []const Product,
        preferences: UserPreferences,
    };

    // 使用json.parseFromTokenStream进行解析，避免一次性分配巨大内存
    const payload = json.parseFromTokenStream(InputPayload, allocator, &stream, .{}) catch |err| {
        // 在真实项目中，错误处理至关重要。这里我们简化处理，返回null指针。
        std.log.err("JSON parsing failed: {any}", .{err});
        return null;
    };
    defer json.parseFree(InputPayload, payload, allocator);

    // 分配用于存储得分和索引的数组
    var scored_products = allocator.alloc(ScoredProduct, payload.products.len) catch |err| {
        std.log.err("Failed to allocate scored_products: {any}", .{err});
        return null;
    };
    defer allocator.free(scored_products);

    // --- 核心计算逻辑 ---
    for (payload.products, 0..) |product, i| {
        var score: f64 = 0;
        const prefs = payload.preferences;

        // 环保分加权
        score += @as(f64, product.attributes.eco_score orelse 0.0) * @as(f64, prefs.eco_weight);

        // 新鲜度加权
        if ((product.attributes.days_since_added orelse 365) < 30) {
            score += @as(f64, prefs.novelty_weight);
        }

        // 价格加权，但受折扣影响
        if (product.price.discount_percentage > prefs.discount_threshold) {
            score += (1.0 / (product.price.final_price + 0.001)) * @as(f64, prefs.price_weight) * 1.5;
        } else {
            score += (1.0 / (product.price.final_price + 0.001)) * @as(f64, prefs.price_weight);
        }
        
        scored_products[i] = ScoredProduct{
            .original_index = @intCast(u32, i),
            .score = score,
        };
    }

    // 使用std.sort进行排序
    std.sort.block(ScoredProduct, scored_products, {}, struct {
        fn lessThan(_: void, a: ScoredProduct, b: ScoredProduct) bool {
            return a.score > b.score; // 按得分降序排列
        }
    }.lessThan);

    // 创建一个只包含排好序的索引的数组返回给JS
    var result_indices = allocator.alloc(u32, scored_products.len) catch |err| {
        std.log.err("Failed to allocate result_indices: {any}", .{err});
        return null;
    };

    for (scored_products, 0..) |sp, i| {
        result_indices[i] = sp.original_index;
    }

    // WASM不能直接返回数组，所以我们返回一个指向结果数据地址和长度的指针
    // JS侧需要根据这个指针和长度来读取WASM内存
    var return_payload = allocator.alloc(u64, 2) catch return null;
    return_payload[0] = @ptrToInt(result_indices.ptr);
    return_payload[1] = result_indices.len;

    return @intToPtr([*]u64, @ptrToInt(return_payload.ptr));
}

// 提供给JS的内存分配函数
export fn wasm_alloc(size: u32) [*]u8 {
    const ptr = allocator.alloc(u8, size) catch return null;
    return ptr.ptr;
}

// 提供给JS的内存释放函数
export fn wasm_free(ptr: [*]u8, size: u32) void {
    const slice = ptr[0..size];
    allocator.free(slice);
}

接下来是构建脚本 build.zig。这是 Zig 的一大优势，构建逻辑本身就是 Zig 代码，清晰且强大。

build.zig

const std = @import("std");

pub fn build(b: *std.Build) void {
    const target = b.standardTargetOptions(.{});
    const optimize = b.standardOptimizeOption(.{});

    const lib = b.addSharedLibrary(.{
        .name = "reranker",
        // 核心文件
        .root_source_file = .{ .path = "src/reranker.zig" },
        .target = b.resolveTargetQuery(.{
            .cpu_arch = .wasm32,
            .os_tag = .freestanding,
        }),
        .optimize = optimize,
    });
    
    // 导出我们需要的函数
    lib.export_symbol_names = &.{ "re_rank", "wasm_alloc", "wasm_free" };

    // 这一步很重要，它告诉Zig我们不依赖任何外部WASI宿主环境的功能
    // 这使得生成的WASM文件更小、更通用
    lib.strip = true;

    b.installArtifact(lib);

    const lib_unit_tests = b.addTest(.{
        .root_source_file = .{ .path = "src/reranker.zig" },
        .target = target,
        .optimize = optimize,
    });

    const run_lib_unit_tests = b.addRunArtifact(lib_unit_tests);
    const test_step = b.step("test", "Run unit tests");
    test_step.dependOn(&run_lib_unit_tests.step);
}

使用命令 zig build -Doptimize=ReleaseSmall 即可生成 zig-out/lib/reranker.wasm 文件。

在 Next.js 中无缝集成

前端的集成工作分为几部分：加载 WASM 模块、准备数据、调用 WASM 函数并处理返回结果。我们将这些逻辑封装在一个自定义 React Hook useWasmReRanker 中。

hooks/useWasmReRanker.ts

import { useState, useEffect, useRef } from 'react';

// 定义从WASM模块导出的函数类型
interface WasmExports {
  re_rank(jsonPtr: number, jsonLen: number): number;
  wasm_alloc(size: number): number;
  wasm_free(ptr: number, size: number): void;
  memory: WebAssembly.Memory;
}

export function useWasmReRanker() {
  const [isReady, setIsReady] = useState(false);
  const [error, setError] = useState<Error | null>(null);
  const wasmInstance = useRef<WasmExports | null>(null);

  useEffect(() => {
    async function loadWasm() {
      try {
        const response = await fetch('/reranker.wasm');
        const buffer = await response.arrayBuffer();
        const { instance } = await WebAssembly.instantiate(buffer);
        wasmInstance.current = instance.exports as unknown as WasmExports;
        setIsReady(true);
      } catch (err) {
        console.error("Failed to load WASM module", err);
        setError(err instanceof Error ? err : new Error('WASM loading failed'));
      }
    }
    loadWasm();
  }, []);

  const reRank = (products: any[], preferences: any): number[] | null => {
    if (!isReady || !wasmInstance.current) {
      console.warn("WASM module not ready for re-ranking.");
      return null;
    }
    
    const { wasm_alloc, wasm_free, re_rank, memory } = wasmInstance.current;
    
    const payload = { products, preferences };
    const payloadString = JSON.stringify(payload);
    
    // 1. 将JS字符串编码为UTF-8字节
    const textEncoder = new TextEncoder();
    const payloadBytes = textEncoder.encode(payloadString);
    
    // 2. 在WASM内存中分配空间
    const inputPtr = wasm_alloc(payloadBytes.length);
    if (inputPtr === 0) {
      console.error("WASM failed to allocate memory for input.");
      return null;
    }

    try {
      // 3. 将数据写入WASM内存
      const wasmMemory = new Uint8Array(memory.buffer, inputPtr, payloadBytes.length);
      wasmMemory.set(payloadBytes);
      
      // 4. 调用核心函数
      const resultPayloadPtr = re_rank(inputPtr, payloadBytes.length);

      if (resultPayloadPtr === 0) {
        console.error("WASM re_rank function returned a null pointer.");
        return null;
      }

      // 5. 解码返回结果
      // Zig返回了一个指向[ptr, len]的指针。每个元素是u64，但在32位WASM中，
      // 地址和长度通常是u32。为简单起见，我们假设Zig侧的u64在JS侧以两个u32的形式存在。
      const resultInfo = new Uint32Array(memory.buffer, resultPayloadPtr, 2);
      const resultPtr = resultInfo[0];
      const resultLen = resultInfo[1];

      // 从结果指针和长度创建视图来读取排好序的索引
      const resultIndices = new Uint32Array(memory.buffer, resultPtr, resultLen);

      // 必须复制结果，因为我们马上要释放WASM内存
      const sortedIndices = Array.from(resultIndices);

      // 6. 释放WASM中为结果分配的内存
      // 注意：释放的是 `result_indices` 和 `return_payload` 的内存，
      // Zig侧没有直接提供释放 `return_payload` 的函数，这是一个简化，
      // 生产代码中需要更精细的内存管理。此处我们只释放核心数据。
      wasm_free(resultPtr, resultLen * 4); // u32 is 4 bytes
      wasm_free(resultPayloadPtr, 8); // u64*2 is 8 bytes in wasm32

      return sortedIndices;

    } finally {
      // 7. 总是确保释放输入的内存
      wasm_free(inputPtr, payloadBytes.length);
    }
  };

  return { isReady, error, reRank };
}

这个 Hook 处理了 WASM 的加载、内存操作的复杂性，并向上层组件提供一个简单的 reRank 函数。

在 React 组件中，使用起来就非常直接了：

components/ProductSearch.tsx

import { useState, useEffect, useMemo } from 'react';
import algoliasearch from 'algoliasearch/lite';
import { useWasmReRanker } from '../hooks/useWasmReRanker';

// ... (Algolia client initialization)

const ProductSearch = () => {
  const [products, setProducts] = useState<any[]>([]);
  const [userPreferences, setUserPreferences] = useState({ /* ... */ });
  const { isReady, reRank } = useWasmReRanker();

  // ... (code to fetch initial products from Algolia)

  const rankedProducts = useMemo(() => {
    if (!isReady || products.length === 0) {
      return products;
    }
    
    console.time("WASM Re-ranking");
    const sortedIndices = reRank(products, userPreferences);
    console.timeEnd("WASM Re-ranking");

    if (sortedIndices) {
      return sortedIndices.map(index => products[index]);
    }
    
    // 如果WASM失败，回退到原始顺序
    return products;

  }, [products, userPreferences, isReady, reRank]);

  return (
    <div>
      {/* ... UI to display rankedProducts ... */}
    </div>
  );
};

Ruby on Rails 的角色

虽然核心计算逻辑已经转移到了客户端，但后端 Rails 依然扮演着不可或缺的角色，尤其是在安全方面。我们不能将 Algolia 的 Admin API Key 暴露在前端。正确的做法是让 Rails 后端生成一个有时效性、有范围限制的 Secured API Key。

app/controllers/api/v1/algolia_keys_controller.rb

class Api::V1::AlgoliaKeysController < ApplicationController
  # 在生产环境中，这里应该有用户认证和授权
  # before_action :authenticate_user!

  ALGOLIA_SEARCH_ONLY_API_KEY = ENV.fetch('ALGOLIA_SEARCH_ONLY_API_KEY')
  ALGOLIA_APP_ID = ENV.fetch('ALGOLIA_APP_ID')

  def create
    # Secured API Keys 可以附加过滤条件，进一步增强安全性
    # 例如，限制该 key 只能搜索某个用户有权访问的商品
    # filters = "owner_id:#{current_user.id}"
    
    # 我们这里生成一个有效期为1小时的 key
    valid_until = Time.now.to_i + 3600

    secured_key = Algolia.generate_secured_api_key(
      ALGOLIA_SEARCH_ONLY_API_KEY,
      {
        # filters: filters,
        valid_until: valid_until
      }
    )

    render json: { 
      api_key: secured_key, 
      app_id: ALGOLIA_APP_ID,
      index_name: 'products'
    }, status: :ok
  end
end

前端在初始化 Algolia Client 时，会先请求这个接口获取安全的 key。

整体架构与数据流

通过 Mermaid 图可以清晰地看到整个流程：

sequenceDiagram
    participant User
    participant Next.js as Frontend
    participant Rails as Backend
    participant Algolia
    participant ZigWASM as WASM Module

    User->>Next.js: 执行搜索或修改偏好
    Next.js->>Rails: 请求安全的 Algolia API Key
    Rails-->>Next.js: 返回临时的 Secured API Key
    Next.js->>Algolia: 使用 Secured Key 发起搜索 (获取原始结果集)
    Algolia-->>Next.js: 返回~2000条搜索结果 (JSON)
    
    alt WASM 模块已就绪
        Next.js->>ZigWASM: 传递产品JSON和用户偏好
        Note right of ZigWASM: 1. 分配内存
2. 解析JSON
3. 执行重排序算法
4. 返回索引数组指针
        ZigWASM-->>Next.js: 返回排好序的索引数组
        Next.js->>Next.js: 根据索引重排产品数组
    else WASM 模块加载中/失败
        Next.js->>Next.js: 直接使用Algolia返回的顺序
    end

    Next.js->>User: 渲染最终排序后的产品列表

在我们的测试中，对于2000条产品记录，原先需要450-600ms的 JavaScript 计算，现在使用 Zig 编译的 WASM 模块，整个过程（包括数据序列化、WASM 计算、结果读取）稳定在 25-40ms，性能提升超过10倍，完全消除了界面卡顿。

局限与未来路径

这个方案并非没有成本。它引入了新的技术栈（Zig）和构建环节，增加了项目的复杂度。调试 WASM 也比调试 JavaScript 更具挑战性，需要依赖日志和对内存布局的理解。JSON 的序列化和反序列化是当前主要的开销来源，尽管整体性能已经足够好，但如果追求极致，可以探索使用 Protocol Buffers 或 FlatBuffers 等二进制格式在 JS 和 WASM 之间传递数据，以消除文本解析的成本。

此外，当前内存管理相对粗糙，在 Zig 中分配的内存依赖 JS 侧显式调用 free 来释放。在更复杂的应用中，可能需要设计一套更健壮的内存生命周期管理机制，或者利用 WASM GC 提案（一旦成熟）。

这条技术路径展示了如何创造性地结合高级语言（Ruby, JavaScript）和底层语言（Zig），以一种外科手术式的方式解决特定性能瓶颈，同时保持应用主体架构的清晰和稳定。它不是一个普适的解决方案，但在那些计算密集型的客户端场景下，WASM 提供了一个强大的新选项。

Next.js Ruby Zig Algolia WebAssembly

本篇

在 Next.js 应用中集成 Zig WebAssembly 模块对 Algolia 搜索结果进行实时客户端重排序

2023-11-15 后端架构

Next.js Ruby Zig Algolia WebAssembly

构建基于网关与Delta Lake的LLM应用端到端身份感知数据访问架构

2023-11-15 架构与设计

LangChain IAM Delta Lake 网关与代理