句向量 _勵志人生網

句向量是指能夠表徵整個句子語義的向量。目前，通過BERT模型 結構來實現句向量是一種效果較好的方法。句向量可以套用於聚類、處理大規模文本相似度比較以及基於語義搜尋的信息檢索等任務。例如，在搜尋系統中，輸入查詢(query) 與匹配文檔(document)之間的相似度比較，或問答任務中的問題與答案之間的語義相關度計算，都可以轉化為計算兩個句子的語義相似度或相關度，並以相關度最高的幾個結果作為模型的返回結果。

BERT模型在句子分類和句子對回歸任務上取得了 state-of-the-art 的表現，它使用 cross-encoder 結構，將兩個句子拼接後輸入模型，通過帶有自注意力機制的 Transformer 網路得到最終的預測值。然而，這種結構不適用於大量句子對的回歸任務，因為對於大規模的數據集，如10000 個句子中找出每個句子最相似的句子，需要進行約49995000次的推理計算，這是不現實的。因此，在實際套用中，通常會先通過召回階段，將所有文檔輸入BERT模型提取出句向量進行存儲，而在實際使用時，只需計算查詢的句向量，然後利用 FAISS 等近似最近鄰 (ANN) 工具從所有文檔中召回相關度最高的幾個結果。

Sentence-BERT（SBERT）是一種改進型的BERT模型，它能夠提取表徵句子語義的句向量，適用於上述的召回階段，提高了檢索效率和準確性。