當前位置:
首頁 > 知識 > 模糊字元串匹配:FuzzyWuzzy

模糊字元串匹配:FuzzyWuzzy

模糊字元串匹配:FuzzyWuzzy

FuzzyWuzzy

模糊字元串匹配,它使用Levenshtein Distance來計算簡單易用的包中序列之間的差異。

前置條件

  • Python 2.7 or higher

  • difflib

  • python-Levenshtein(可選的,在字元串匹配中提供4-10倍的加速,不過在某些情況下可能導致不同的結果)

測試

  • pycodestyle

  • hypothesis

  • pytest

安裝

使用PIP經由PyPI安裝

模糊字元串匹配:FuzzyWuzzy

或者用如下命令安裝

模糊字元串匹配:FuzzyWuzzy

使用PIP經由Github安裝

模糊字元串匹配:FuzzyWuzzy

添加你的requirementrequirements.txt文件(然後運行 pip install -r requirements.txt)

模糊字元串匹配:FuzzyWuzzy

經由Git手動安裝

模糊字元串匹配:FuzzyWuzzy

用法

模糊字元串匹配:FuzzyWuzzy

簡單匹配率

模糊字元串匹配:FuzzyWuzzy

部分匹配率

模糊字元串匹配:FuzzyWuzzy

符號排序後匹配率

模糊字元串匹配:FuzzyWuzzy

符號集合匹配率

模糊字元串匹配:FuzzyWuzzy

Process

模糊字元串匹配:FuzzyWuzzy

你也可以給extractOne方法傳額外的參數,使它使用一個特定的積分器(scorer).一個典型的用法是匹配文件路徑:

模糊字元串匹配:FuzzyWuzzy

已知移植

FuzzyWuzzy也被移植到了其他語言!以下是我們知道的一些移植:

  • Java: xpresso"s fuzzywuzzy implementation

  • Java: fuzzywuzzy (java port)

  • Rust: fuzzyrusty (Rust port)

  • JavaScript: fuzzball.js (JavaScript port)

  • C++: Tmplt/fuzzywuzzy

  • C#: fuzzysharp (.Net port)

  • Go: go-fuzzywuzz (Go port)

英文原文:https://pypi.org/project/fuzzywuzzy/
譯者:恩 澤

喜歡這篇文章嗎?立刻分享出去讓更多人知道吧!

本站內容充實豐富,博大精深,小編精選每日熱門資訊,隨時更新,點擊「搶先收到最新資訊」瀏覽吧!


請您繼續閱讀更多來自 Python部落 的精彩文章:

VS Code的崛起
用於Python項目的最佳flake8擴展

TAG:Python部落 |