模糊字元串匹配:FuzzyWuzzy
FuzzyWuzzy
模糊字元串匹配,它使用Levenshtein Distance來計算簡單易用的包中序列之間的差異。
前置條件
Python 2.7 or higher
difflib
python-Levenshtein(可選的,在字元串匹配中提供4-10倍的加速,不過在某些情況下可能導致不同的結果)
測試
pycodestyle
hypothesis
pytest
安裝
使用PIP經由PyPI安裝
或者用如下命令安裝
使用PIP經由Github安裝
添加你的requirementrequirements.txt文件(然後運行 pip install -r requirements.txt)
經由Git手動安裝
用法
簡單匹配率
部分匹配率
符號排序後匹配率
符號集合匹配率
Process
你也可以給extractOne方法傳額外的參數,使它使用一個特定的積分器(scorer).一個典型的用法是匹配文件路徑:
已知移植
FuzzyWuzzy也被移植到了其他語言!以下是我們知道的一些移植:
Java: xpresso"s fuzzywuzzy implementation
Java: fuzzywuzzy (java port)
Rust: fuzzyrusty (Rust port)
JavaScript: fuzzball.js (JavaScript port)
C++: Tmplt/fuzzywuzzy
C#: fuzzysharp (.Net port)
Go: go-fuzzywuzz (Go port)
英文原文:https://pypi.org/project/fuzzywuzzy/
譯者:恩 澤
※VS Code的崛起
※用於Python項目的最佳flake8擴展
TAG:Python部落 |