逐行读取文件数据，分析每一行数据与目标字符串的相似度，Python-天翼云

逐行读取文件数据，分析每一行数据与目标字符串的相似度，Python

2024-07-18 10:17:44 阅读次数：34

一行一行的读取文件数据，分析每一行中数据与目标字符串的相似度，设置相似度阈值，把高相似度的行数据输出，Python实现。

简单的说，给定一个关键词，然后在一个文件中搜索包含这个关键词的以行为单位的数据。

from fuzzywuzzy import fuzz

FILE_PATH = r'c:\data.json'
KEY = r'要寻找的关键词'
threshold = 0


if __name__ == '__main__':
    with open(FILE_PATH, 'r', encoding='UTF-8') as f:
        cnt = 1

        for line in f:
            pr = fuzz.partial_ratio(line, KEY)

            if pr > threshold:
                print('-----')
                s = '第{number}行,相似度{ratio}\n{content}'

                ss = s.format(number=cnt, ratio=pr, content=line)
                print(ss)

            cnt = cnt + 1

    f.close()

活动

智算服务

应用商城

合作伙伴

开发者

支持与服务

了解天翼云

逐行读取文件数据，分析每一行数据与目标字符串的相似度，Python

逐行读取文件数据，分析每一行数据与目标字符串的相似度，Python

相关文章

python四种抽样方法的使用：随机抽样、聚类抽样、系统抽样、分层抽样

视频 | Python测试开发之调试print代码实例

python简单介绍及基础知识（一）

使用Python扩展PAM（part 2）

1行Python代码，把Excel转成PDF，python-office功能更新~

IronPython 与 c# 交互之导入Python模块的两种方法

python性能测试之pyperformance

Python高维统计建模变量选择:SCAD平滑剪切绝对偏差惩罚、Lasso惩罚函数比较

一篇文章教会你Python中三种简单函数的使用

一篇文章带你剖析Python 字节流处理神器struct

作者介绍

最新文章

python四种抽样方法的使用：随机抽样、聚类抽样、系统抽样、分层抽样

视频 | Python测试开发之调试print代码实例

python简单介绍及基础知识（一）

使用Python扩展PAM（part 2）

1行Python代码，把Excel转成PDF，python-office功能更新~

IronPython 与 c# 交互之导入Python模块的两种方法

热门文章

Java学习之算术运算符两只老虎

Linux实用命令authconfig和authconfig-tui（备忘）

Python高级变量类型

python学习——面向对象编程

一个简单的http server，处理get和post请求，Python实现

Python数据库测试实战教程

热门标签

相关产品

弹性云主机

天翼云电脑（公众版）

对象存储

云硬盘

随机文章

Python|用python解决阶乘问题

分支语句语法格式小结 java

C语言娱乐项目————6、圣诞树

SAP ABAP实用技巧介绍系列之使用代码获得某个structure上的扩展字段

Python 中 -m 的典型用法、原理解析与发展演变

python Ubuntu dlib 人脸识别9-辅助函数