form1.cn
Make a little progress every day

Python给一段文字自动加上合适的标点符号

20th of September 2022 Python Code 645

Python给一段文字自动加上合适的标点符号

# encoding=utf8

'''
Python给一段文字自动加上合适的标点符号
'''

# 导入包
import paddlehub as hub

model = hub.Module(name='auto_punc',version='1.0.0')

# 定义方法
def addpunc(txtpath, savetxt):
	f = open(txtpath, encoding = "utf-8")
	#输出读取到的数据
	txtstr = f.read().split("\n")
	punc_texts = model.add_puncs(txtstr)
	f.close()
	str1 = "\n        ".join(punc_texts)
	print('转换成功=====================:' , str1)
	with open(savetxt, "a", encoding= "utf-8") as fc:
		fc.write(str1) # 写入文件
		fc.write("\n\n")
		fc.close()


if __name__ == '__main__':

	# 存放要加标点符号的文字
	txtpath = r'D:\Test\txt\source.txt'

	# 保存加好标点符号的文字
	savetxt = r'D:\Test\txt\punc.txt'

	# 调用方法
	addpunc(txtpath, savetxt)