open()读取文件问题(假设思考题).
2, in.txt 文件没有换行,都在一行内,意为着直接使用 readlines 无效.
3, in.txt 里内都是英文及标点符. 需要统计英文词频到 output.txt 文件.
问: 下面通过迭代器 iter()函数封装的代码,能否解决,上面内容不足问题? 如不能,该如何处理?若可以, 该如何验证,内存使用量. 请大佬指教,谢谢!!
代码如下:
from collections import defaultdict
import re
a=iter(re.split(‘[^w]+’,open(“in.txt”,”r”).read()))
#此条是否可避免使用内存过大?
d=defaultdict(int)
for b in a:
d[b]+=1
out=dict(sorted(d.items(),key=lambda x:x[1],reverse=True))
f=open(“output.txt”,”w”)
f.write(repr(out))
f.close()