- 帖子
- 2
- 精华
- 0
- 积分
- 18
- 阅读权限
- 10
- 注册时间
- 2017-7-28
- 最后登录
- 2017-8-24
|
data.access.zip
(1.28 KB, 下载次数: 1)
#问题描述:首先读取日志文件内容到log列表中,经在线测试知道日志编码为utf-8,然后将提取的部分字符串进行解码,出现了错误,尚未找到解决的办法!
import sys
import re
import json
# print(sys.getdefaultencoding())
path = 'D:\\Documents\\Tencent Files\\2247592847\\FileRecv\\log\\data.access.log'
file = open(path, 'r')
iter_f = iter(file)
#######生成log列表
log = []
for line in iter_f:
#print(line)
rowlist = list(line.strip().split('"'))
log.append(rowlist)
# for i in range(len(log)):
# string = log[3]
# #re.sub()
# print('1:',string)
#
# str_before = bytes((ord(i) for i in string)).decode('utf-8')
# print('2:',str_before)
# #json 解析
# str_after = json.loads(str_before)
# #提取关键字
# appProfile, deviceProfile, events = extract_keywords(str_after)
# for之前先测试一下
string = log[0][3]
print('1:',string)
str_before = bytes((ord(i) for i in string)).decode('utf-8')
print('2:',str_before)
目测是str_before那行decode没有成功。我该怎么办,急求呀。
|
|