设为首页收藏本站

Crossin的编程教室

 找回密码
 立即加入
查看: 4584|回复: 1
打印 上一主题 下一主题

求助,关于嘻哈代码中爬虫部分。比较着急,呜呜呜

[复制链接]

1

主题

0

好友

5

积分

新手上路

Rank: 1

跳转到指定楼层
楼主
发表于 2020-11-29 12:05:39 |只看该作者 |倒序浏览
公众号给出的代码真的超级好,可是爬虫部分爬出来后是乱码,繁体中文,请问怎么解决,谢谢各位大佬们,呜呜呜,孩子期末作业需要,急疯了

屏幕截图 2020-11-29 120310.jpg (119.9 KB, 下载次数: 239)

运行结果

运行结果

屏幕截图 2020-11-29 120348.jpg (153.3 KB, 下载次数: 238)

代码

代码

回复

使用道具 举报

174

主题

45

好友

10万

积分

管理员

Rank: 9Rank: 9Rank: 9

沙发
发表于 2020-12-1 01:11:30 |只看该作者
1. 这个代码比较早,网易云的部分接口现在似乎是失效了

2. 输出乱码可以在获取到 req 之后设置 req.encoding = 'utf8' 来解决

3. 保存文件的乱码可以在打开文件的 open 函数里增加 encoding='utf8’ 或者 'gbk' 来设置

4. 如果你是用 SQLite 数据库来保存(代码里的默认设置),那么这个文件不是当做文本文件直接打开的

#==== Crossin的编程教室 ====#
微信ID:crossincode
网站:http://crossincode.com
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即加入

QQ|手机版|Archiver|Crossin的编程教室 ( 苏ICP备15063769号  

GMT+8, 2024-4-25 14:48 , Processed in 0.016842 second(s), 24 queries .

Powered by Discuz! X2.5

© 2001-2012 Comsenz Inc.

回顶部