前言
昨晚写了个小爬虫,简单分析下发现可以修改请求的url,直接获取所有目标的数据。想先打印在控制台看看,发现打印的数据不全,一开始还以为被反爬虫了,获取的数据本身不全,后来将数据直接保存JSON文件(3兆多大小),用Ubuntu文档编辑器打不开(直接卡死),用vim打开发现数据完整(说明爬虫获取的数据本身没毛病),再在Pycharm用Python打开发现提示文件过大,打印在控制台也还是显示不全。

正文
原来Pycharm IDEA对能关联的文件大小做了限制,主要是为了保护内存,默认值为2500kb,这对爬虫用户来说相当不友好,但时安装软件的时候也不提醒下?

在Pycharm菜单找到Edit Custom Properties…

追加以下字段

idea.max.intellisense.filesize = 20000
idea.max.content.load.filesize = 20000
idea.cycle.buffer.size = 20000

其中20000代表限制大小为20000kb(暂时够用),可自行修改

重启Pycharm

以上就是Pycharm打印大数据文件显示不全的解决方法的详细内容,更多关于Pycharm打印数据显示不全的资料请关注vb.net教程C#教程python教程

Logo

魔乐社区(Modelers.cn) 是一个中立、公益的人工智能社区,提供人工智能工具、模型、数据的托管、展示与应用协同服务,为人工智能开发及爱好者搭建开放的学习交流平台。社区通过理事会方式运作,由全产业链共同建设、共同运营、共同享有,推动国产AI生态繁荣发展。

更多推荐