微信咨询

微信咨询

13610*910*9

服务热线 7*24小时

电话咨询

月度归档: 2020 年 1 月

  • selenium +PhantomJS自动发布带图文微博(涉及图片上传 autoit操作)

    from selenium import webdriver from bs4 import BeautifulSoup import time import os from selenium.webdriver.common.desired_capabilities import DesiredC […]

  • selenium +PhantomJS自动发布微博

    from selenium import webdriver from bs4 import BeautifulSoup import time from selenium.webdriver.common.desired_capabilities import DesiredCapabilitie […]

  • selenium 实现自动登录微博并发布内容

    from selenium import webdriver from bs4 import BeautifulSoup import time # browser = webdriver.PhantomJS() browser = webdriver.Chrome() browser.get(‘h […]

  • python文本分析与可视化利器—wordcloud库使用

    wordcloud是功能强大的词云展示第三方库。它不仅可根据文本中词语出现的频率等参数绘制词云,还可设定词云的字体,颜色,形状等。需要注意的是,wordcloud库在运行时,需要用到一些依赖库:包括matplotlib库以及图像处理库pillow库。因此,使用该库之前,务必先装好依赖库。和其他第三方 […]

  • Python 利用you-get 库下载B站视频

    import sys from you_get import common as you_get #导入you-get库 directory = r’F:\pydemo’ #设置下载目录 url = ‘https://www.bilibili.com/video/av36631527/?spm_id […]

  • 一行Python代码过滤标点符号等特殊字符

    原文地址:https://www.jb51.net/article/167471.htm 很多时候我们需要过滤掉标点符号等特殊字符,网上虽然有一堆的方法,但是都没有找到一个非常满意的,有些过滤不了中文的标点符号,有些过滤不了英文的标点符号,有些过滤不全。 最后通过查看正则表达式文档,发现一个高效的办 […]

  • scrapy 利用fiddler抓包批量下载【掌通家园】APP图片

    关键点,利用fiddler抓取手机app里的数据接口参数 抓取后的数据 爬虫处理文件deal.py import scrapy import bs4 import random import csv import requests import json from ..items import ne […]

  • scrapy 域名过滤。DEBUG: Filtered offsite request to 解决方案

    在做爬虫项目时,出现了一个问题,解析一个网站二次爬取时没有获取到数据,就写了一个测试程序试了下,测试程序如下 import scrapy from scrapy.linkextractors import LinkExtractor from scrapy.spiders import CrawlS […]

  • scrapy 抓取app 掌通家园 图文页面

    接口需要通过fiddler来抓包获取,下载下来的图片是原始高清大图无水印 爬虫处理页面deal.py import scrapy import bs4 import csv from ..items import newsfoto2Item # 需要引用mrleItem,它在items里面。因为是i […]

  • Selenium+PhantomJS使用时报错原因及解决方案

    UserWarning: Selenium support for PhantomJS has been deprecated, please use headless versions of Chrome or Firefox instead warnings.warn(‘Seleni […]