使用Python爬虫实现全国失信被执行人名单查询功能的示例代码

开心果汁 2024-11-22 10:54:44编程技术
217

随着社会信用体系的不断完善,失信被执行人名单成为了公众关注的焦点之一。通过互联网公开的失信被执行人信息,可以帮助公众更好地了解个人或企业的信用状况。Python作为一种强大且易用的编程语言,提供了丰富的库和工具,使得实现网络爬虫变得相对简单。本文将介绍如何使用Python爬虫实现全国失信被执行人名单的查询功能,并提供完整的示例代码。

本文实例讲述了Python爬虫实现全国失信被执行人名单查询功能。分享给大家供大家参考,具体如下:

一、需求说明

利用百度的接口,实现一个全国失信被执行人名单查询功能。输入姓名,查询是否在全国失信被执行人名单中。

使用Python爬虫实现全国失信被执行人名单查询功能的示例代码

二、python实现

版本1:

# -*- coding:utf-8*-
import sys
reload(sys)
sys.setdefaultencoding('utf-8')
import time
import requests
time1=time.time()
import pandas as pd
import json
iname=[]
icard=[]
def person_executed(name):
  for i in range(0,30):
    try:
      url="https://sp0.baidu.com/8aQDcjqpAAV3otqbppnN2DJv/api.php?resource_id=6899" \
      "&query=%E5%A4%B1%E4%BF%A1%E8%A2%AB%E6%89%A7%E8%A1%8C%E4%BA%BA%E5%90%8D%E5%8D%95" \
      "&cardNum=&" \
      "iname="+str(name)+ \
      "&areaName=" \
      "&pn="+str(i*10)+ \
      "&rn=10" \
      "&ie=utf-8&oe=utf-8&format=json"
      html=requests.get(url).content
      html_json=json.loads(html)
      html_data=html_json['data']
      for each in html_data:
        k=each['result']
        for each in k:
          print each['iname'],each['cardNum']
          iname.append(each['iname'])
          icard.append(each['cardNum'])
    except:
      pass
if __name__ == '__main__':
  name="郭**"
  person_executed(name)
  print len(iname)
  #####################将数据组织成数据框###########################
  data=pd.DataFrame({"name":iname,"IDCard":icard})
  #################数据框去重####################################
  data1=data.drop_duplicates()
  print data1
  print len(data1)
  #########################写出数据到excel#########################################
  pd.DataFrame.to_excel(data1,"F:\\iname_icard_query.xlsx",header=True,encoding='gbk',index=False)
  time2=time.time()
  print u'ok,爬虫结束!'
  print u'总共耗时:'+str(time2-time1)+'s'

三、效果展示

"D:\Program Files\Python27\python.exe" D:/PycharmProjects/learn2017/全国失信被执行人查询.py
郭** 34122319790****5119
郭** 32032119881****2419
郭** 32032119881****2419
3
                IDCard name
0  34122319790****5119  郭**
1  32032119881****2419  郭**
2
ok,爬虫结束!
总共耗时:7.72000002861s
Process finished with exit code 0

版本2:

# -*- coding:utf-8*-
import sys
reload(sys)
sys.setdefaultencoding('utf-8')
import time
import requests
time1=time.time()
import pandas as pd
import json
iname=[]
icard=[]
courtName=[]
areaName=[]
caseCode=[]
duty=[]
performance=[]
disruptTypeName=[]
publishDate=[]
def person_executed(name):
  for i in range(0,30):
    try:
      url="https://sp0.baidu.com/8aQDcjqpAAV3otqbppnN2DJv/api.php?resource_id=6899" \
      "&query=%E5%A4%B1%E4%BF%A1%E8%A2%AB%E6%89%A7%E8%A1%8C%E4%BA%BA%E5%90%8D%E5%8D%95" \
      "&cardNum=&" \
      "iname="+str(name)+ \
      "&areaName=" \
      "&pn="+str(i*10)+ \
      "&rn=10" \
      "&ie=utf-8&oe=utf-8&format=json"
      html=requests.get(url).content
      html_json=json.loads(html)
      html_data=html_json['data']
      for each in html_data:
        k=each['result']
        for each in k:
          print each['iname'],each['cardNum'],each['courtName'],each['areaName'],each['caseCode'],each['duty'],each['performance'],each['disruptTypeName'],each['publishDate']
          iname.append(each['iname'])
          icard.append(each['cardNum'])
          courtName.append(each['courtName'])
          areaName.append(each['areaName'])
          caseCode.append(each['caseCode'])
          duty.append(each['duty'])
          performance.append(each['performance'])
          disruptTypeName.append(each['disruptTypeName'])
          publishDate.append(each['publishDate'])
    except:
      pass
if __name__ == '__main__':
  name="郭**"
  person_executed(name)
  print len(iname)
  #####################将数据组织成数据框###########################
  # data=pd.DataFrame({"name":iname,"IDCard":icard})
  detail_data=pd.DataFrame({"name":iname,"IDCard":icard,"courtName":courtName,"areaName":areaName,"caseCode":caseCode,"duty":duty,"performance":performance,\
               "disruptTypeName":disruptTypeName,"publishDate":publishDate})
  #################数据框去重####################################
  # data1=data.drop_duplicates()
  # print data1
  # print len(data1)
  detail_data1=detail_data.drop_duplicates()
  # print detail_data1
  # print len(detail_data1)
  #########################写出数据到excel#########################################
  pd.DataFrame.to_excel(detail_data1,"F:\\iname_icard_query.xlsx",header=True,encoding='gbk',index=False)
  time2=time.time()
  print u'ok,爬虫结束!'
  print u'总共耗时:'+str(time2-time1)+'s'

总结

通过本文的详细讲解,我们学习了如何使用Python爬虫实现全国失信被执行人名单的查询功能。我们首先介绍了所需的库和工具,然后逐步构建了爬虫程序,最后展示了如何使用该程序查询失信被执行人名单。希望本文的内容能够帮助大家更好地理解和应用Python爬虫技术,提升数据采集和分析的能力。同时,我们也提醒大家在使用爬虫技术时,务必遵守相关法律法规和网站的使用条款,确保合法合规地进行数据采集。

Python 爬虫
THE END
蜜芽
故事不长,也不难讲,四字概括,毫无意义。

相关推荐

深入解析Python图像处理中的内存泄漏问题及解决方案
随着计算机视觉和图像处理技术的不断发展,Python作为一种高效、简洁的编程语言,逐渐成为图像处理领域的首选工具。然而,在实际开发过程中,内存泄漏问题常常困扰着开发者,...
2025-02-18 编程技术
157

使用Python实现音乐播放器的示例代码
本文将向大家介绍一个使用Python实现的简易音乐播放器示例代码,通过结合tkinter图形用户界面库与pygame音乐处理库,我们将亲手打造一个功能完备、操作简便的音乐播放工具。无...
2025-02-18 编程技术
150

使用Python和PyQt6开发图片播放器(附示例代码)
随着计算机技术的飞速发展,图形用户界面(GUI)的应用程序越来越受到人们的青睐。Python作为一种高效、简洁的编程语言,结合PyQt6库,可以轻松创建功能强大的GUI应用程序。本...
2025-02-18 编程技术
145

使用Python和PyQt打造自定义文件浏览器
在现代软件开发中,图形用户界面(GUI)的应用程序越来越受到开发者的青睐。Python作为一种高效、易学的编程语言,结合PyQt这一强大的GUI库,使得开发者能够快速构建出功能丰富...
2025-02-16 编程技术
165

Python在Word文档中插入图片的三种方法解析
手动在Word中插入图片往往耗时且易出错,特别是在需要批量处理或精确控制图片位置和格式时。因此,利用编程语言如Python来自动化这一过程,不仅可以大大提高效率,还能确保文...
2025-02-14 编程技术
173

Python+OpenCV实现图片去水印的多种方法详解
在数字图像处理领域,去除图片上的水印是一个常见的需求。无论是个人用户还是企业,在使用或处理图片时,都可能遇到需要去除水印的情况。然而,由于水印的形式多样,去除水印...
2025-02-14 编程技术
171