Python 解析html文档模块HTMLPaeser

Python中,有三个库可以解析html文本,HTMLParser,sgmllib,htmllib。他们的实现方法不通,但功能差不多。这三个库中 提供解析html的类都是基类,本身并不做具体的工作。他们在发现的元件后(如标签、注释、声名等),会调用相应的函数,这些函数必须重载,因为基类中不作处理。

《Python开发技术详解》.( 周伟,宗杰).[高清PDF扫描版+随书视频+代码]

Python脚本获取Linux系统信息

Ubuntu下用Python搭建桌面算法交易研究环境

用Python中自带的HTMLPaeser模块,解析下面的HTMl文件

要求:1、获取到每一个漏洞的名称,CVE号,风险值

2、显示每一个漏洞单独显示,不要堆叠在一起

3、只获取高风险的漏洞

<html>
<head>
<title>search</title>
<meta http-equiv="Content-Type" content="text/html; charset=gb2312">
<LINK href="https://www.linuxidc.com/include/bbs.css" rel=stylesheet>
</head>
<body bgcolor="#ffffff" text="#000000" leftmargin="0" topmargin="0"><br>

<div>

<table  cellspacing="1" cellpadding="1" bordercolordark="#FFFFFF" bordercolorlight="#000000">
 
  <tr>
        <td>ID</td>
        <td>检测名称</td>
        <td>CVE号</td>
        <td>检测类别</td>
        <td>风险级别</td>
      </tr>
 
  <tr>
        <td>1</td>
        <td>
          <a href="Javascript:openwindow(0);">
          FTP缓冲区溢出</a>
        </td>
        <td>
        <a href='https://cve.mitre.org/cgi-bin/cvename.cgi?name=CVE-1999-0789' target='_blank'> CVE-1999-0789</a>

</td>
        <td>
          FTP测试
        </td>
        <td>
          <font color=#FF00FF>高风险</font>
        </td>
      </tr>
 
  <tr>
        <td>2</td>
        <td>
          <a href="javascript:openwindow(2);">
          AFS客户版本</a>
        </td>
        <td>
        </td>
        <td>
          信息获取测试
        </td>
        <td>
          <font color=#00CC00>信息</font>
        </td>
      </tr>
 
  <tr>
        <td>1</td>
        <td>
          <a href="javascript:openwindow(1);">
          ACC 路由器无需认证显示配置信息</a>
        </td>
        <td>
        <a href='https://cve.mitre.org/cgi-bin/cvename.cgi?name=CVE-1999-0383' target='_blank'> CVE-1999-0383</a>

</td>
        <td>
          网络设备测试
        </td>
        <td>
          <font color=#FFCC00>中风险</font>
        </td>
      </tr>
 
  <tr>
        <td>3</td>
        <td>
          <a href="javascript:openwindow(17);">
          Knox Arkeia 缓冲区溢出</a>
        </td>
        <td>
        <a href='https://cve.mitre.org/cgi-bin/cvename.cgi?name=CAN-1999-1534' target='_blank'> CAN-1999-1534</a>

内容版权声明:除非注明,否则皆为本站原创文章。

转载注明出处:http://www.heiqu.com/d33a76093e3b5764e61486ad064ebee7.html