前军教程网

中小站长与DIV+CSS网页布局开发技术人员的首选CSS学习平台

python html转TXT python读取html指定区域文本内容转成txt文件

#科技之巅#python html指定区域文本内容转称txt文本文件

1、首先,通过python,去将读取遍历程序目录文件夹中,【html】文件夹里面的文件、文件

夹以及子目录、子目录里面的 ,获取到该目录下所有的【.html】文件后,返回一个list对象

2、遍历完成后得到一个html文件列表对象,将该列表交给html_to_txt方法,html_to_txt方法

里面循环逐个读取html文件中指定标签中<DIV>标签中<H1>标签中的文字,和中指定标签

<TD>里面<P>标签的文字提取出来

3、读取到的文本内容输出到txt文件中,这里可以加上一个替换replace,把我们不需要的内

容替换之后,这里可以做多次替换,也可以加上换行之类的处理,再进行输出,可根据自己

的需求修改,如果有什么不明之处,可以提问

发表评论:

控制面板
您好,欢迎到访网站!
  查看权限
网站分类
最新留言