近期在做一些电力行业的数据分析工作,需要借助相关门户网站的历史资讯数据,然后今天写了一个用于爬取该网站历史新闻数据的脚本。
该网站的新闻都是静态网页,是将内容写在HTML里的,不需要使用JavaScript或者Vue来加载数据。所以理论上使用request库来获取HTML内容,然后使用BeautifulSoup来进行HTML内容提取即可。
- 首先导入requests和BeautifulSoup库。
2025年03月24日
近期在做一些电力行业的数据分析工作,需要借助相关门户网站的历史资讯数据,然后今天写了一个用于爬取该网站历史新闻数据的脚本。
该网站的新闻都是静态网页,是将内容写在HTML里的,不需要使用JavaScript或者Vue来加载数据。所以理论上使用request库来获取HTML内容,然后使用BeautifulSoup来进行HTML内容提取即可。
2025年03月24日
marked一个非常流行的markdown格式解析器。
它在npmjs上的周下载量达500万之巨。
在其最新的version 15.0.6版本(2025年1月8日使用),有处小bug:当在窄屏显示状态下,如手机端。代码会超出所在div,超出部分内容不可见。
如下图所示:
虽然是个非正常显示的小bug,但还是要解决它。
2025年03月24日
在当今的 Web 应用开发领域,Spring Boot 已然成为众多开发者的首选框架,它以其强大的功能和便捷的开发体验,极大地提升了开发效率。而 Thymeleaf 作为一款优秀的模板引擎,能够帮助我们轻松构建动态网页。那么,在 Spring Boot3 项目中如何高效地整合 Thymeleaf 模板引擎呢?今天,就让我们一同深入探究。
2025年03月24日
在数字化时代,电子客户服务系统已经成为企业不可或缺的一部分。这些系统不仅提高了客户满意度,还能显著提升企业的运营效率。本文将带你从零开始,一步步构建一个高效且功能丰富的电子客户服务系统。我们将使用Java语言,结合Spring Boot框架来实现这个目标。让我们一起进入这个既充满挑战又极具成就感的旅程吧!
2025年03月24日
TaskBuilder可以编辑的前端页面类型分为HTML和tfp(Taskmsg Front Page)两种格式,HTML格式只能用代码编辑器编辑,这种模式基本很少有人用,大家都用tfp格式,因为使用TaskBuilder向导创建的前端页面都是采用的tfp格式,而且这种格式可以可视化编辑,可以大幅提升开发效率,后续文档所说的前端页面默认都是指tfp格式的页面,除非有特定声明。
tfp文件的实际内容为JSON格式,里面包含当前页面的一些设置,包括页面类型、定位方式、终端类型、背景颜色、标题等,然后是各个组件的信息,包括编号、类型、属性、样式、事件等信息,另外,还包括页面的脚本、CSS样式、数据操作配置等信息。在前端页面设计器内,点击底部的“TFP源码”选项卡,可以查看当前页面的tfp代码,如下图所示:
2025年03月24日
在网页CAD中进行三维建模是一项有趣的任务。本文将介绍如何利用mxcad3d来创建三维管道模型。该工具提供了一系列三维建模功能的API,使得建立复杂的管道结构变得简单直观。
2025年03月24日
在信息爆炸的时代,知识管理变得愈发重要。对于非技术用户而言,搭建一个高效实用的本地知识库似乎是一项艰巨的任务。但借助零代码工具方案,通过图形化界面工具,这一目标变得触手可及。接下来,让我们深入了解如何利用这些工具,高效搭建属于自己的本地知识库。