HTML 段落自动缩进两空格

使用 python 和 beautifulsoup 解析 html 文档的方法如下：加载 html 文档并创建 beautifulsoup 对象。使用 beautifulsoup 对象查找和处理标签元素，如：查找特定标签：soup.find(tag_name)查找所有特定标签：soup.find_all(tag_name)查找具有特定属性的标签：soup.find(tag_name, {\'attribute\': \'value\'})提取标签的文本内容或属性值。根据需要调整代码以获取特定信息。

使用 Python 和 BeautifulSoup 解析 HTML 文档

目标：
了解如何使用 Python 和 BeautifulSoup 库解析 HTML 文档。

必备知识：

Python 基础
HTML 和 XML 知识

代码：

from bs4 import BeautifulSoup

# 加载 HTML 文档
html_doc = """
<html>
<head>
<title>HTML 文档</title>
</head>
<body>
<h1>标题</h1>
<p>段落</p>
</body>
</html>
"""

# 创建 BeautifulSoup 对象
soup = BeautifulSoup(html_doc, \'html.parser\')

# 获取标题标签
title_tag = soup.find(\'title\')
print(title_tag.text)  # 输出：HTML 文档

# 获取所有段落标签
paragraph_tags = soup.find_all(\'p\')
for paragraph in paragraph_tags:
    print(paragraph.text)  # 输出：段落

# 获取特定属性的值
link_tag = soup.find(\'link\', {\'rel\': \'stylesheet\'})
print(link_tag[\'href\'])  # 输出：样式表链接