beautifulsoup用法 _勵志人生網

BeautifulSoup是一個用於解析HTML和XML文檔的Python庫，它提供了多種功能來解析、遍歷和搜尋文檔中的節點。以下是一些BeautifulSoup的主要特性和用法：

初始化BeautifulSoup對象。使用BeautifulSoup(markup,features)來初始化，其中markup是HTML或XML文檔的字元串表示，features指定使用的解析器類型，如"lxml"或"html.parser"。

標籤（Tag）操作。可以使用soup.tagname或soup.find_all(tagname)來查找和操作特定的標籤。

字元串（NavigableString）和注釋（Comment）操作。使用soup.string或soup.find_all(string)來查找字元串，使用soup.comment或soup.find_all(text=lambda text: isinstance(text, Comment))來查找注釋。

搜尋節點。使用soup.find(name, attrs, recursive, text, kwargs)來查找文檔中第一個符合條件的節點，使用soup.find_all(name, attrs, recursive, text, limit, kwargs)來查找所有符合條件的節點。

使用CSS選擇器搜尋節點。使用soup.select(selector)來根據CSS選擇器搜尋節點。

遍歷節點。處理節點的父子關係，如tag.parent獲取父節點，tag.parents返回所有祖先節點，tag.contents返回子節點列表，tag.descendants返回所有子孫節點。

安裝BeautifulSoup：

通過pip安裝BeautifulSoup4。在終端中輸入pip install beautifulsoup4。

安裝解析器。推薦使用lxml作為解析器，輸入pip install lxml。也可以選擇安裝html5lib，它是純Python實現的解析器，輸入pip install html5lib。