BeautifulSoup文档中有一个特殊的段落,称为“解析器之间的差异”,其中指出:
Beautiful
Soup为许多不同的解析器提供了相同的接口,但是每个解析器都是不同的。不同的解析器将从同一文档创建不同的解析树。最大的区别在于HTML解析器和XML解析器之间。
在格式不正确的HTML文档中,差异变得很明显。
道德是,您应该使用在特定情况下有效的解析器。
还要注意,您应该始终明确指定要使用的解析器。这将帮助您避免在不同的计算机或虚拟环境上运行代码时出现意外。
BeautifulSoup文档中有一个特殊的段落,称为“解析器之间的差异”,其中指出:
Beautiful
Soup为许多不同的解析器提供了相同的接口,但是每个解析器都是不同的。不同的解析器将从同一文档创建不同的解析树。最大的区别在于HTML解析器和XML解析器之间。
在格式不正确的HTML文档中,差异变得很明显。
道德是,您应该使用在特定情况下有效的解析器。
还要注意,您应该始终明确指定要使用的解析器。这将帮助您避免在不同的计算机或虚拟环境上运行代码时出现意外。