java -xml約束與解析簡介

1.xml的約束的種類：一般有dtd以及xsd，dtd對于元素的格式并無法規定，如格式而xsd對于
要會讀懂名稱空間，看懂前綴即可。
在這里插入圖片描述
2.xml解析的方式：有dom以及sax，sax是逐行讀取，然后會釋放內存資源，所以不適合CRUD，通常用于移動端或者小型設備，優點是占內存少。dom即是前面javaScript的dom技術，把一顆dom樹讀取進內存，
缺點內存占用大，優點crud方便，多用于服務器。
在這里插入圖片描述
2.1dom的實現，常見xml的解析器：分別有jaxp，dom4j（最好用），jsoup以及pull（移動端，sax方式）
這里我們使用的是jsoup：
步驟如下：導入jar包，獲取doc對象，獲取ele對象，讀取數據即可。
小例子：

public class JsoupDemo {
    public static void main(String[] args) throws IOException {
        String path = Jsoup.class.getClassLoader().getResource("student.xml").getPath();
        Document document = Jsoup.parse(new File(path), "utf-8");
        Elements name = document.getElementsByTag("name");
        System.out.println(name.size());
    }
}

小結：
Jsoup.parse的參數可以有URL+超時時間，文件+格式，或者直接一整串xml內容，即不用外部xml文件。
其中URL+超時時間即是爬蟲中常用的方式，利用jsoup爬取解析xml/html。

Jsoup的文檔要會看，里面定義了一些接口方便操作獲取html里面的元素，注意各個對象的繼承關系，這個關系在Html DOM下面好像沒有這種特別明顯的關系

在jsoup下卻十分分明，理解起來，document每次都往上獲取內容元素，即每個元素都會有Node。
java.lang.Object
org.jsoup.nodes.Node
org.jsoup.nodes.Element
org.jsoup.nodes.Document（類繼承關系）

本文鏈接：https://blog.csdn.net/weixin_38023259/article/details/104271821

智能推薦

Java解析xml方法

我在模擬tomcat的過程中需要解析xml，所以在此總結下常用的sax/dom，Dom4j，jsoup等。其實sax/dom使用有點復雜，建議使用DOM4j等技術。這里sax和dom還有Dom4j借鑒于:https://blog.csdn.net/m0_37499059/article/details/80505567 先看xml demo.xml SAX 運行結果 DOM 運行結果 Dom4...

java中XML解析

原生xml解析 DOM4J方式解析XML 導入依賴解析xml文件文件結構和原生相同 ...

java解析XML方式

empList.xml內容如下：控制臺輸出結果：需要的jar包：...

java解析xml文件

JDK API中提供了3種方式解析XML，分別為DOM、SAX、XPath。目錄： DOM XPath：Mybaties中采用XPath方式解析XML文件的配置信息。 SAX 一.DOM studentx.xml XMLParser.java 三.XPath方式 users.xml...

Java解析XML

XML解析方式（1）DOM解析：解析器把**整個**XML文件加載到內存，并生成一個Document對象。優點：元素與元素之前保持依賴管理，可以對其進行CRUD操作。缺點：當XML文件過大時，可能會出現內存溢出問題。（2）SAX解析：一種速度更快、更有效的方法。它逐行掃描文檔，一邊掃描一邊解析。基于事件驅動進行具體解析，每執行一行，都將觸發對應的事件。優點：處理速度很快，可以處理大文件。...

java -xml約束與解析簡介

智能推薦

猜你喜歡