golang 去掉xml头

2023-05-15 10:05:44 xml 去掉 Golang

golang中,读取xml文件时常常会遇到xml文件头(即<?xml … ?>)的问题,这可能会导致解析xml文件失败。

下面介绍几种去掉xml头的方法。

第一种方法:手动去掉xml头

我们可以使用 strings.Trim 函数将xml头部去掉,代码如下:

func removeXmlHeader(xmlContent string) string {
    return strings.Trim(xmlContent, "")
}

在上面的代码中,我们使用 strings.Trim 函数将xmlContent中的前三个特殊字符(即BOM字符,其ASCII码为)去掉,这样就可以去掉xml头了。

第二种方法:使用 xml.Decoder

另一种去掉xml头的方法是使用 xml.Decoder 对象读取xml文件,并使用 decoder.Token 函数获取xml文件中的Token对象。如果Token是声明标签(即<?xml … ?>),我们就可以在解析xml文件之前跳过它,代码如下:

func removeXmlHeader(xmlContent string) (string, error) {
    decoder := xml.NewDecoder(strings.NewReader(xmlContent))
    var result strings.Builder
    for {
        token, err := decoder.Token()
        if err == io.EOF {
            break
        }
        if err != nil {
            return "", err
        }
        switch t := token.(type) {
        case xml.ProcInst:
            if t.Target == "xml" {
                continue
            }
        }
        result.WriteString(fmt.Sprintf("%v", token))
    }
    return result.String(), nil
}

在上面的代码中,我们创建了一个 xml.Decoder 对象,然后使用decoder.Token函数从xml文件中读取Token对象。如果读取的Token对象是声明标签(即xml.ProcInst),我们判断其目标是否为xml,如果是则跳过此Token对象,否则继续读取下一个Token对象,直到读完整个xml文件。

当我们把Token对象放入strings.Builder对象中后,就可以返回处理后的xml字符串了。

第三种方法:使用 xml.Unmarshal

第三种去掉xml头的方法是使用 xml.Unmarshal 来解析xml文件时跳过xml头。

func removeXmlHeader(xmlContent string, v interface{}) error {
    xmlContent = strings.Trim(xmlContent, "")
    return xml.Unmarshal([]byte(xmlContent), v)
}

在上面的代码中,我们通过 strings.Trim 函数去掉了xml文件头部,然后调用 xml.Unmarshal 函数将xml文件解析到目标对象中,这样就可以方便地去掉xml头。

综上,以上是去掉xml头的三种方法,选择哪一种方法取决于具体的业务需求。在使用这些方法时,需要注意每种方法的特点,以便选择合适的方法解决问题。

以上就是Golang 去掉xml头的详细内容,更多请关注其它相关文章!

相关文章