分享
  1. 首页
  2. 文章

golang解析xml,去掉重复项

esrrhs · · 3012 次点击 · · 开始浏览
这是一个创建于 的文章,其中的信息可能已经有所发展或是发生改变。

package main
import (
	"encoding/xml"
	"fmt"
	"mahonia"
	"os"
	"strconv"
	"text/template"
)
type Attribute struct {
	Name string
	Value string
	Type string
}
type Token struct {
	Name string
	IsArray string
	Num int
	Attributes map[string]*Attribute
	Tokens map[string]*Token
}
type Result struct {
	Root Token
}
var result = Result{}
var g_tabNum = 0
var g_classVec []string
func main() {
	if !parse(os.Args[1]) {
		return
	}
	if !output("code_h.tpl", "code.h") {
		return
	}
	if !output("code_cpp.tpl", "code.cpp") {
		return
	}
	fmt.Println("OK")
}
func parse_token(decoder *xml.Decoder, tt xml.Token, mytoken *Token) {
	mytoken.Attributes = make(map[string]*Attribute)
	mytoken.Tokens = make(map[string]*Token)
	token := tt.(xml.StartElement)
	name := token.Name.Local
	mytoken.Name = name
	for _, attr := range token.Attr {
		attrName := attr.Name.Local
		attrValue := attr.Value
		attr := mytoken.Attributes[attrName]
		if attr == nil {
			attr = new(Attribute)
			mytoken.Attributes[attrName] = attr
		}
		attr.Name = attrName
		attr.Value = attrValue
	}
	var t xml.Token
	var err error
	for t, err = decoder.Token(); err == nil; t, err = decoder.Token() {
		switch t.(type) {
		// 处理元素开始(标签)
		case xml.StartElement:
			token := t.(xml.StartElement)
			name := token.Name.Local
			
			son := mytoken.Tokens[name]
			if son == nil {
				son = new(Token)
				mytoken.Tokens[name] = son
			}
			son.Num++
			parse_token(decoder, t, son)
		// 处理元素结束(标签)
		case xml.EndElement:
			return
		case xml.CharData:
		default:
		}
	}
}
func print_token(token *Token) {
	if token.Num > 1 {
		token.IsArray = "yes"
	}
	fmt.Println("token begin:", token.Name, " ", token.IsArray)
	for name, attr := range token.Attributes {
		_, err := strconv.Atoi(attr.Value)
		if err != nil {
			attr.Type = "string"
		} else {
			attr.Type = "int"
		}
		fmt.Println("attr:", name, " type ", attr.Type)
	}
	for _, e := range(token.Tokens) {
		print_token(e)
	}
	fmt.Println("token end:", token.Name)
}
func parse(filename string) bool {
	file, err := os.Open(filename)
	if err != nil {
		fmt.Println(err)
		return false
	}
	var t xml.Token
	decoder := xml.NewDecoder(file)
	t, decerr := decoder.Token()
	if decerr != nil {
		fmt.Println(decerr)
		return false
	}
	parse_token(decoder, t, &result.Root)
	
	print_token(&result.Root)
	return true
}
func genlist(n string) []string {
	num, _ := strconv.Atoi(n)
	ret := make([]string, num)
	for i := 0; i < num; i++ {
		ret[i] = strconv.Itoa(i)
	}
	return ret
}
func iconv(str string) string {
	enc := mahonia.NewEncoder("gb2312")
	return enc.ConvertString(str)
}
func add_tab() string {
	g_tabNum++;
	return "";
}
func dec_tab() string {
	g_tabNum--;
	return "";
}
func gen_tab() string {
	ret := ""
	for i := 0; i < g_tabNum; i++ {
		ret += " "
	}
	return ret
}
func push_class(t string, c string) string {
	g_classVec = append(g_classVec, t+c)
	return ""
}
func pop_class() string {
	g_classVec = g_classVec[0:len(g_classVec) - 1]
	return ""
}
func gen_class() string {
	ret := ""
	for _, c := range(g_classVec) {
		ret += c + "::"
	}
	return ret
}
func output(src string, des string) bool {
	g_tabNum = 0
	file, err := os.Create(des)
	if err != nil {
		fmt.Println(err)
		return false
	}
	t := template.New("text")
	if err != nil {
		fmt.Println(err)
		return false
	}
	t = t.Funcs(template.FuncMap{"genlist": genlist, "iconv": iconv,
		"add_tab":add_tab, "dec_tab":dec_tab, "gen_tab":gen_tab,
		"push_class":push_class, "pop_class":pop_class, "gen_class":gen_class})
	srcfile, err := os.Open(src)
	if err != nil {
		fmt.Println(err)
		return false
	}
	var buffer [1024 * 1024]byte
	n, rerr := srcfile.Read(buffer[0:])
	if rerr != nil {
		fmt.Println(rerr)
		return false
	}
	t, err = t.Parse(string(buffer[0:n]))
	if err != nil {
		fmt.Println(err)
		return false
	}
	err = t.Execute(file, result.Root)
	if err != nil {
		fmt.Println(err)
		return false
	}
	return true
}



有疑问加站长微信联系(非本文作者)

本文来自:CSDN博客

感谢作者:esrrhs

查看原文:golang解析xml,去掉重复项

入群交流(和以上内容无关):加入Go大咖交流群,或添加微信:liuxiaoyan-s 备注:入群;或加QQ群:692541889

关注微信
3012 次点击
暂无回复
添加一条新回复 (您需要 后才能回复 没有账号 ?)
  • 请尽量让自己的回复能够对别人有帮助
  • 支持 Markdown 格式, **粗体**、~~删除线~~、`单行代码`
  • 支持 @ 本站用户;支持表情(输入 : 提示),见 Emoji cheat sheet
  • 图片支持拖拽、截图粘贴等方式上传

用户登录

没有账号?注册
(追記) (追記ここまで)

今日阅读排行

    加载中
(追記) (追記ここまで)

一周阅读排行

    加载中

关注我

  • 扫码关注领全套学习资料 关注微信公众号
  • 加入 QQ 群:
    • 192706294(已满)
    • 731990104(已满)
    • 798786647(已满)
    • 729884609(已满)
    • 977810755(已满)
    • 815126783(已满)
    • 812540095(已满)
    • 1006366459(已满)
    • 692541889

  • 关注微信公众号
  • 加入微信群:liuxiaoyan-s,备注入群
  • 也欢迎加入知识星球 Go粉丝们(免费)

给该专栏投稿 写篇新文章

每篇文章有总共有 5 次投稿机会

收入到我管理的专栏 新建专栏