1. 在word或者其他工具里面对多个类似排版的html文档进行简单标准化编辑修改
主要包括:a.将正文大标题前面的部分,从“AAA”到“BBB”这几段话全部删除 b.查找“XXX“,进行定位 c.然后将XXX到最后的文字全部删除 d.查找“YYY”这个单词,确保文档里面没有包含这些单词的段落
2. 将修改后Html连同其图片文件夹保存为zip文档。zip命名按照某网页里面的标题。