所有软件外包项目 Gray arrow bg 英文关键词管理工具

英文关键词管理工具 资金已经托管 线上项目,线下洽谈,智城安排

发包方 : Heweng001 接包方 : Poorb 状态 :项目验收中
项目编号 : 172609
项目预算 : ¥15,000-20,000
开发周期 : 30 天
技能 : C++ Java
发布日期 : 2014-03-09
竞标后显示联系方式

描述

主要过程是把数万的英文关键词进行拆分成单词,然后通过定义单词的属性。以便自动判定关键词之间关系的密切程度,实现自动对意思相近的关键词进行结合归类。

已有具体的需求文档

[2018-02-26 01:07:12 增加内容] 目的 实现数十万英文关键词的有效,有序,高效管理 名词定义 行业:每个行业都具有一整套独立的关键词、词元素及词关系。 关键词:凡是用户在搜索引擎中用来搜索的词都叫关键词,每个行业内的关键词数量级一般是几万到几十万。每个关键词都有其名称,搜索热度等数据,这些数据的具体数值均由用户手动导入。 词元素:即组成关键词的单词,也可能是通过词关系设置进行组合过的单词组,每个行业内的关键词数量级一般是几百到几千。每个词元素均有词元素出现次数(即在该行业内的所有关键词中,包含该词元素的关键词数量)及词元素热度(即在该行业内所有包含这个词元素的关键词的搜索热度之和)数据,这些数据由系统根据含有该词元素的关键词的数据进行自动计算和更新。 词分类:用来定义元素词的类别,每个行业内的一个元素词最多只能属于一个分类,但是每个元素词在不同的行业可能属于不同的分类。词分类将用于后续界定关键词之间关系的密切程度。具体分类由人来手动设定,具体词分类包括: 特征词:即能体现出产品规格参数有实质差异的形容词,包括外观,材质,特性等区别的词,一般是形容词,如red,black等 通用词:即产品规格参数无实质差异的形容词,只是用来营销的词汇,一般是形容词,如hot,fashion,new等 词干:即物品名称,一般为名词,如sock,slipper等 词关系:用来定义元素词与元素词之间的关系,关系由人来手动设定,具体词关系包括: 归一词:即两个词虽然字眼不一样,但搜索引擎认为是完全一致的词,比如sock 和socks ,men 和man, custom 和customized。这种词在逻辑上只把它当成一个词来处理,另一个词相当于只是相当于该词的 “别名” 同义词:即意思上相同,但是不是归一词的词, 比如 kid 和children等 组合词:即当这些词组合在一起时会产生特殊的意义,比如 high quality。如果发现有组合在一起的组合词,要把它当成一个 元素词来 处理。其中组合需要区分词组合顺序,不同组合顺序的组合词视为不同的词元素 剔除词,即需要剔除的单词,如果某单词被剔除了,那么所有包含该单词的关键词都要被剔除(即把关键词扔到剔除词表中) 流程实例简述 主要过程是把数万的关键词先进行拆分成单词(词元素),然后通过定义单词的分类,以及单词与单词之间的关系,如同义词,组和词等。这样就可以根据一定的逻辑规则来判断绝大多数由这些单词组成的关键词之间关系的密切程度,最终的目的是把三个关系密切的关键词组合起来。整个的处理流程举例: 1.用户向系统导入5万个关键词(通过xls或csv或自由输入) 2.系统将自动过滤其中重复的关键词(包括原输入时本身有重复的词及与原关键词数据库有重复的词),剩下4万 3.然后将组成4万个关键词的500个单词列出来,并自动计算这些单词的元素热度,出现次数等 4.用户对这500个单词进行设置词元素属性及元素之间的关系 5.系统根据单词的属性,对含有这些单词的关键词进行处理(比如剔除了9000关键词,归一了1000个关键词,那么关键词就剩下3万个) 6.系统自动对剩余的3万个关键词根据关系的密切程度进行三个三个的组合,最终形成9900个关键词的组合,每个关键词组合含有3个关键词,另外剩下300个关键词由于没有符合的关联度无法被组合 7.允许用户在此基础上,可以对指定的被组合过的关键词进行清除组合或重新组合或其他自定义组合
[2018-02-26 01:22:47 增加内容] 目的 实现数十万英文关键词的有效,有序,高效管理 名词定义 行业:每个行业都具有一整套独立的关键词、词元素及词关系。 关键词:凡是用户在搜索引擎中用来搜索的词都叫关键词,每个行业内的关键词数量级一般是几万到几十万。每个关键词都有其名称,搜索热度等数据,这些数据的具体数值均由用户手动导入。 词元素:即组成关键词的单词,也可能是通过词关系设置进行组合过的单词组,每个行业内的关键词数量级一般是几百到几千。每个词元素均有词元素出现次数(即在该行业内的所有关键词中,包含该词元素的关键词数量)及词元素热度(即在该行业内所有包含这个词元素的关键词的搜索热度之和)数据,这些数据由系统根据含有该词元素的关键词的数据进行自动计算和更新。 词分类:用来定义元素词的类别,每个行业内的一个元素词最多只能属于一个分类,但是每个元素词在不同的行业可能属于不同的分类。词分类将用于后续界定关键词之间关系的密切程度。具体分类由人来手动设定,具体词分类包括: 特征词:即能体现出产品规格参数有实质差异的形容词,包括外观,材质,特性等区别的词,一般是形容词,如red,black等 通用词:即产品规格参数无实质差异的形容词,只是用来营销的词汇,一般是形容词,如hot,fashion,new等 词干:即物品名称,一般为名词,如sock,slipper等 词关系:用来定义元素词与元素词之间的关系,关系由人来手动设定,具体词关系包括: 归一词:即两个词虽然字眼不一样,但搜索引擎认为是完全一致的词,比如sock 和socks ,men 和man, custom 和customized。这种词在逻辑上只把它当成一个词来处理,另一个词相当于只是相当于该词的 “别名” 同义词:即意思上相同,但是不是归一词的词, 比如 kid 和children等 组合词:即当这些词组合在一起时会产生特殊的意义,比如 high quality。如果发现有组合在一起的组合词,要把它当成一个 元素词来 处理。其中组合需要区分词组合顺序,不同组合顺序的组合词视为不同的词元素 剔除词,即需要剔除的单词,如果某单词被剔除了,那么所有包含该单词的关键词都要被剔除(即把关键词扔到剔除词表中) 流程实例简述 主要过程是把数万的关键词先进行拆分成单词(词元素),然后通过定义单词的分类,以及单词与单词之间的关系,如同义词,组和词等。这样就可以根据一定的逻辑规则来判断绝大多数由这些单词组成的关键词之间关系的密切程度,最终的目的是把三个关系密切的关键词组合起来。整个的处理流程举例: 1.用户向系统导入5万个关键词(通过xls或csv或自由输入) 2.系统将自动过滤其中重复的关键词(包括原输入时本身有重复的词及与原关键词数据库有重复的词),剩下4万 3.然后将组成4万个关键词的500个单词列出来,并自动计算这些单词的元素热度,出现次数等 4.用户对这500个单词进行设置词元素属性及元素之间的关系 5.系统根据单词的属性,对含有这些单词的关键词进行处理(比如剔除了9000关键词,归一了1000个关键词,那么关键词就剩下3万个) 6.系统自动对剩余的3万个关键词根据关系的密切程度进行三个三个的组合,最终形成9900个关键词的组合,每个关键词组合含有3个关键词,另外剩下300个关键词由于没有符合的关联度无法被组合 7.允许用户在此基础上,可以对指定的被组合过的关键词进行清除组合或重新组合或其他自定义组合

项目竞标

接包方 国家/地区
通过实名认证 拥有案例
5
Jackl
北京市
通过实名认证 拥有案例
5
Wenx
通过实名认证 拥有案例
4
Fc01
通过实名认证 拥有案例
4
Kmwwkj
昆明市
通过实名认证 拥有案例
3
Pinmu1034110233
通过实名认证 拥有案例
2
Poorb (中标)
通过实名认证 拥有案例
1
Xiaoxubeii

竞标

请您先登录,然后提交此项目的竞标方案。
还不是智城用户? 智城期待您的加入,请注册成为我们的一员吧!
Project ad2