概述
你可以通过软件:
- 从几万个评论中,找出来大家到底在说什么。
- 几万几十万关键词分类之前,先提取一轮高频词,基于高频词再分类。
- 一批电商标题,找出来卖点、款式等。
逻辑:把成千上万行句子/关键词,拆解成一个个独立的词,告诉你哪个词出现得最多。
是做SEO分析、词频统计和建立标签体系的第一步。
总体使用流程
导入数据 ➔ 设定规则(不拆分/停用) ➔ 过滤垃圾 ➔ 运行 ➔ 挑选高频词 ➔ 导出/发送给分组工具。
核心用途
1. 提炼高频词(找卖点):
比如你抓取了竞品的一万个标题。扔进工具跑一下,发现“透气”这个词出现了 5000 次,“纯棉”只出现了 200 次。下个产品的主打卖点,不就有数了?
2. 清洗词库(筛垃圾):
手里的关键词,有乱码、标点和无意义的词。这个工具能像筛沙子一样,把这些垃圾筛掉,只留下有用的干货。
3. 为“文本分组”做准备(定标签):
通过分词,找出频率最高的词(比如“连衣裙”、“短裤”、“外套”)。这些词就是天然的分类标签(种子词)。把它们提取出来,下一步用“文本分组工具”把那几万个标题自动归类了。
操作指南

第一步:导数据
左侧输入框数据:
数据少:一行一个,直接粘贴。
数据多:直接粘贴容易卡,点击 “📄 导入文件” 按钮,选择 txt 文件。几万行数据瞬间就能读进去。
第二步:配置
这里如果不设置,分的词可能没法用。
有两个核心:
1. 🔒 不拆分的词(保护名单)
比如“洗碗机”,有时候可能会分成“洗碗”和“机”,那这肯定不行。
- 怎么做:把你不想被分开的词(品牌名、专有名词等)填在“不拆分的词”这一栏里,用逗号隔开。
- 进阶:如果有一份现成的品牌(词表),可以 “📂 选择文件” 直接导入。
2. 🚫 停用词(黑名单)
“的”、“了”、“啊”、“是”这类没实际意义的字,如果不过滤掉,词频榜前几个永远是这些。
把你不想看到的垃圾词填在这里。
软件已经内置了一份基础的停用词,可以基于结果添加停用词。
第三步:精细过滤
左下角的一排勾选项:
- 最小字数:强烈建议勾选。把它设为 2,大多数业务分析里,单字(如“我”、“看”、“好”)一般没分析价值。
- 过滤纯数字:勾上(型号、零件等关键词时不用勾)
- 过滤纯字母:视情况而定。如果是做外贸或者分析型号,不要勾;如果是纯中文分析,勾上能把乱码筛掉。
- 过滤标点符号:建议勾选。
第四步:一键分词
点击绿色的 “🚀 开始” 按钮。
- 速度:底部会有进度条。几千条数据一般都是秒出结果。
- 智能加速:如果你的数据量特别大(比如几十万条),工具会自动开启多线程模式(也就是火力全开),电脑风扇可能会转一下,稍等片刻就好。
结果分析与调整

跑完之后,右边的表格就满数据了。
- 词:拆解出来的结果。
- 词频:这个词出现了多少次(默认从高到低排好了,排在最上面的就是核心热词)。
- 词性:告诉你它是名词(n)、动词(v)还是形容词(a)。
✋ 觉得结果不满意?手动调一下
如果发现列表里混进了一些奇怪的词(比如“哈哈哈”),不用重新跑。
1. 在表格里选中那一行。
2. 点击右键,选择“删除”。
3. 如果不小心删错了,按 Ctrl+Z 可以撤销,或者右键选“撤销删除”。
4. 如果你觉得这一批词都很好,想留着备用,可以右键“复制”。
数据导出:连接下一步工作
右下角有四个导出按钮,分两类用途:
用途一:存下来自己看
1. 💾 导出 CSV(推荐):保存成表格文件,包含词、频率和词性三列完整数据。
2. 📄 导出 TXT:一行一个词,可以给其他软件用,或者做成词云图。
用途二:发给“文本分组工具”

如果你是用这个工具套件做标签分类的,注意这两个按钮的使用:
1. 🌱 导出到种子词
- 场景:你刚开始建立分类体系。
- 作用:它会把分词结果直接“发送”到文本分组工具的“种子词”列表里,并覆盖掉那里原有内容。
- 例子:你从标题里分出了“长袖”、“短袖”、“无袖”三个高频词。点这个按钮,这三个词就自动填到分组工具里去了,你可以马上开始按这三个词对标题进行归类。
2. ➕ 追加到种子词
- 场景:你的分类体系已经建立了一部分,想补充新词。
- 作用:它把选中的词(或者全部词)加到文本分组工具里,保留原有词,只加新的。
- 例子:你之前已经有了“长袖”的分类,今天发现“七分袖”也很火。点这个按钮,“七分袖”就会自动补进去,不会把你辛苦整理的老词冲掉。