主要针对中文。英文在分词、去重场景建议用空格分割。对比、排序、统计对中英文均适用。

若手文本工具箱_文本工具

Overview

软件介绍

智能语义去重

字不一样、意思一样也能去重
词序不同：苹果香蕉 = 香蕉苹果
包含关系：旅游哪里好 ≈ 国内旅游哪里好
伪长尾、标点差异均可识别

智能分组

海量关键词自动分类，分组一键完成
关键词结构自动发现，助力用户需求挖掘
种子词手动分组，双模式分类更精细
多进程加速，数十万级关键词快速搞定

一站式文本处理

9 大工具：组合、分词、分组、对比、去重、排序、统计、相似度、DOC图片提取
文本对比 7 种模式：谁在谁里、谁独有、交集、并集、对称差
自定义顺序、数字部分、行反转特色排序

关键词组合

将多个关键词列表进行组合，适用于长尾关键词扩展、矩阵关键词生成、内容批量创作等场景

逻辑：每个列表的所有关键词拼接组合一次，组合条数 = 各列表长度相乘。
顺序组合：按列表先后拼接，如 [北京,上海] + [旅游,美食] → 北京旅游、北京美食、上海旅游、上海美食。
随机组合：每条内部词序随机打乱，组合条数不变，不固定谁前谁后。最多 4 个列表。

关键词组合功能演示.webp

文本分词

对文本/关键词分词，统计词频和词性，适用于关键词分析、关键词分组（为分组提供种子词）等场景。

分词：jieba 分词、词性标注、词频统计。
不拆分词：将指定词「保护起来」视为整体，如品牌名、专有名词。
停用词：剔除「的、是、在、了」等无意义词，不参与词频。
过滤：最小字数（如设为 2 则过滤单字）、纯数字、纯字母、标点符号。
导出：txt 只有词，csv 含词频词性；种子词可导出/追加到分组工具。5 万行以上多进程。

文本分词功能演示.webp

文本分组

根据配置智能分组，或者根据种子词进行手动分组，适用于关键词分类、用户需求挖掘、内容整理、等场景

若手文本工具箱文本分词，导出.webp

智能分组：无需种子词。最小词频：出现 N 次以上的词才当分组用。
组合词数：2～3 个词作为分组依据（如北京+公司、北京+公司+地址）。
分组最小词数：每组最少 N 个词，少于则归入「其他」。
相似度再分组：对「其他」启用二次分组，阈值越高越严格。
手动分组：种子词来自输入或分词导出；
只匹配第一个：每个关键词只分配一次；
匹配所有：可分配多次。支持十万级、数十万级关键词，多进程。

文本对比

对两份文本（A、B）按行对比，找出「谁在谁里」「谁独有」「共有」「全部」「对称差」等结果，适用于名单核对、版本差异、去重补全等场景

7 种模式：A 在 B 中（共同项）、A 不在 B 中（A 独有）、B 在 A 中、B 不在 A 中（B 独有）、交集（完全相同）、并集（合并去重）、对称差（两版差异）。
匹配：精确、部分、相似度。
可选项：去重、过滤空行、忽略大小写、长度过滤。

若手文本工具箱，文本对比功能演示.webp

文本去重

针对字不一样、意思一样的去重（常规去重只能识别完全相同的字符串）。

支持：

词序不同（苹果香蕉 = 香蕉苹果）
包含关系（旅游哪里好 ≈ 国内旅游哪里好）
重复叠词（苹果苹果香蕉 → 苹果香蕉）
伪长尾（旅游的公司 = 旅游公司）
标点差异（若手 - 软件 = 若手软件）

保留：可选最短 / 最长（核心词 or 长尾词）。

若手文本工具箱文本去重功能演示.webp

文本排序

数据整理、内容排序

常规：字母、长度、数字（看行里第一个数字）正序/倒序。

特色：行反转（首行变末行）、自定义顺序（填高,中,低等，按从左到右排）、数字部分排序（行里所有数字拼成数再排，如 1苹2果3→123）、特殊字符排序（按特殊字符个数）。支持先去重后排序。

若手文本工具箱文本排序功能，自定义顺序演示.webp

字数统计

篇幅评估、用词分析、编码检查。统计：字符、词、行、句、段及编码；字符频率、词频。

若手文本工具箱字数统计功能演示.webp

相似度计算

查重、改写对比、语义相近判断。两段文本算出一个 0～1 的相似度数值。

算法：余弦相似度（用词是否相近）、Jaccard（共有词占比）、Levenshtein 编辑距离（逐字对比，适合短句）。
与文本对比的区别：对比按行比对，关心谁多谁少、交并差；相似度关心「有多像、像到什么程度」。

DOC 图片批量提取

从 Word 文档（.docx / .doc）中批量提取嵌入的图片，保存到文档同名文件夹，不用一张张截图或右键另存为。

批量处理：拖拽导入文件或整个文件夹，多份文档一次提取，实时显示每个文件的处理状态。
命名规则：文件名顺序 / 纯数字顺序 / 图片原名 / 时间戳顺序，按需选择。
输出格式：Original（保持原图格式）/ PNG / JPEG / BMP，可统一转换。
双格式支持：.docx 直接提取；.doc 老格式需本机安装 Word，自动调用转换后提取。

若手文本工具箱DOC图片批量提取功能，拖拽文件夹至软件.webp

Changelog

更新记录

展示最近几个版本的核心变更，更多历史版本可在文档中心查看。

FAQ

常见问题

智能去重和普通去重有什么区别？

智能分组需要输入种子词吗？

支持处理多大的文件？

为什么有些文本没被识别为重复？

支持英文吗？

导出时提示「文件被占用」怎么办？

Tutorials

使用教程

查看图文教程与视频演示，快速上手。

若手文本工具箱 · 关键词组合（图文）若手文本工具箱 · 文本分词（图文）若手文本工具箱 · 文本分组（图文）若手文本工具箱 · 文本对比（图文）若手文本工具箱 · 文本去重（图文）若手文本工具箱 · 文本排序（图文）若手文本工具箱 · 字数统计（图文）若手文本工具箱 · 相似度计算（图文）若手文本工具箱 · DOC图片导出（图文）

Service

服务保障

💯 兼容性保证

若软件与用户电脑不兼容或无法正常使用，自购买之日起 24 小时内提供全额退款服务。

🛠️ 远程技术支持

提供 QQ 或向日葵远程服务，确保及时解决使用中的任何问题。

✨ 功能定制开发（免费 + 增值）

基础定制免费：高需求功能持续更新添加
深度开发服务：专业级需求提供付费解决方案

若手视频工具箱

视频批量智能变速

若手字幕音频批量生成器

AI重命名工具

若手商品数据筛选工具

图片批量压缩

若手矩阵侠

若手网站卫士

若手内容管家

若手文本工具箱

若手模板文章批量生成（d...

若手关键词组合工具

若手表格批量合并

若手鼠标连点器