文本长度过滤

按字符数或 UTF-8 字节数过滤文本行,支持保留或删除指定长度范围内的行,适用于数据清洗与文本筛选

长度过滤

输入文本,按每行长度范围保留或删除

0 行
等待输入...
广告位

使用说明

  1. 在输入框中输入需要过滤的文本,每行作为一个独立项
  2. 设置最小长度与最大长度,定义过滤范围
  3. 选择"过滤模式":保留范围内或删除范围内
  4. 选择"长度类型":按字符数或按 UTF-8 字节数计算长度
  5. 勾选"忽略空行"可跳过空白行,"去除首尾空格"清理每行多余空格
  6. 结果框查看过滤后的文本,点击"复制"或"下载"保存

适用场景

  • 数据清洗:过滤超长或超短异常行
  • 词表整理:保留指定长度的词条
  • 编码校验:按 UTF-8 字节数筛选多字节字符
  • 日志处理:删除冗余空行与短行

安全保障

  • 本地处理:所有过滤在浏览器本地完成
  • 隐私保护:不收集、不存储用户输入内容
  • 免费使用:无需注册,打开即用
  • 多语言支持:兼容中文、英文、日文等所有字符

常见问题

"按字符数"和"按字节数"有什么区别?

按字符数统计时,一个汉字算 1 个字符;按 UTF-8 字节数统计时,一个汉字通常占 3 个字节。例如 "中文" 字符数为 2,UTF-8 字节数为 6。

"保留范围内"和"删除范围内"如何选择?

"保留范围内"会输出长度在 min~max 之间的行;"删除范围内"则相反,输出长度不在该范围内的行,常用于剔除特定长度的异常数据。

勾选"去除首尾空格"会影响长度计算吗?

会。该选项会先去除每行的首尾空白字符,再计算长度并参与过滤,避免因缩进或尾部空格导致长度判断偏差。