一个易用方便的工具站
您的当前位置: 首页 词频统计

词频统计

0 /  40000
词频统计是指用程序来统计某字符串中总共有多少个单词,每个单词出现的次数。
1、排除单字符 : 单字符串是指字符串中只有一个字符,该字符串长度为1的字符。
      比如:单字符就是指'a','b','c','单','字','符'这些,这些字符在文本词频统计中没有组成词语或成语等,本工具可以选择是否排除单字符,不统计单字符

2、自定义字典 : 在某些特殊情况下,可能需要自定义字典规则。比如,在处理一些专业术语或新词时。 自定义字典可以更好地处理一些特殊情况下的文本,提高文本处理效率。
      自定义字典使用多个词语时,以 英文逗号 连接,只支持 10个 自定义字典
      比如:使用 ["云计算","大数据基座","云数据"] 自定义字典进行词频统计,可以方便解析:
      "云计算" 出现 100次
      "大数据基座" 出现 100次
      "云数据" 出现 100次

3、是否返回json格式 : 是指词频统计结果是否返回json格式,返回json格式方便用于图表数据统计显示。
      json格式字符串:[{"word": "云计算", "count": 10},{"word": "大数据基座", "count": 100},{"word": "云数据", "count": 99}]

4、JSON格式化按钮可以快速跳转到本网站工具,方便快速处理json数据

5、JSON数据转换图表按钮可以快速跳转到本网站工具,一种可以在线快速生成转换图表的工具,如折线图,饼状图等,直观明了观察数据趋势走向。

6、去掉空格按钮是指输入需要统计的内容进行清除空格,包括内容开头、中间、结尾部分都清除空格.
发表评论