栏目分类:
子分类:
返回
文库吧用户登录
快速导航关闭
当前搜索
当前分类
子分类
实用工具
热门搜索
文库吧 > IT > 软件开发 > 后端开发 > Java

java获取wps文档字数

Java 更新时间: 发布时间: IT归档 最新发布 模块sitemap 名妆网 法律咨询 聚返吧 英语巴士网 伯小乐 网商动力

java获取wps文档字数

1.说明

基于在线wps的字数统计功能,可以实现复杂的word文档的字数统计功能

2.代码
 public static void main(String[] args) throws Exception {
        String fileName = "d:\Users\ckj\Desktop\BPM\demo.docx";
        InputStream fileInputStream = new FileInputStream(fileName);
        try {
            ZipSecureFile.setMinInflateRatio(-1.0d);
            //获取文件后缀名
            String suffix = fileName.substring(fileName.lastIndexOf(".") + 1);
            //定义word内容
            String content = "";
            switch (suffix) {
                case "doc":
                    WordExtractor wordExtractor = new WordExtractor(fileInputStream);
                    content = wordExtractor.getText();
                    break;
                case "docx":
                    XWPFDocument document = new XWPFDocument(fileInputStream);
                    XWPFWordExtractor extractor = new XWPFWordExtractor(document);
                    content = extractor.getText();
                    break;
                default:
                    break;
            }
            //中文单词
            String cnWords = content.replaceAll("[^(\u4e00-\u9fa5,。《》?;’‘:“”【】、)(……¥!·)]", "");
            int cnWordsCount = cnWords.length();
            //非中文单词
            String noCnWords = content.replaceAll("[^(a-zA-Z0-9`\-=';.,/~!@#$%^&*()_+|}{":>
                if (s.trim().length() != 0) {
                    noCnWordsCount++;
                }
            }
            System.out.println(cnWordsCount + noCnWordsCount);
        } catch (Exception e) {
            e.printStackTrace();
        } finally {
            if (fileInputStream != null) {
                fileInputStream.close();
            }
        }
    }
转载请注明:文章转载自 www.wk8.com.cn
本文地址:https://www.wk8.com.cn/it/1039646.html
我们一直用心在做
关于我们 文章归档 网站地图 联系我们

版权所有 (c)2021-2022 wk8.com.cn

ICP备案号:晋ICP备2021003244-6号