rost詞頻統計軟件是款是款文章詞頻檢索分析軟件,rost的功能非常強大,對于分析出來的數據也是非常整潔,并且支持多種格式,可以直接對文章中的詞語進行提取和刪除。
rost詞頻統計分析軟件是一款非常出色的字頻統計和分析軟件,ROST中文字頻統計分析軟件正式版擁有簡潔化的設計界面,專業化的功能,其ROST中文字頻統計分析軟件正式版支持批量統計,最后生成一個統計結果的網頁文檔,非常直觀可見。同時,軟件也具有易用已操作的界面,可以快速統計漢字出現概率,對于分析文章有很大幫助。
1.統計一個文檔中和另外一個字表對比之后超綱的詞及詞頻數,對字頻統計結果進行詞頻升序、詞頻降序、字母升序、字母降序排列
2.統計一個文檔中出現過的所有漢字及非漢字頻度
3. 詞典工具具有超強功能:提取某個長度的詞、刪除首字符串含某字符串的詞、提取尾字符串為某字符串的詞、刪除尾字符含某字符串的詞、提取出首字符串為某字符串的詞、字串的每一個詞的unicode值或ASC值、提取尾字重復的字符串、詞組排序、刪除重復的字符串、刪除含某個詞串的詞、將文本打散為一詞一行、提取含某個詞串的詞、附帶ASC碼表、刪除連續空格、任意提取單空格詞組或多空格詞組、刪除詞中含有的某些字符、剔除含有某些漢字或其他字符的行,提取某個字符串之前所有單詞。
4.對于普通文檔可以將其打散后進行操作,本詞典工具目前的處理速度尚未優化,準備在下一版本將詞典工具單獨拿出來,進行優化,以便處理極大的文檔。
1、用戶可以批量選擇一系列的文本文件,進行批量生成頻度文件Fre。頻度文件是一種包含字或詞以及頻度的自定義數據文件,是ROST的專有格式。通過Fre的定義,可以有效提高處理速度。對頻度文件Fre的處理可以進行合集和交集的計算。合集得到所有頻度文件的總和。而交集得到的是所有頻度文件中都含有的文字。
2、可以對一系列文檔進行交集提取,得到某個類型(如旅游類、計算機類)文檔中的共同特征字。而合集則可以迅速對大文檔進行處理,鑒于本軟件的高速度,進行1000億的文字統計也是可能的。
3、自定義過濾詞表,可以使用菜單右鍵查看過濾詞表,添加自己需要的過濾詞。目前使用的過濾詞表為空,用戶可以自行增加。使用菜單保存詞表之后將該文本文件覆蓋軟件目錄下的dict目錄下的compare.txt即可,使用過濾詞可以非常方便的獲得超綱的字有哪些。
4.從剪貼板統計文字。注意如果先點擊了剪貼板統計文字,則非中文統計顯示的是剪貼板里面的非中文,而不是文件里面的非中文。
-ROST不支持對excel文件進行分詞,所以先將剛剛的實驗數據復制到txt文檔中
-選擇“功能性分析” > &分詞”,將剛剛準備的txt文檔導入后點擊“確定”。
-ROST分完詞之后會自動將分詞結果打開,文件儲存在分詞文件所在的路徑中,可以看到結果已經進行分詞了。
-接著我們要將分詞處理后的文檔進行詞頻分析,選擇“功能性分析” > &詞頻分析(中文)”,將剛剛分詞后的txt文檔導入后點擊“確定”。
網友評論
支持 (0 ) 回復
支持 (0 ) 回復