統計一個文件中某個字符串的個數,其實就是在在一塊沙地里面找石頭,有的人看到石頭以后,在上面做個標記(grep),然后記住自己做了多少個標記;有的人看到石頭以后,把它挖了(tr),最后統計自己挖了多少石頭;有的人看到石頭以后,把它跳過去(awk),然后統計自己跳了多少次。
這是我用的的文件
[root@bzhou test]# cat file
hafsdha
hahafsdfsdhaha
haha
我想匹配的是‘haha'這個字符串
1.grep的-o選項
[root@bzhou test]# grep -c 'haha' file
2
最開始的時候是用-c這個選項,不過-c只能統計一行的,如果一行里面有多個匹配的字符串,那-c就無能為力了。
這個是正確的
[root@bzhou test]# grep -o 'haha' file | wc -l
3
2. awk
這個東西要感謝CU上的blackold。
[root@bzhou test]# awk -v RS='haha' 'END {print --NR}' file
-v 去設定一個變量的值,RS是記錄的分隔符,默認的是新行(\n),就是說awk按照一行一行讀數據,但是現在RS為'haha'后,就按'haha'讀數據了,NR為已讀的記錄數,n個記錄是被n-1個分隔符分開的,所以就是--NR了。
3.tr
嚴格意義上說,tr匹配不了字符串,只能去匹配單個字符。這里就匹配這個文件中‘h'的個數。
[root@bzhou test]# tr -cd 'h' <file | wc -c
8
[root@bzhou test]# grep -o 'h' file | wc -l
8
-d可以刪除某個字符,如果只有-d就會輸出刪除特定字符后的字符串,但是-c可以反顯,這就是顯示了被刪除的字符。然后可以用wc -c去統計下字符的個數。
總結
以上就是這篇文章的全部內容了,希望本文的內容對大家的學習或者工作具有一定的參考學習價值,謝謝大家對腳本之家的支持。如果你想了解更多相關內容請查看下面相關鏈接