モーグルとカバとパウダーの日記

モーグルやカバ(EXカービング)山スキー(BC)などがメインの日記でした。今は仕事のコンピュータ系のネタが主になっています。以前はスパム対策関連が多かったのですが最近はディープラーニング関連が多めです。

テキスト中にマッチする単語の「個数」を数える方法

以前はてなで、

人力検索はてな - Unixで、テキスト中にマッチする単語の「個数」を数えたいです。 Perlとかで書けば出来ますが、grepとかwcとかをうまく使えば、コマンドだけで簡単に出来そうな気がするの..

という質問を書いたのですが、その時はこれ!というエレガンスな答えが得られませんでした。
が、id:lurker さんから、この質問にコメントをいただき、それがばっちり自分の望んでいたものでした。ありがとうございます。

egrep -o '単語' ファイル名 | wc -l

ちなみにいただいたコメントではegrepになっていたので、そのままにしましたが、単にgrepでもfgrepでも使えます。


ちなみに、man grep で -o の記述が出てこなかったので、なぜだろう??と思ってふと LANG=C にして見たところ、今度はちゃんと -o の記述がありました。
grepのVer2.5からの機能のため、(Debian sargeの)日本語訳manのほうには表記がないのでした。
ちなみにこの情報を調べるために、2.5から追加された --color というオプションがあることも知りました。

GNU grep 2.5 の新機能: --color, --only-matching, --perl-regexp , 追記 : いやな日記


しかし、なぜか質問のほうのコメントにいただいた内容が出てこず、メールだけが届いたんですがなんでなぜだろう??