Linuxのコマンドで、テキストファイルの単語数やバイト数等をカウントするためのコマンド「wc」の使い方と注意点について解説します。
wc(ダブルシー)コマンドの基本的な使い方
テキストファイルの中のバイト数、文字数、単語数及び行数をカウントできます。
> wc (カウント対象テキストファイル名)
行数カウントの注意点は、wcのカウントは行数でなく「改行数」をカウントしている
wcコマンドでカウントする行数は、「改行数」です。
従って、テキストファイルの最後の行のように、その行に改行が無いとカウント対象となりません。
また、改行のみの行も1行としてカウントします。
スポンサーリンク
wcコマンドで使えるオプション一覧
wcコマンドで使える各オプションの使い方を解説します。
オプションを付けないと指定したテキストファイルの行数、単語数、バイト数を表示する
オプションを付けない場合、行数、単語数及びバイト数を表示します。
下記の通り、カウント結果は左から「行数」、「単語数」、「バイト数」の順で表示します。
> wc textfile.txt
299681 2144048 46300188 textfile.txt
「-c」はバイト数のカウント結果を表示する
オプションとして「-c」を付けると、カウント結果にバイト数のみ表示します。
> wc -c textfile.txt
46300188 textfile.txt
「-m」は文字数のカウント結果を表示する
オプションとして「-m」を付けると、カウント結果に文字数のみ表示します。
なお、「a、b、c」といったアルファベットや数字は1文字で1バイトですが、「漢」といった漢字は1文字で2バイト使用します。1文字で2バイトとなる漢字も1文字を「1文字」とカウントしてくれます。
> wc -m textfile.txt
23150094 textfile.txt
「-l」は行数のカウント結果を表示する
オプションとして「-l」を付けると、カウント結果に行数(正確には改行数)のみ表示します。
> wc -l textfile.txt
299681 textfile.txt
【注意】上記「wc -l textfile.txt」は改行の数をカウントするコマンドであるため、空白行がカウントされていたり、最終行のように改行が無い行はカウントされない可能性があります。
「-w」は単語数のカウント結果を表示する
オプションとして「-w」を付けると、カウント結果に単語数のみ表示します。
> wc -w textfile.txt
299681 textfile.txt