🐧

AWKの基本ポイント15項目

2023/04/17に公開

awkは非常に強力なテキスト処理ツールであり、習得するとLinuxのテキスト処理が大幅に効率化されます。
以下に、効率よくawkを習得するために学ぶべき15の項目と具体例を示します。

echo "apple 3 red" | awk '{print $1, $3}'

この例では、各行の1番目と3番目のフィールドを出力します。結果は "apple red" となります。

echo -e "1\n2\n3\n4\n5" | awk '{if ($1 % 2 == 0) print $1}'

この例では、偶数の行だけを出力します。結果は "2" と "4" となります。

echo -e "apple\nbanana\norange" | awk '/an/ {print $1}'

この例では、"an" を含む行だけを出力します。結果は "banana" と"orange"になります。

echo "OpenAI" | awk '{print tolower($1)}'

この例では、入力文字列を小文字に変換して出力します。結果は "openai" となります。

BEGINとENDブロック: awkでは、BEGINブロックとENDブロックを使用して、テキスト処理の前後に特定の処理を行うことができます。これは集計処理や初期化などに役立ちます。具体例:

echo -e "1\n2\n3\n4\n5" | awk 'BEGIN {sum=0} {sum+=$1} END {print sum}'

この例では、すべての行の数値を合計して出力します。結果は "15" となります。

echo "3 4" | awk '{sum=$1+$2; product=$1*$2; print "Sum:", sum, "Product:", product}'

この例では、各行の2つの数字を加算し、乗算した結果を出力します。結果は "Sum: 7 Product: 12" となります。

echo -e "apple\nbanana\napple\norange\nbanana" | awk '{count[$1]++} END {for (fruit in count) print fruit, count[fruit]}'

この例では、各果物の出現回数をカウントし、結果を出力します。

cat sample.txt | awk '/Error/ {print $0}' | wc -l

この例では、sample.txt内の"Error"という文字列を含む行の数をカウントします。

awk 'BEGIN {while (getline < "input.txt") {print $1 > "output.txt"}}'

この例では、input.txtファイルから各行の1番目のフィールドを抽出し、output.txtファイルに書き込みます。

awk 'function square(x) {return x*x} {print $1, "squared is", square($1)}' numbers.txt

この例では、入力ファイルnumbers.txtから各行の数値を読み取り、2乗した値を出力します。

echo "apple:5:red" | awk -F':' '{print $1, $3}'

この例では、コロン (:) をフィールドセパレータに設定し、1番目と3番目のフィールドを出力します。結果は "apple red" となります。

echo "apple 3 red" | awk 'BEGIN {OFS=" - "} {print $1, $3}'

この例では、出力フィールドセパレータを " - " に設定し、1番目と3番目のフィールドを出力します。結果は "apple - red" となります。

echo -e "apple#banana#orange" | awk 'BEGIN {RS="#"} {print $1}'

この例では、ハッシュ (#) をレコードセパレータに設定し、各レコードを別々に出力します。

正規表現によるフィールド分割: awkでは、正規表現をフィールドセパレータとして使用できます。これにより、複数の区切り文字に対応したフィールド分割が可能です。具体例:

echo "apple,5:red" | awk -F'[,:]' '{print $1, $3}'

この例では、コロン (:) とコンマ (,) の両方をフィールドセパレータとして使用し、1番目と3番目のフィールドを出力します。結果は "apple red" となります。

パターン範囲指定: awkでは、特定のパターンの範囲内のみを処理することができます。これにより、特定の範囲の行のみを対象に処理を行うことができます。具体例:

cat sample.txt | awk '/START/,/END/ {print $0}'

この例では、sample.txt内で "START" というパターンから "END" というパターンまでの範囲の行を出力します。これにより、特定の範囲のテキストのみを対象に処理を行うことができます。