2021.02.27

Lv1

Linuxのテキストフィルタ処理～sortコマンド・uniqコマンド～

urakawa

今回の内容

今回は、sort・uniqコマンドについて解説します。

・sort
・uniq
・まとめ

sort

テキストファイルをソートするには、「sort」コマンドを使用します。

コマンド
意味	行単位でファイルの内容をソートする。
書式	sort [オプション] [+開始位置 [-終了位置]] [ファイル名]
オプション	説明
-b	行頭が空白ならば、無視。
-f	大文字と小文字の区別なくソート。
-r	降順にソート。
-t	指定したを区切り文字としてフィールドを認識。
-n	数字を文字でなく数値として処理。
-k	ソート対象としてn番目のフィールドを指定。

——————–

サンプルファイルの作成

viコマンドで「sample1.txt」を作成

[root@localhost ~]# vi sample1.txt
[root@localhost ~]# cat sample1.txt
 2 BBR

1 AAA
11 CCC

12 DDDD
31 ABCDEF

★スペースで作成
[root@localhost ~]#

——————–

例）ソートして表示

「sample1.txt」をソートして表示。

[root@localhost ~]# sort sample1.txt


 2 BBB
1 AAA
11 CCC
12 DDDD
31 ABCDEF
[root@localhost ~]#

——————–

例）ソートして表示（数字を文字ではなく数値として処理）

「sample1.txt」をソートして表示。（数字を文字ではなく数値として処理）

[root@localhost ~]# sort -n  sample1.txt


1 AAA
 2 BBR
11 CCC
12 DDDD
31 ABCDEF
[root@localhost ~]#

——————–

例）ソートして表示。（行頭が空白なら無視して処理）

「sample1.txt」をソートして表示。（行頭が空白なら無視して処理）

[root@localhost ~]# sort -b  sample1.txt


1 AAA
11 CCC
12 DDDD
 2 BBR
31 ABCDEF
[root@localhost ~]#

——————–

uniqコマンド

ソート済みのファイルから重複した行を削除には、「uniq」コマンドを使用します。
本来、「uniq」コマンドは、連続して重複している行を1行にまとめて表示するコマンドなの
で、「sort」コマンドなどで、並べ替えてから使用されることが多いです。

コマンド
意味	入力されたテキストストリームの中で重複している行を調べ、重複している行は１行にまとめて出力する。
書式	uniq [オプション] [入力ファイル名 [出力ファイル名]]
オプション	説明
-d	重複している行のみ出力。
-u	重複していない行のみ出力。
-c	それぞれの行が何回現れたかを行の内容とともに表示。

——————–

サンプルファイルの作成

viコマンドで「sample2.txt」を作成

[root@localhost ~]# vi sample2.txt
[root@localhost ~]# cat sample2.txt
111111
222222
333333
444444
333333
222222
[root@localhost ~]#

——————–

例）連続して重複している行を1行にして表示

「sample2.txt」をソートし、その結果の中で連続して重複している行を1行にして表示。

[root@localhost ~]# sort sample2.txt
★sortのみ確認
111111
222222
222222
333333
333333
444444

★重複を一行に（一度sortして出力）
[root@localhost ~]# sort sample2.txt | uniq
111111
222222
333333
444444
[root@localhost ~]#

——————–

例）連続して重複している行のみを表示

「sample2.txt」をソートし、その結果の中で連続して重複している行のみを表示

★重複している行のみ出力
[root@localhost ~]# sort sample2.txt | uniq -d
222222
333333
[root@localhost ~]#

——————–

例）連続して重複している行を除いて表示

「sample2.txt」をソートし、その結果の中で連続して重複している行を除いて表示。

★重複している行を除いて出力
[root@localhost ~]# sort sample2.txt | uniq -u
111111
444444
[root@localhost ~]#

——————–

まとめ

sort・uniqコマンドしっかりの実行結果をしっかり覚えておきましょう！
それでは今回はこのあたりで。

確認問題

問題1

テキストファイルをソートするコマンドで、正しい選択肢を１つ選びなさい。

A) join
B) paste
C) sort
D) pwd

解答・解説

答え：C

A) ⇒ フィールドが共通する行を結合するコマンドなので、誤りです。
B) ⇒ ファイルを行単位で結合するコマンドなので誤りです。
C) ⇒ テキストファイルをソートするには、「sort」コマンドを使用します。
D) ⇒ 現在のディレクトリを確認するコマンドなので、誤りです。

問題２

ソート済みのファイルから重複した行を削除するコマンドで、正しい選択肢を１つ選びなさい。

A) ls
B) uniq
C) cd
D) cat

解答・解説

答え：

A) ⇒ ファイルを一覧表示するコマンドなので、誤りです。
B) ⇒ ソート済みのファイルから重複した行を削除するするには、「uniq」コマンドを使用します。
C) ⇒ ディレクトリを移動するコマンドなので、誤りです。
D) ⇒ ファイルの中身を表示するコマンドなので、誤りです。

Linux資格「LPIC Lv1」徹底解説　連載目次リンク

Linux資格「LPIC Lv1」徹底解説　連載目次

連載執筆講師が講座開講中！ITスクール SAK

ITスクールSAK ｜ LPIC Lv1合格保証コース　講座紹介ページ

ルーターの機能とルーティング-スタティックルーティング-スタティックルーティングとは

Linuxのテキストフィルタ処理～trコマンド・sedコマンド～

一覧へ戻る

Infra Engineer

Linuxのテキストフィルタ処理～sortコマンド・uniqコマンド～

今回の内容

sort

uniqコマンド

まとめ

確認問題

Linux資格 「LPIC Lv1」徹底解説 連載目次リンク

連載執筆講師が講座開講中！ITスクール SAK

Linux資格「LPIC Lv1」徹底解説　連載目次リンク