【Pandas】日本語が含まれるファイルの読み込みと保存
MAX
MAX999blog
リストに存在するユニークな要素を知りたい時、リストから重複する要素を削除したい時などに、便利な方法。
集合を使用する。
pandasだとSeriesに対してunique()でユニークな要素を取得できる。
集合を利用する。
1list_a = [1, 2, 3, 4, 5, 4, 3, 2, 1, 0]
2// set()で集合にすることでリストから重複する要素を削除する
3// list()でリストに戻す
4unique_list_a = list(set(list_a))
5print(f"{unique_list_a=}")
6# unique_list_a=[0, 1, 2, 3, 4, 5]
複数のリストから重複を削除する場合、set()で集合を作成する際に、各リストを展開して1つのリストにしてやる必要がある。
1list_a = [0, 1, 2, 3, 4]
2list_b = [3, 4, 5, 6, 7, 8]
3list_c = [5, 6, 7, 8, 9, 10, 11]
4// set()に引数を渡す際に各リストを*で展開し、list_a, list_b, list_cを1つのリストにする
5unique_list_abc = list(set([*list_a, *list_b, *list_c]))
6print(f"{unique_list_abc=}")
7# unique_list_abc=[0, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11]