PROGRAMMING

파이썬 List 중복 제거

안녕하세요 Y입니다.

오늘은 파이썬 List에서 중복 제거하는 방법을 알아보겠습니다.

 

1. 집합 자료형 set 이용하기 

names = ['Lim','Kim','Park','Choi','Jung','Lee','Lim','Park']
my_set = set(names)
my_list = list(my_set)
print(my_list)

['Lim', 'Choi', 'Jung', 'Park', 'Kim', 'Lee']

리스트의 순서가 뒤죽박죽 섞입니다.

 

2. 리스트의 순서를 유지하면서 중복제거 하기

names2 = ['Lim','Kim','Park','Choi','Jung','Lee','Lim','Park']
my_list2 = []
for name in names2:
    if name not in my_list2:
        my_list2.append(name)

print(my_list2)

['Lim', 'Kim', 'Park', 'Choi', 'Jung', 'Lee']

 

3. numpy 라이브러리 이용하기

참고: numpy 는 행렬이나 일반적으로 대규모 다차원 배열을 쉽게 처리할 수 있도록 지원하는 파이썬의 라이브러리

import numpy as np

names3 = ['Lim','Kim','Park','Choi','Jung','Lee','Lim','Park']
my_list3 = np.unique(names3).tolist()

print(my_list3)

['Choi', 'Jung', 'Kim', 'Lee', 'Lim', 'Park']

numpy 라이브러리를 사용했을 때 순서가 뒤죽박죽 섞입니다.

 

4. pandas 라이브러리 이용하기

참고: pandas 는 데이터 조작 및 분석을 위해 Python 프로그래밍 언어로 작성된 소프트웨어 라이브러리

import pandas as pd 

names4 = ['Lim','Kim','Park','Choi','Jung','Lee','Lim','Park']
my_list4 = pd.unique(names4).tolist()

print(my_list4)

['Lim', 'Kim', 'Park', 'Choi', 'Jung', 'Lee']

pandas 라이브러를 이용하여 중복제거 할 경우 순서가 그대로 출력됩니다.

 

감사합니다 :)