AI 개발

[Python] list, tuple, dictionary, iterator(map, filter)

minkyung 2020. 9. 6. 00:44

 

알고리즘 문제를 푸는데 자꾸 헷갈리는 파이썬 개념과 메소드들을 정리하려고 한다.

 

파이썬 자료형 종류와 차이점 - 리스트, 튜플, 딕셔너리

 

  • 리스트
a = [1,2,3,4]
b = [1,2,[a,b]]

변수를 여러개 저장할 수 있는 자료구조 중 대표적인 것. 반복문을 통해 데이터 관리가 가능하고 다양한 모양으로 생성할 수 있다. 정수와 문자를 섞어 넣는다던지, 리스트 안에 리스트를 넣는다던지

 

  • 튜플
a = (1,2,3)
b = (1,)
c = 1,2,3
d = ('a','b',('c','d'))

리스트와 거의 유사하나 차이점은

1개의 요소만을 가질 때 반드시 , 붙여주어야 하고 괄호 생략해도 무방하다는 점 또, 요소의 값을 변경하거나 지울 수 없다. 대신 리스트보다 빠르다. 수정할 필요가 없는 리스트는 튜플로 작성해도 괜찮지만 리스트나 딕셔너리보다 잘 사용하지 않는 것 같다.

 

  • 딕셔너리
a = {'a': 1, 'b': 2}
b = {'a':[1,2,3], 'b':[4]}
a[a] # 1
b[a] # [1,2,3]

키-쌍 값으로 이루어진 자료구조. 키를 가지고 바로 값을 찾을 수 있어 리스트의 요소의 개수가 많을 때 탐색이 필요하다면 리스트보다 딕셔너리가 훨씬 빠를 수 있다. 대신 인덱스로 접근 할 수 없고 키 값으로만 접근 가능.

 

 


 

 

1. 리스트 사용하기

 

- 리스트 조작 메서드 : append, extend, insert

 

a = [1,2,3,6]
a.append(4) # [1,2,3,6,4]

append는 리스트 끝에 요소 하나를 추가

 

a = [1,2,3,4]
a.append([100,200]) # [1,2,3,4,[100,200]]
len(a) # 5

리스트를 append하면 리스트 안에 리스트가 들어가 중첩리스트가 만들어진다. 추가한 1개의 리스트가 1개의 요소이기 때문에 길이는 4+1인 5이다.

 

a = [1,2,3,4]
a.extend([100,200]) # [1,2,3,4,100,200]
len(a) # 6

요소를 여러개 추가 하고 싶으면 extend를 사용한다. 리스트끼리 연결을 하는 것이다.

 

a = [1,2,3,4]
a.insert(2, 100) # [1,2,100,3,4]

insert(인덱스, 요소)  파라미터로 준 인덱스 자리에 요소를 추가하고 뒤로 민다.

 


 

- 리스트 삭제 메서드 : pop, del, remove

 

a = [1,2,3,4]
a.pop() # [1,2,3]
n = a.pop(0) 
print(a) # [2,3]
print(n) # 1

pop()은 파라미터를 지정해주지 않으면 맨 뒤의 요소를 삭제하고 파라미터로 인덱스를 지정해주면 해당 인덱스 요소가 삭제되고 pop한 값을 변수에 넣어 줄 수 있다. DFS, BFS 문제에서 많이 사용한다.

 

a = [1,2,3,4]
del a[1] # [1,3,4]

del과 pop은 비슷하게 동작하나, 지운 리스트 내 요소 값을 따로 사용할 때는 pop()을 사용한다.

 

a = [10,20,30,40,20]
a.remove(20) # [10,30,40,20]

인덱스 말고 원하는 값을 삭제하고 싶을 때는 remove를 사용합니다. 만약 그 값이 여러개라면 처음 값만 삭제함.

 

 

 

※ 참고 deque(덱) 객체

from collections import deque

q = deque([[1,[1]]])
print(q)
q.append([2,[1,2]])
print(q)

qq = deque([1])
print(qq)
qq.append(1)
print(qq)

deque([[1, [1]]])
deque([[1, [1]], [2, [1, 2]]])
deque([1])
deque([1, 1])

리스트로 스택과 큐 만들기는 이전 포스팅 참고

 

 


- 리스트 슬라이싱[:]

 

a = [1,2,3,4,5,6,7]
print(a[:3]) # [1,2,3]
print(a[2:]) # [3,4,5,6,7]
print(a[3:5] # [4,5]
print(a[-1]) # 7

리스트명[시작인덱스:끝인덱스] 로 지정해 슬라이싱을 할 수 있고 이렇게 지정하게 되면 (시작인덱스)~(끝인덱스-1)한 값까지 출력됩니다. 인덱스가 -1이란 것은 리스트의 가장 끝 값을 말합니다.

 

 


 

- 기타 메소드

.index(값) : 리스트 안의 값에 해당하는 인덱스를 구한다.

.count(값) : 리스트 안의 값에 해당하는 개수를 구한다.

.reverse() : 리스트 요소의 순서를 반대로 뒤집는다.

.sort() : 리스트의 요소를 정렬, 내림차순으로 정렬하려면 .sort(reverse=True)

.sorted() : sort()와 동일하나 기존의 리스트는 그대로 두고 새 리스트에 정렬한 리스트를 반환

.clear(): del a[:]와 같고 리스트의 모든 요소를 삭제한다.

if not 리스트, if 리스트 : 리스트가 비어있는지 조건 확인할 때.

 


- 2차원 리스트 초기화

# 2*5리스트 만들기 2행 5열
lis = [[0]*5 for _ in range(2)]
print(lis)
# [[0,0,0,0,0],[0,0,0,0,0]]

liss = [[i for i in range(3)] for _ in range(3)]
print(liss)
# [[0,1,2],[0,1,2],[0,1,2]]

lisss = [[0] * i for i in [3, 1, 3, 2, 5]]
print(lisss)
# [[0, 0, 0], [0], [0, 0, 0], [0, 0], [0, 0, 0, 0, 0]]

 

- 2차원 리스트 출력

lis = [[i,i+1] for i in range(3)]
print(lis)
# [[0, 1], [1, 2], [2, 3]]
for x, y in lis:
	print(x,y)
# 0 1
# 1 2
# 2 3

- 리스트 중복 제거

lis = [1,1,2,3,3,4,4]
lis = list(set(lis)) # [1,2,3,4]

set으로 변환 후 다시 리스트로 변환 하면 되는데, 순서가 뒤죽박죽 된다는 단점이 있다.

 

순서를 지켜주려면 for 문을 이용해야 한다.

lis = [1,1,2,3,3,4,4]
new_lis = []
for li in lis:
    if li not in new_lis:
        new_lis.append(li)
print(new_lis)

 


2. 딕셔너리 사용하기

 

- 딕셔너리 조작 메서드 : setdefault, update, pop

 

d = {'a': 'aa', 'b': 'bb'}
print(d[a])
# aa

dd = {i:[i+1,i+2] for i in range(3)
print(d)
# {0:[1,2], 1:[2,3], 2:[3,4]}

이런 식으로 값을 직접 넣어 딕셔너리를 초기화 할 수도 있지만, (딕셔너리는 append X)

 

x = {'a': 10, 'b': 20, 'c': 30, 'd': 40}
x.setdefault('e')
print(x)
# {'a': 10, 'b': 20, 'c': 30, 'd': 40, 'e': None}

x.setdefault('f',100)
print(x)
# {'a': 10, 'b': 20, 'c': 30, 'd': 40, 'e': None, 'f':100}

setdefault메소드를 이용할 수도 있습니다. 파미터에 키, 값 순서대로 넣어주면 되는데 만약 값을 지정해주지 않으면 키만 저장하고 값에 None을 저장합니다.

 

x = {'a': 10, 'b': 20, 'c': 30, 'd': 40}
x.update(a=100, d=400)
print(x)
# {'a': 100, 'b': 20, 'c': 30, 'd': 400}

y = {1: 10, 2: 20, 3: 30, 4: 40}
y.update({1:100, 3:300})
print(y)
# {1: 100, 2: 20, 3: 300, 4: 40}

y.update([[2,200], [4,400])
# # {1: 100, 2: 200, 3: 300, 4: 400}

.update는 값을 수정하고 싶을 때 사용하고 키=값을 파라미터로 넣어주면됩니다. 대신 이는 키 값이 문자열일 때만 가능하며 키가 숫자일 때는 update(딕셔너리)를 사용합니다. 또는 [[]]를 이용해 [[키1,값1],...]형식으로 update할 수도 있습니다.

 

setdefault와 update의 차이점은 setdefault는 이미 들어간 키 값의 수정이 불가능 하지만 update는 가능합니다.

 

x = {'a': 10, 'b': 20, 'c': 30, 'd': 40}
del x['a']
x.pop('b')
print(x)
# {'c': 30, 'd': 40}

pop과 del은 리스트에서의 사용법과 동일하고, .clear(모든요소삭제)도 동일합니다.

 

 

 

- 그 외 메서드

 x = {'a': 10, 'b': 20, 'c': 30, 'd': 40}
 
 # 키 값 가져오기
 print(x.get('a')) # 10
 
 # 키 값 모두 가져오기
 print(x.items()) # dict_items([('a', 10), ('b', 20), ('c', 30), ('d', 40)])
 
 # 키 값 모두
 print(x.keys())
 
 # value 값 모두
 print(x.values())

 

 


 

 

3. iteroator를 결과값으로 리턴해주는 내장함수

 

 

- map : 반복가능한(iterable) 객체를 받아 각 요소에 함수를 적용해주는 함수이다.

 

map(적용시킬 함수, 적용시킬 요소)

 

def add(n):
	return n+1

a = ['1','2','3','4']
result = map(int, a)
result2 = map(add, a)

print(result) # [1,2,3,4]
print(result2) # [2,3,4,5]

 


 

- filter : 특정 조건으로 걸러서 걸러진 요소들로 iterator 객체를 만들어 리턴

 

filter(적용시킬 함수, 적용시킬 요소)

 

target = [1, 2, 3, 4, 5, 6, 7, 8, 9, 10]
result = []

def is_even(n):
      return True if n % 2 == 0 else False

for value in target:
     if is_even(value):
        result.append(value)

print(result)  # [2, 4, 6, 8, 10]

 


 

4. 리스트에 map 사용하기

 

a = [1.2, 2.5, 3.7, 4.6]

# map 객체 생성
a = map(int, a)
print(a) # <map object at 0x000001A65414B3A0> 

b = list(map(int, a))
print(b) # [1,2,3,4]

c = input().split()
# 10 20 (입력)
print(c) # ['10', '20']

d = map(int, input().split())
# 10 20 (입력)
print(d) # <map object at 0x03DFB0D0>
print(list(d)) # [10, 20]

a, b = [10, 20]
print(a, b) # 10 20

c, d = map(int, input().split())
# 10 20 (입력)
print(c, d) # 10 20

d = map(int, input().split()) 로 여러개의 값을 띄어쓰기로 입력 받으면(예를 들어 1 2 3 을 입력했다고 하면) 1 2 3이 들어있는 맵 객체가 d에 들어가고 그대로 출력하게되면 d에 있는 맵 객체의 주소가 출력되고 안의 값을 볼 수 없습니다.

 

하지만 맵 객체는 iterator 이기 때문에 unpacking(언패킹)이 가능합니다. a,b = [1,2] 로 지정하면 a=1, b=2가 되는 것 처럼 안의 요소들을 각각의 변수로 저장하는 것을 언패킹이라고 합니다.

 

따라서 a, b = map(int, input().split())으로 지정하면 맵 객체가 반환되는 것이 아니라 각각 언패킹 된 개별의 값이 a와 b에 저장됩니다.

 

 

 


5. 파이썬으로 입력받기 sys.stdin

 

알고리즘 문제를 풀다보면 입력 값을 input().split()으로 많이 받게 되는데,

그냥 input()과, raw_input()은 파이썬의 sys.stdin으로 입력받는 방법보다 느리다.

 

a = sys.stdin
# ^Z를 입력. 받을 때까지 입력을 받는다. stdin 오브젝트로 반환

a = sys.stdin.readline()
# 한 줄 입력. 가장 많이 사용. \n(개행문자)이 붙는다.

a = sys.stdin.readline().strip()
# \n(개행문자) 자동 삭제

a,b = sys.stdin.readline().split()
# 알고리즘 문제 풀 때 많이 사용하는 방법 띄어쓰기 기준으로 나눔

 

 

 

다음 포스팅에서는 문자열을 다루는 방법(strip, replace...등)에 대해서 다룰 예정이다.