[이것이 코딩 테스트다 with 파이썬] | 코딩 테스트를 위한 파이썬 문법

자료형

모든 프로그래밍은 데이터를 다루는 행위이다.

즉, 자료형에 대한 이해는 프로그래밍의 길에 있어서 첫걸음이다.

파이썬의 자료형으로 정수형, 실수형, 복소수형, 문자열, 리스트, 튜플, 사전 등이 있다. 파이썬의 자료형은 필수적으로 알아야 한다.

수 자료형

수 자료형(Number)은 가장 기본적인 자료형이다.

정수형(Integer)

정수형은 정수를 다루는 자료형이다.
- 양의 정수, 음의 정수, 0이 포함된다.
코딩 테스트에서 출제되는 많은 문제들은 정수형을 주로 다루게 된다.

# 양의 정수
a = 1000 
print(a) # 1000

# 음의 정수
a = -7 
print(a) # -7

# 0
a = 0 
print(a) # 0

# 은 주석으로 메모와 같은 것이다.

실수형(Real Number)

실수형은 소수점 아래의 데이터를 포함하는 수 자료형이다.
- 파이썬에서는 변수에 소수점을 붙인 수를 대입하면 실수형 변수로 처리된다.
- 소수부가 0이거나, 정수부가 0인 소수는 0을 생략하고 작성할 수 있다.

# 양의 실수
a = 127.93
print(a) # 127.93

# 음의 실수
a = -1754.2
print(a) # -1754.2

# 소수부가 0일 때 0 생략
a = 5.
print(a) # 5.0

# 정수부가 0일 때 0 생략
a = -.1
print(a) # -0.1

지수 표현 방식

파이썬에서는 e나 E를 이용한 지수 표현 방식을 이용할 수 있다.
- e나 E 다음에 오는 수는 10의 지수부를 의미한다.
- ex) 1e9를 입력하면 10의 9제곱(1,000,000,000)이 된다.

유효숫자e지수 = 유효숫자 x 10지수

지수 표현 방식은 임의의 큰 수를 표현하기 위해 사용된다.
지수 표현 방식은 실수형 데이터로서 처리된다. 정수형 데이터로 바꾸고자 하면 int() 처리를 하면 된다.
최단 경로 알고리즘에서는 도달할 수 없는 노드에 대하여 최단 거리를 무한(INF)로 설정한다.
- 가능한 최댓값이 10억 미만이라면 무한(INF)의 값으로 1e9를 이용할 수 있다.

# 10억의 지수 표현 방식
a = 1e9
print(a) # 1000000000.0

# 752.5
a = 75.25e1
print(a) # 752.5

# 2.954
a = 2954e-3
print(a) # 2.954

실수형 더 알아보기

오늘날 가장 널리 쓰이는 IEEE754 표준에서는 실수형을 저장하기 위해 4바이트, 혹은 8바이트라는 고정된 크기의 메모리를 할당하므로, 컴퓨터의 실수 정보를 표현하는 정확도에 한계를 가진다.
ex) 10진수 체계에서는 0.3과 0.6을 더한 값이 0.9로 정확히 떨어진다.
- 그러나 2진수에서는 0.9를 정확하게 표현하지 못한다.
- 컴퓨터는 최대한 가깝게 표현하지만 미세한 오차가 발생한다.

a = 0.3 + 0.6
print(a) # 0.8999999999999999

if a == 0.9:
    print("True")
else:
    print("False") # False

개발 과정에서 실수 값을 제대로 비교하지 못해서 원하는 결과를 얻지 못할 수 있다.
이럴 때 round() 함수를 이용할 수 있으며 해당 방법이 권장된다.
round() 함수를 호출할 때 인자(argument)를 넣는데 첫 번째 인자는 실수형 데이터이고, 두 번째 인자는 (반올림하고자 하는 위치 - 1)이다.
(두 번째 인자 없이) 인자를 하나만 넣을 때는 소수점 첫째 자리에서 반올림한다.
ex) 123.456을 소수 셋째 자리에서 반올림하려면 round(123.456, 2)라고 작성한다.
- 결과는 123.46이 된다.

보통 코딩 테스트 문제에서는 실수형 데이터를 비교할 때 소수점 다섯 번째 자리에서 반올림한 결과가 같으면 정답으로 인정하는 식으로 처리한다.

a = 0.3 + 0.6
print(round(a, 4)) # 0.9

if round(a, 4) == 0.9:
    print(True) # True
else:
    print(False)

수 자료형의 연산

수 자료형에 대하여 사칙연산과 나머지 연산자가 많이 사용된다.
단, 나누기 연산자(/)는 주의해서 사용해야 한다.
- 파이썬에서 나누기 연산자(/)는 나눠진 결과를 실수형으로 반환한다.
다양한 로직을 설계할 때 나머지 연산자(%)를 이용해야 할 때가 많다.
- ex) a가 홀수인지 체크해야 하는 경우
파이썬에서는 몫을 얻기 위해 몫 연산자(//)를 사용한다.
이외에도 거듭 제곱 연산자(**)를 비롯해 다양한 연산자들이 존재한다.

math 라이브러리를 따로 사용하지 않아도 다양한 처리가 가능하다.

a = 7
b = 3

# 나누기
print(a / b) # 2.333333333333333

# 나머지
print(a % b) # 1

# 몫
print(a // b) # 2

a = 5
b = 3

# 거듭 제곱
print(a ** b) # 125

# 제곱근
print(a ** 0.5) # 2.23606797749979

리스트 자료형

여러 개의 데이터를 연속적으로 담아 처리하기 위해 사용하는 자료형이다.
- 사용자 입장에서 C나 자바에서의 배열(Array)의 기능 및 연결 리스트와 유사한 기능을 지원한다.
- 연속적인 데이터가 메모리에 할당되어 있을 때 그 뒤에 데이터를 이어 붙일 수 있는 append() 함수를 제공하고 뒤쪽에서 데이터를 제거하는 remove() 함수도 지원한다.
- C++의 STL vector와 JAVA의 ArrayList와 기능적으로 유사하다.
- 리스트 대신에 배열 혹은 테이블이라고 부르기도 한다.

리스트 초기화

리스트는 대괄호([]) 안에 원소를 넣어 초기화하며, 쉼표(,)로 원소를 구분한다.
비어 있는 리스트를 선언하고자 할 때는 list() 혹은 간단히 [] 를 이용할 수 있다.
리스트의 원소에 접근할 때는 인덱스(Index) 값을 괄호에 넣는다.
- 인덱스는 0부터 시작한다.

# 직접 데이터를 넣어 초기화
a = [1, 2, 3, 4, 5, 6, 7, 8, 9]
print(a) # [1, 2, 3, 4, 5, 6, 7, 8, 9]

# 네 번째 원소만 출력
print(a[3]) # 4

# 빈 리스트 선언 방법 1)
a = list()
print(a) # []

# 빈 리스트 선언 방법 2)
a = []
print(a) # []

# 크기가 N이고, 모든 값이 0인 1차원 리스트 초기화
n = 10
a = [0] * n
print(a) # [0, 0, 0, 0, 0, 0, 0, 0, 0, 0]

코딩 테스트 문제에서 주로 크기가 N인 1차원 리스트를 초기화해야 한다.

리스트의 인덱싱과 슬라이싱

인덱스 값을 입력하여 리스트의 특정한 원소에 접근하는 것을 인덱싱(Indexing)이라고 한다.
- 파이썬의 인덱스 값은 양의 정수와 음의 정수를 모두 사용할 수 있다.
- 음의 정수를 넣으면 원소를 거꾸로 탐색하게 된다.
- 음의 정수를 넣을 때 -1부터 차례대로 작아지는 방식으로 원소에 접근한다.

a = [1, 2, 3, 4, 5, 6, 7, 8, 9]

# 세 번째 원소만 출력
print(a[2]) # 3

# 뒤에서 첫 번째 원소 출력
print(a[-1]) # 9

# 뒤에서 세 번째 원소 출력
print(a[-3]) # 7

# 네 번째 원소 값 변경
a[3] = 8
print(a) # [1, 2, 3, 8, 5, 6, 7, 8, 9]

리스트에서 연속적인 위치를 갖는 원소들을 가져와야 할 때는 슬라이싱(Slicing)을 이용한다.
- 대괄호 안에 콜론(:)을 넣어서 시작 인덱스와 끝 인덱스를 설정할 수 있다.
- 끝 인덱스는 실제 인덱스보다 1을 더 크게 설정한다.

a = [1, 2, 3, 4, 5, 6, 7, 8, 9]

# 네 번째 원소만 출력
print(a[3]) # 4

# 두 번째 원소부터 네 번째 원소까지
print(a[1:4]) # [2, 3, 4]

리스트 컴프리헨션

리스트를 초기화하는 방법 중 하나이다.
- 대괄호 안에 조건문과 반복문을 적용하여 리스트를 초기화할 수 있다.

# 0부터 9까지의 수를 포함하는 리스트
array = [i for i in range(10)]

print(array) # [0, 1, 2, 3, 4, 5, 6, 7, 8, 9]

리스트 컴프리헨션을 이용해서 리스트를 초기화 할 때, 대괄호를 넣은 후 반목문 먼저 넣는다.

리스트 컴프리헨션을 이용했을 때의 소스코드가 훨씬 짧고 간결한 것을 알 수 있다.

# 0부터 19까지의 수 중에서 홀수만 포함하는 리스트
array = [i for i in range(20) if i % 2 == 1]

print(array) # [1, 3, 5, 7, 9, 11, 13, 15, 17, 19]

# 1부터 9까지의 수들의 제곱 값을 포함하는 리스트
array = [i * i for i in range(1, 10)]

print(array) # [1, 4, 9, 16, 25, 36, 49, 64, 81]

리스트 컴프리헨션과 일반적인 코드 비교하기

코드 1 : 리스트 컴프리헨션

# 0부터 19까지의 수 중에서 홀수만 포함하는 리스트
array = [i for i in range(20) if i % 2 == 1]

print(array) # [1, 3, 5, 7, 9, 11, 13, 15, 17, 19]

코드 2 : 일반적인 코드

# 0부터 19까지의 수 중에서 홀수만 포함하는 리스트
array = []
for i in range(20):
    if i % 2 == 1:
        array.append(i)

print(array) # [1, 3, 5, 7, 9, 11, 13, 15, 17, 19]

리스트 컴프리헨션은 2차원 리스트를 초기화할 때 효과적으로 사용될 수 있다.
특히 N X M 크기의 2차원 리스트를 한 번에 초기화 해야 할 때 매우 유용하다.
- 좋은 예) array = [[0] * m for _ in range(n)]
만약 2차원 리스트를 초기화할 때 다음과 같이 작성하면 예기치 않은 결과가 나올 수 있다.
- 잘못된 예) array = [[0] * m] * n
- 위 코드는 전체 리스트 안에 포함된 각 리스트가 모두 같은 객체로 인식된다.

리스트 컴프리헨션 (좋은 예시)

# N X M 크기의 2차원 리스트 초기화
n = 4
m = 3
array = [[0] * m for _ in range(n)]
print(array) # [[0, 0, 0], [0, 0, 0], [0, 0, 0], [0, 0, 0]]

리스트 컴프리헨션 (잘못된 예시)

# N X M 크기의 2차원 리스트 초기화 (잘못된 방법)
n = 4
m = 3
array = [0] * m] * n
print(array) # [[0, 0, 0], [0, 0, 0], [0, 0, 0], [0, 0, 0]]

print[1][1] = 5
print(array) # [0, 5, 0], [0, 5, 0], [0, 5, 0], [0, 5, 0]]

언더바는 언제 사용하나요?

파이썬에서는 반복을 수행하되 반복을 위한 변수의 값을 무시하고자 할 때 언더바(_)를 자주 사용한다.

코드 1 : 1부터 9까지의 자연수를 더하기

summary = 0
for i in range(1, 10):
    summary += i

print(summary) # 45

코드 2 : "Hello World"를 5번 출력하기

for _ in range(5):
    print("Hello World")

리스트 관련 기타 메서드

a = [1, 4, 3]
print("기본 리스트 : ", a) # 기본 리스트 : [1, 4, 3]

# 리스트에 원소 삽입
a.append(2)
print("삽입 : ", a) # 삽입 : [1, 4, 3, 2]

# 오름차순 정렬
a.sort()
print("오름차순 정렬 : ", a) # [1, 2, 3, 4]

# 내림차순 정렬
a.sort(reverse = True)
print("내림차순 정렬 : ", a) # [4, 3, 2, 1]

a = [4, 3, 2, 1]

# 리스트 원소 뒤집기
a.reverse()
print("원소 뒤집기: ", a) # 원소 뒤집기: [1, 2, 3, 4]

# 특정 인덱스에 데이터 추가
a.insert(2, 3)
print("인덱스 2에 3 추가: ", a) # 인덱스 2에 3 추가: [1, 2, 3, 3, 4]

# 특정 값인 데이터 개수 세기
print("값이 3인 데이터 개수: ", a.count(3)) # 값이 3인 데이터 개수: 2

# 특정 값 데이터 삭제
a.remove(1)
print("값이 1인 데이터 삭제: ", a) # 값이 1인 데이터 삭제: [2, 3, 3, 4]

리스트에서 특정 값을 가지는 원소를 모두 제거하기

a = [1, 2, 3, 4, 5, 5, 5]
remove_set = {3, 5} # 집합 자료형

# remove_list에 포함되지 않은 값만을 저장
result = [i for i in a if not in remove_set]
print(result) # [1, 2, 4]

문자열 자료형

문자열 변수를 초기화할 때는 큰 따옴표(")나 작은 따옴표(')를 이용한다.
문자열 안에 큰 따옴표나 작은 따옴표가 포함되어야 하는 경우가 있다.
- 전체 문자열을 큰 따옴표로 구성하는 경우, 내부적으로 작은 따옴표를 포함할 수 있다.
- 전체 문자열을 작은 따옴표로 구성하는 경우, 내부적으로 큰 따옴표를 포함할 수 있다.
- 혹은 백슬래시(\)를 사용하면, 큰 따옴표나 작은 따옴표를 원하는 만큼 포함시킬 수 있다.

data = 'Hello World'
print(data) # Hello World

data = "Don't you know \"Python\"?"
print(data) # Don't you know "Python"?

문자열 연산

문자열 변수에 덧셈(+)을 이용하면 문자열이 더해져서 연결(Concatenate)된다.
문자열 변수를 특정한 양의 정수와 곱하는 경우, 문자열이 그 값만큼 여러 번 더해진다.
문자열에 대해서도 마찬가지로 인덱싱과 슬라이싱을 이용할 수 있다.
- 다만 문자열은 특정 인덱스의 값을 변경할 수 없다. (Immutable)

a = "Hello"
b = "World"
print(a + " " + b) # Hello World

a = "String"
print(a * 3) # StringStringString

a = "ABCDEF"
print(a[2:4]) # # CD

튜플 자료형

튜플 자료형은 리스트와 유사하지만 다음과 같은 문법적 차이가 있다.
- 튜플은 한 번 선언된 값을 변경할 수 없다.
- 리스트는 대괄호([])를 이용하지만, 튜플은 소괄호(())를 이용한다.
튜플은 리스트에 비해 상대적으로 공간 효율적이다.

튜플 사용 예제

a = (1, 2, 3, 4, 5, 6, 7, 8, 9)

# 네 번째 원소만 출력
print(a[3]) # 4

# 두 번째 원소부터 네 번째 원소까지
print(a[1:4]) # (2, 3, 4)

튜플 사용 예제 (오류가 발생하는 예제)

a = (1, 2, 3, 4)
print(a)

a[2] = 7
# TypeError: 'tuple' object does not support item assignment

튜플을 사용하면 좋은 경우

서로 다른 성질의 데이터를 묶어서 관리해야 할 때
- 최단 경로 알고리즘에서는 (비용, 노드 번호)의 형태로 튜플 자료형을 자주 사용한다.
데이터의 나열을 해싱(Hashing)의 키 값으로 사용해야 할 때
- 튜플은 변경이 불가능하므로 리스트와 다르게 키 값으로 사용될 수 있다.
리스트보다 메모리를 효율적으로 사용해야 할 때

사전 자료형

사전 자료형은 키(Key)와 값(Value)의 쌍을 데이터로 가지는 자료형이다.
- 앞서 다루었던 리스트나 튜플이 값을 순차적으로 저장하는 것과는 대비된다.
사전 자료형은 키와 값의 쌍을 데이터로 가지며, 원하는 '변경 불가능한(Immutable) 자료형'을 키로 사용할 수 있다.
파이썬의 사전 자료형은 해시 테이블(Hash Table)을 이용하므로 데이터의 조회 및 수정에 있어서 O(1)의 시간에 처리할 수 있다.

data = dict() # 초기화
data['사과'] = 'Apple'
data['바나나'] = 'Banana'
data['코코넛'] = 'Coconut'

print(data)
# {'사과': 'Apple', '바나나': 'Banana', '코코넛': 'Coconut'}

if '사과' in data:
    print("'사과'를 키로 가지는 데이터가 존재합니다.")
    # '사과'를 키로 가지는 데이터가 존재합니다.

사전 자료형 관련 메서드

사전 자료형에서는 키와 값을 별도로 뽑아내기 위한 메서드를 지원한다.
- 키 데이터만 뽑아서 리스트로 이용할 때는 keys() 함수를 이용한다.
- 값 데이터만 뽑아서 리스트로 이용할 때는 values() 함수를 이용한다.

사전 자료형 관련 함수

data = dict()
data['사과'] = 'Apple'
data['바나나'] = 'Banana'
data['코코넛'] = 'Coconut'

# 키 데이터만 담은 리스트
key_list = data.keys()
# 값 데이터만 담은 리스트
value_list = data.values()
print(key_list) # dict_keys(['사과', '바나나', '코코넛'])
print(value_list) # dict_values(['Apple', 'Banana', 'Coconut'])

# 특정 키에 맵핑된 값만 출력
print(data['사과']) # 'Apple'

# 각 키에 따른 값을 하나씩 출력
for key in key_list:
    print(data[key])
    # Apple
    # Banana
    # Coconut

집합 자료형

집합은 다음과 같은 특징이 있다.
- 중복을 허용하지 않는다.
- 순서가 없다.
집합은 리스트 혹은 문자열을 이용해서 초기화할 수 있다.
- 이때 set() 함수를 이용한다.
혹은 중괄호({})안에 각 원소를 콤마(,)를 기준으로 구분하여 삽입함으로써 초기화할 수 있다.
데이터의 조회 및 수정에 있어서 O(1)의 시간에 처리할 수 있다.

# 집합 자료형 초기화 방법 1
data = set([1, 1, 2, 3, 4, 4, 5])
print(data) # {1, 2, 3, 4, 5}

# 집합 자료형 초기화 방법 2
data = {1, 1, 2, 3, 4, 4, 5}
print(data) # {1, 2, 3, 4, 5}

집합 자료형의 연산

기본적인 집합 연산으로는 합집합, 교집합, 차집합 연산 등이 있다.
- 합집합 : 집합 A에 속하거나 B에 속하는 원소로 이루어진 집합 (A ∪ B)
- 교집합 : 집합 A에도 속하고 B에도 속하는 원소로 이루어진 집합 (A ∩ B)
- 차집합 : 집합 A의 원소 중에서 B에 속하지 않는 원소들로 이루어진 집합 (A - B)

a = set([1, 2, 3, 4, 5])
b = set([3, 4, 5, 6, 7])

# 합집합
print(a | b) # {1, 2, 3, 4, 5, 6, 7}

# 교집합
print(a & b) # {3, 4, 5}

# 차집합
print(a - b) # {1, 2}

집합 자료형 관련 함수

data = set([1, 2, 3])
print(data) # {1, 2, 3}

# 새로운 원소 추가
data.add(4)
print(data) # {1, 2, 3, 4}

# 새로운 원소 여러 개 추가
data.update([5, 6])
print(data) # {1, 2, 3, 4, 5, 6}

# 특정한 값을 갖는 원소 삭제
data.remove(3)
print(data) # {1, 2, 4, 5, 6}

사전 자료형과 집합 자료형의 특징

리스트나 튜플은 순서가 있기 때문에 인덱싱을 통해 자료형의 값을 얻을 수 있다.
사전 자료형과 집합 자료형은 순서가 없기 때문에 인덱싱으로 값을 얻을 수 없다.
- 사전의 키(Key) 혹은 집합의 원소(Element)를 이용해 O(1)의 시간 복잡도로 조회한다.

'이것이 취업을 위한 코딩 테스트다 with 파이썬'의 교재를 보고 작성한 내용입니다.

'Study > Python' 카테고리의 다른 글

[이것이 코딩 테스트다 with 파이썬] \| 코딩 테스트를 위한 파이썬 문법 \| 조건문 (0)	2025.05.22
[이것이 코딩 테스트다 with 파이썬] \| 코딩 테스트를 위한 파이썬 문법 \| 입출력 (0)	2025.05.22
[이것이 코딩 테스트다 with 파이썬] \| 코딩 테스트를 위한 파이썬 문법 \| 알고리즘 성능 평가 (0)	2025.05.20
[Jump-to-Python] 파이썬의 입출력 (0)	2025.01.01
[Jump-to-Python] 제어문 (1)	2024.12.23

[이것이 코딩 테스트다 with 파이썬] | 코딩 테스트를 위한 파이썬 문법 | 자료형

자료형

수 자료형

정수형(Integer)

실수형(Real Number)

지수 표현 방식

실수형 더 알아보기

수 자료형의 연산

리스트 자료형

리스트 초기화

리스트의 인덱싱과 슬라이싱

리스트 컴프리헨션

리스트 컴프리헨션과 일반적인 코드 비교하기

언더바는 언제 사용하나요?

리스트 관련 기타 메서드

리스트에서 특정 값을 가지는 원소를 모두 제거하기

문자열 자료형

문자열 연산

튜플 자료형

튜플 사용 예제

튜플 사용 예제 (오류가 발생하는 예제)

튜플을 사용하면 좋은 경우

사전 자료형

사전 자료형 관련 메서드

사전 자료형 관련 함수

집합 자료형

집합 자료형의 연산

집합 자료형 관련 함수

사전 자료형과 집합 자료형의 특징

'Study > Python' 카테고리의 다른 글

티스토리툴바