Programming/Python

[코딩도장-파이썬] 시퀀스(Sequence) 자료형 활용하기 2

Supreme_YS 2020. 11. 11. 16:31

._시퀀스 객체에는 앞서 말했듯이 여러가지 요소가 여러개 들어있다. 따라서. 이 요소의 갯수(길이)를 구할 때는 len 함수를 사용한다. (length --> len)

형태 : len(시퀀스객체)

예.

a = list(range(0, 100, 10))
len(a)

요소 갯수 구하기 출처. 코딩도장

._range에 len 함수를 사용하면 숫자가 생성되는 개수를 구한다.

예. len(range(0, 10, 2)) 

결과값 : 5 

 

._문자열의 길이 구하기

문자열도 시퀀스 자료형이기 때문에 len 함수를 이용하면 문자열의 길이를 구할 수 있다.

예.

hello = 'hello, python'

len(hello)

결과값 : 13

 

hello, world!의 길이. 공백을 포함한다. 출처. 코딩도장

여기서 문자열의 길이는 공백까지 포함한다. 단, 문자열을 묶은 따옴표는 제외. 이 따옴표는 문자열을 표현하는 문법일 뿐 문자열 길이에는 포함되지 않는다.(문자열 안에 포함된 작은따옴표, 큰따옴표는 포함됨). 물론 한글 문자열도 아래와 같이 표현이 가능하다.

 

예.

hello2 = '안녕하세요'
len(hello)

결과값 : 5

 

._UTF-8 문자열의 바이트 수 구하기

한글, 한자, 일본어 등은 UTF-8 인코딩으로 저장하는데 문자열이 차지하는 실제 바이트 수를 구하는 방법은 다음과 같다.

한글 글자 하나는 3바이트로 표현하기 때문에 '안녕하세요'가 차지하는 실제 바이트 수는 15바이트다.

예.

hello = '안녕하세요'

len(hello.encode('utf-8'))

결과값.

15